Geni gedcom probleem

Started by Rita Bergman-Smit on Saturday, September 14, 2013
Problem with this page?

Participants:

Related Projects:

Showing 1-30 of 70 posts

Ik heb een forest gedcom van Geni gedownload en merk nu dat alle geboorte-, doop-, huwelijks-, overlijdens- en begraaf-plaats gegevens niet op de juiste plaats zijn opgenomen, maar in de notities zijn vermeld. Dat is bij 5.000 profielen een heidens karwei omdat de corrigeren. Is daar een truc voor?

Ook een probleem dat ik tegenkom is dat te pas en te onpas de voornamen, nicknames en alternatieve achternamen herhaald worden in het vak bijnaam, waardoor bij uploaden naar andere sites de hoofdnaam vervangen wordt door de bijnaam, althans op WeRelate, Geneanet en FamilySearch

en Geni gaat daar helemaal niets aan doen is mijn vermoeden...

even uitleggen, mevrouw SMIT, betekent dat dat we ons best moeten gaan doen vooral HERHALINGEN van namen te wissen in profielen die we tegenkomen. Dat zal ik dan onthouden, want ik vind het ook vervelend als iets al duidelijk genoemd is en dan nog een keer in een profiel staat. M.i. moeten we streven naar zo compact mogelijke, maar wel duidelijke, volledige en informatieve gegevens in de Nederlandse profielen, want dan wordt het ook voor nieuwelingen veel leuker om te herkennen dat het om familieleden kan gaan. groet, Jeannette.

Er is geen consequentie in de afwijkingen, sommige profielen hebben het, anderen niet, soms vind je stukken gedcom in de omschrijving, soms ook weer niet. Het lijkt wel een beetje chaotisch alsof er verschillende systemen door elkaar werken. Job zou het waarschijnlijk wel kunnen uitleggen, maar ik zie hem momenteel niet vaak online

Is gewoon te gek, natuurlijk. Ik zit 26 jaar in het IT vak, en standaarden lijken me altijd belangrijk. De GEDCOM standaard is héél eenvoudig. Ik snap dus niet wat daar fout kan lopen. Ikzelf heb enkele keren een GEDCOM uit Geni ergens anders ingebracht, zonder problemen. Maar, da's geen bewijs.
Maria, heb je op je PC een versie van PAF (Personal Ancestry File), en heb je het daar geprobeerd? Ik heb zelf lang geleden een Geni Gedcom overgebracht op Geneanet, zonder problemen. Opnieuw, dat wil niks zeggen. Maar, ik stel voor dat je effen in PAF probeert, op je PC. Het probleem zou ook bij Geneanet of WeRelate, natuurlijk.
Lokaal op eigen PC proberen lijkt me de beste test!

En, als dat niet lukt, dan moeten we het aankaarten bij Geni, want anders heeft die Gedcom export totaal geen zin!

DIT IS ZO'N VOORBEELD, NIET OP DE JUISTE PLAATS, MAAR IN DE OMSCHRIJVING/NOTITIES:


geboorte adres:
Benthuizen
Zuid-Holland
Nederland
{geni:county} Rijnwoude


overlijden adres:
Amersfoort
Utrecht
Nederland
{geni:county} Amersfoort

Wat ook opvallend is, dat de omschrijving/referentie die ik toegevoegd had, soms wel en soms niet (bij de bronnen) vermeld werden

HIER EEN STUKJE EDCOM WAT OPEENS IN OMSCHRIJVING/NOTITIES STAAT:

-- GEDCOM (INDI) --
1 SUBM @I6000000002337808555@
</pre>

Mmm, ik zit op WikiTree, en daar staat ook alles bij de notities. Maar daar gaf-geef ik mn eigen onkunde de schuld van. Ik had nog nooit ook maar iets met een gedcom gedaan. Was wel fijn geweest natuurlijk als de data er in een keer goed bij stonden. Ik ben het nu handmatig aan het toevoegen, als ik er zin in heb.
En wat PAF is, was mij totaal niet bekend :-). Lees ik nu ook pas :-)

Het zou overigens fijn zijn als er een beschrijving voor dummies is inzake gedcom's en alles wat daarbij komt kijken.. Ik weet dat een aantal van jullie er verstand van hebben en het vast wel willen uitleggen met jullie IT kennis, maar als je er geen verstand van heb, is het nog lastig (amper) te begrijpen.

Het lastige van de gedcom standaard is dat er verschillende versies van bestaan en dat de oudere versies geen goede definitie geven voor gegevens die in veel genealogie programma's voorkomen. De betreffende programma's hebben daarom vaak zelf een manier verzonnen om die gegevens in de gedcom vast te kunnen leggen. Dat gaat dan binnen zo programma wel goed, maar niet tussen 2 programma's die een verschillende oplossing verzonnen hebben voor hetzelfde probleem.
Een voorbeeld zijn bijvoorbeeld de voorvoegsels bij een achternaam die we in Nederland kennen en daar met kleine letters schrijven en ook anders behandelen in de sortering. Daar zie je zelfs al een verschil met België.
Andere voorbeelden zijn bijnamen en roepnamen en die worden vaak ook niet goed uitgewisseld tussen verschillende programma's. Ook andere relatie vormen dan huwelijk en bijvoorbeeld stiefkinderen, adoptie e.d. leveren vaak ook problemen op.
Er bestaan wel programma's om om een gedcom te converteren tussen 'dialecten'. Maar het is vaak toch behoorlijk lastig om een goed conversie programma te vinden.
Het is soms gemakkelijker om in het doelprogramma wat gegevens in te voeren en dan vanuit dat programma een gedcom export te doen en deze export te vergelijken met de export uit geni (gedcom bestanden kan je gewoon met wordpad of andere tekstverwerker openen) en dan te kijken wat er aangepast moet worden.
Als iemand een goede beschrijving heeft van het gedcom formaat van Geni en van de doelsystemen, kan ik wel eens kijken of er wat te maken is (maar dat zal wel de nodige tijd kosten).

Voor diegenen die er wat meer van willen weten:
http://nl.wikipedia.org/wiki/Gedcom (uitleg in het Nederlands)
http://en.wikipedia.org/wiki/GEDCOM (uitleg in het Engels)

de beschrijving van de standaard versie 5.5 (die nog niet zo veel gebruikt wordt, veel programma's gebruiken een oudere versie): http://homepages.rootsweb.ancestry.com/~pmcbride/gedcom/55gctoc.htm

Maar zelfs deze versie heeft mogelijkheden die problemen kan opleveren. Kijk bijvoorbeeld eens bij http://homepages.rootsweb.ancestry.com/~pmcbride/gedcom/55gcch2.htm#S3 en blader dan naar de definitie van NAME_PERSONAL en de diverse name_piece definities

Hier zie je dan nog een ander probleem: Hoe heeft de gebruiker in het bronsysteem de velden ingevuld en komen de definities van de velden in het bron systeem wel overeen met de definitie van de velden in de gedcom standaard.

Vaak komt de definitie van velden in een bronsysteem niet precies overeen met de die in de standaard of geeft de standaard nog veel vrijheid (zie bijvoorbeeld de definitie van een gebeurtenis (EVENT) . Een programma kent vaak andere gebeurtenissen dan die zijn opgesomd bij EVENT_TYPE_INDIVIDUAL en verzint dan zelf een nieuw type. Als het programma waarin de gegevens moeten worden geïmporteerd dat type niet kent, dan worden de betreffende gegevens vaak in een NOTE opgenomen.

Ik vond deze (wat oude) informatie over de Geni gedcom:
http://wiki.geni.com/index.php/GEDCOM_Export
http://wiki.geni.com/index.php/GEDCOM

Een voorbeeld van het begin van een geni GEDCOM:
0 HEAD
1 SOUR Geni.com
2 VERS 1.0
1 DATE 29 APR 2013
2 TIME 21:41:32
1 SUBM @S0@
1 GEDC
2 VERS 5.5
2 FORM LINEAGE-LINKED
1 CHAR UTF-8

De eerste positie geeft een niveau aan, waarbij 0 het laagste niveau is
Niveau 0 zou je kunnen zien als een hoofdstuk, niveau 1 is dan een paragraaf binnen het hoofdstuk, niveau 2 een sub paragraaf.

Geni gebruikt spaties voor de niveau indicator en dat is niet conform de standaard en dat kan bij de import in sommige programma's een probleem opleveren.
Er wordt ook aangegeven dat de export in UTF-8 is en ook dat kan een probleem opleveren omdat dat niet altijd waar is.

het HEAD gedeelte geeft wat algemene informatie over de GEDCOM (bijvoorbeeld welk type en versie gedcom er gebruikt wordt en wanneer de export is gedaan)
daarna volgt een aantal regels die met een 0 begint en eindigt met INDI
0 @I6000000012557914819@ INDI
1 NAME Job /Waterreus/
2 GIVN Job
2 SURN Waterreus
1 SEX M
1 BIRT
1 RESI
2 ADDR
3 CTRY Nederland
...

Bij een persoon wordt opgegeven in welke familie die persoon een kind is:
1 FAMC @F6000000012557695006@
(FAMC: in welke familie is dit een kind)
Als de persoon zelf ook weer kinderen heeft dan wordt wordt dat ook bij de persoon aangegeven:
1 FAMS @F6000000012557695006@
(FAMS: in welke familie is dit een vader of moeder)

Na alle persoonsgegevens volgen dan de familie gegevens:
0 @F6000000012557695006@ FAM
1 MARR
2 DATE 16 SEP 1947
2 ADDR
3 CITY Leiden
3 STAE Zuid-Holland
3 CTRY The Netherlands
3 NOTE {geni:county} Leiden
1 HUSB @I6000000012557695002@
1 WIFE @I6000000012620502177@
1 CHIL @I6000000012685885224@
1 CHIL @I6000000012557914819@

Hier is ook een voorbeeld te zien van de vrijheid die de standaard geeft.
Binnen Geni kent het adres ook een county en dat is niet beschikbaar in de gedcom standaard als apart veld, het wordt hier dus naar een NOTE (opmerking) veld weggeschreven.

GEDCOM files zijn groot en daarom lastig te bewerken, ik gebruik daar PilotEdit (http://www.pilotedit.com/) of Notepad++ (http://notepad-plus-plus.org/) voor.

Mmm ik was in de naieve veronderstelling dat met het uploaden van mn gedcom (naar wikitree in dit geval) hups alle profielen zo aan mn stamboom toegevoegd zouden worden.. het was toch wel ff anders... moest allerlei handelingen verrichten om het toe te voegen uit mn zgn "watchlist"". Dus of mn veronderstelling was idd heel erg naief (zeg maar redelijk stupide) of... het had wel anders/beter gekund?

Omdat de gedcom standaard nogal wat vrijheid lat en ook mogelijkheden om de vulling van een veld op verschillende manieren te interpreteren zijn de meeste programma's wat voorzichtiger geworden bij het inlezen van een gedcom.

Een lege stamboom vullen met een gedcom kan nog redelijk gemakkelijk, maar gegevens toevoegen m.b.v. van een gedcom kent het probleem dat er eigenlijk herkent moet worden of er geen poging wordt gedaan om een al bekende persoon opnieuw toe te voegen. Dit is nog redelijk goed te doen als er 2x exact dezelfde gegevens worden ingelezen, maar als de aanvullende gegevens uit een andere bron komen wordt het heel veel lastiger. Je krijgt dan bijvoorbeeld te maken met verschillen in spelling en mogelijk ook met andere afwijkingen (bijvoorbeeld een verschil in datums of ouders). Het wordt dan vergelijkbaar met een smart match in Geni en de gebruiker zal per persoon en per veld moeten aangeven wat er moet gebeuren.

Er zijn ook programma's die er niet op controleren en dan moet de gebruiker na afloop van de import alle problemen proberen te herstellen en dat is vaak ondoenlijk.

Als er bij de import geen controle gedaan wordt, dan is de beste optie om eerst een export te doen van de bestaande gegevens en te controleren of deze export in een nieuwe stamboom weer goed wordt ingelezen. Als dat niet zo is dan zou ik afraden om gegevens aan een bestaande database toe te voegen m.b.v. een gedcom.

Er zijn wel programma's die 2 gedcoms kunnen samenvoegen en daarbij net zoals Geni kunnen constateren dat er mogelijk overeenkomstige personen in beide stambomen voorkomen en die dan mogelijkheden bieden om conflicten op te lossen.

Door het resultaat van die samenvoeging in een nieuwe stamboom in te lezen worden dan problemen met dubbele gegevens voorkomen.

Het blijft toch lastig omdat samenvoegen van 2 gedcoms uit verschillende bron ook niet zomaar gaat. Vaak zal minstens 1 gedcom eerst omgezet moeten worden in een ander dialect.

Nog wat uitleg over de velden in een gedcom: http://genealogy.about.com/library/weekly/aa110100d.htm

Hier kan je ook weer goed zien dat er verschillende mogelijkheden zijn om dezelfde gegevens in een gedcom op te slaan. Er is een tag ALIA {ALIAS}, "An indicator to link different record descriptions of a person who may be the same person."
maar er is ook een mogelijkheid NAME {NAME} "A word or combination of words used to help identify an individual, title, or other item. More than one NAME line should be used for people who were known by multiple names."
Hier wordt bijvoorbeeld niet aangegeven in welke volgorde je dan de NAME velden zou moeten vullen (bijvoorbeeld eerst in de eigen taal en vervolgens in het Engels).
De Nederlandse roepnaam levert ook een probleem op. Er zijn programma's die dat in het NAME veld zetten, maar er zijn er ook die daarvoor NICK {NICKNAME} "A descriptive or familiar that is used instead of, or in addition to, one's proper name." gebruiken.

Vaak is daarom een export nodig vanuit het programma waarin de gegevens geïmporteerd moeten worden, om te kijken hoe dat programma de gedcom uitlegt. Vervolgens zal iemand dan een programma moeten maken om om de in te lezen gedcom zo aan te passen dat alle velden weer goed worden ingelezen.

Bij de gedcom export vanuit Geni is er nog een probleem.
De export voor een niet betalende gebruiker wordt afgekapt op maximaal 5.000 profielen en die van een betalende gebruiker op maximaal 100.000 profielen. De wereldstamboom heeft nogal wat meer profielen, dus er zullen altijd nogal wat profielen ontbreken.
Daarnaast maakt Geni ook geen goede gedcom aan, Naast het probleem met export van niet UTF-8 gegevens, gaat het ook fout met de familie gegevens. Bij een persoon kunnen 1 of meer FAMS en/of 1 of meer FAMC regels voorkomen (zie uitleg in eerdere bericht). Een FAMS regel moet verwijzen naar familiegegevens waarin de persoon als vader of moeder voorkomt en een FAMC regel moet verwijzen naar familie gegevens waarin de persoon voorkomt als kind.
Omgekeerd moeten de HUSB, WIFE en CHIL regels in een familie weer terugverwijzen naar bestaande personen in de gedcom.
Door het afkappen op 5.000 of 100.000 personen in de gedcom klopt dit echter niet.
Sommige programma's zullen dit bij het inlezen automatisch corrigeren (bijvoorbeeld door kinderen uit een gezin te verwijderen als de kinderen niet in de gedcom voorkomen), maar de gegevens die je dan krijgt zijn niet volledig (je mist kinderen) of bij andere fouten mis je het gezin of een partner in een gezin.

Eigenlijk zou Geni dat moeten aanpassen, maar ik zie ze dat nog niet zo snel doen.

Dank je Job voor de zeer uitgebreide en door mij zeer gewaardeerde uitleg. Ik zie nu dat het idd erg naief van me was te denken dat dit zo makkelijk zou gaan. Ik ben nu handmatig mn stamboom aan het (aan)vullen op wikitree en soms wordt dan vanuit die watchlist daar iets herkend en komt dat mee.(gebrekkige uitleg van mijn kant, maar ik kan het niet anders uitleggen) dat is dan een kleine winst, maar dan nog moet je nog van alles doornemen op aan te vullen gegevens cq weghalen van gegevens die in de notities zijn beland.
Anderen die mij zeiden dat het makkelijk gaat het uploaden van een gedcom wisten waarschijnlijk dat er meer bij kwam kijken maar vonden dat ws zo vanzelfsprekend dat ze dit niet noemden lol. Ik heb weer wat geleerd. Bedankt voor de uitleg, wie weet hebben anderen hier ook wat aan.

Jennie,

Voorlopig heb ik nog geen tijd, maar ik wel zelf wikitree ook eens gaan uitproberen. Dan zal ik ook eens kijken wat er met gedcom files wel en niet lukt.
Ik ben bang dat dat echter nog wel even zal duren, omdat ik het op het ogenblik druk heb met andere zaken en ik ook mijn eigen site nog een keer wil bijwerken (dat is ook veel werk).

Dat zou fijn zijn Job wanneer je er tijd voor hebt.

Niet zo bescheiden hoor Jennie. Natuurlijk hebben een hoop anderen hier ook wat aan. Ik heb niet de illusie dat de meeste Geni gebruikers dit allang begrijpen. Ook hier zijn vast meer lezers dan schrijvers, dus ga vooral door met schrijven en signaleren.

oke laat ik dan maar zo onbescheiden zijn om te denken dat anderen zelfs hierover kunnen struikelen, ik deed het nl:
een gedcom gedownload en toen kwam de vraag hoe ik het bestand wilde openen... uhhhhhh geen idee dus... in Word,ja in wat had dat gemoeten? had ik een PAF moeten hebben (dat doet me al duizelen...).
Om maar te zeggen, de ellende begint al bijna bij stap 1.. :-)
tja en toen ik op wiki tree op miraculeuze wijze (weet nog steeds hoe ik het gedaan heb) de gedcom uploadde floepte dus niets naar mn toen nog lege stamboom. En daar begon de rest van deze continuing story van aanrommelen, niet begrijpen en dan maar handmatig bezig zijn.

Ik ben 26 jaar in het IT vak, maar dat betekent niks. Misschien dat mensen zoals ik gewoon at vlotter omspringen et deze problemen - en de computer niet bekijken als een 'vijand'. Het gaat om perfect LOGISCHE problemen. De ontwikkelaars bij Geni of bij de Gedcom standaarden zijn ook niet perfect. Dus, je weet het eigenlijk nooit.
Ik had een jaar geleden een hele mooie Geni gedcom export naar een versie van PAF - inclusief foto's, alsjeblieft. Kon het haast nie geloven :-)
Wellicht het belangrijkste punt... maak die Gedcoms in alle mogelijke versies die Geni bied. Het zal nooit verloren gaan. Gewoon een kwestie van het vinden van het goede platfom dat de gegevens mooi interpreteert. Maar, verloren is het nooit! :-)

maar "26 jarige" IT deskundige, je hebt de hamvraag niet beantwoord, waar open je het mee, in word in ... of .... of misschien in ....?
ik zal je zeggen: HOOFDPIJN kreeg ik ervan en 3 kilo lichter van de spanning en 4 kilo aan gegeten van de spanning...
Ik bedoel maar..

wat ook zo vervelend is al die ouders van personen die als laatste ouders in de gedom voorkomen, die worden standaard aangegeven met 2 vraagtekens ? ?, terwijl er op Geni wel echt genaamde personen als ouders staan. Dus moet je dan eerst de vraagtekens mergen of verwijderen en daarna de echte ouders uploaden.
Ook heel vervelend, kolommen vol met foto's die niet meegezonden blijken te zijn of niet geaccepteerd worden, en hele kolommen vol met tags van documenten, moet je allemaal weer weghalen, opnieuw op de juiste plaats invoeren. Ik had liever kale gedcoms gehad met de basisgegevens dan deze rotzooi. Bovendien ik heb zoveel ingebracht buiten mijn directe familiekring, maar daarvan kan ik geen gedcom downloaden, alleen maar van de eerste 5000 personen in de pedigree en in de forest en in de bloodline, hoppekeer weer enkele duizenden te mergen.........

Ja de foto's komen als terecht in de notities en als je op die tag klikt kom je op het profiel in Geni uit. Lang leve een kale gedcom en het vermogen deze op juiste wijze te kunnen uploaden. Not dus :-)

Jennie,

Welke keuze mogelijkheden krijg je bij het inlezen van een gedcom (behalve PAF)?.
PAF was de naam van een programma (Personal Ancestral File https://familysearch.org/PAF), dus zou je hopen ook de mogelijkheid Geni te zien.
Je zou Wikitree support kunen vragen wat je daar zou moeten kiezen als je vanuit Geni wilt importeren.
Als er veel Geni overstappers zijn zou het zelfs kunnen dat ze alsnog voor stap 1 een Geni keuze gaan aanbieden.
Een andere mogelijkheid is de Geni gedcom eerst in te lezen in een ander programma waarbij er geen problemen zijn (mogelijk dat MyHeritage het goed doet of anders misschien Ancestral Quest, Legacy Family Tree of RootsMagic) en dan te kijken of dat programma in een formaat kan exporteren dat dat wel goed door Wikitree ingelezen kan worden (bijvoorbeeld in PAF formaat).

Ik weet bijvoorbeeld dat Myheritage de foto's uit Geni goed kan inlezen, want ik heb een Geni gedcom met MyHeritage ingelezen. Zo te zien kan je bij een export niet kiezen voor een formaat, dus weet ik niet of je er verder wat mee opschiet.

Showing 1-30 of 70 posts

Create a free account or login to participate in this discussion