Slægt & Data kræver mere RAM. En stor fil kan derfor risikere at skulle vente flere dage på en ledig computer. En lille fil kan derimod blive sammenlignet med alle GEDCOMP’s små filer i løbet af kort tid. F.eks. kan en GEDCOM-fil med mindre end 5.000 person-oplysninger blive sammenlignet med alle de af GEDCOMP’s filer, der højst rummer 5.000 personoplysninger på en computer med 64 mB RAM. GEDCOMP’s største GEDCOM-fil rummer knapt 215.000 person-oplysninger. Sammenligning med denne fil sker på computere med 256 - 1024 MB RAM. På samme måde som med fejl-kontrollen bliver resultatet af filsammenligningen løbende returneret til hoved-computeren. Og hvis sammenligningen skulle blive afbrudt undervejs, så vil hoved-computeren beholde GEDCOM-filen i standardkøen med besked om at genstarte hvor sammenligningen blev afbrudt. Da sammenligningen med GEDCOMP’s filer vokser med deres størrelse, kan der gå nogle dage fra en GEDCOM-fil bliver sammenlignet med de første små filer indtil sammenligningen med den største fil er afsluttet. Dette er kun den indledende sammenligningsrunde, for sammenligningerne slutter ikke med det. For når en fil er blevet sammenlignet med GEDCOMP’s filer bliver den selv tilføjet samlingen, og når nye filer ankommer, så vil filen indgå i nye sammenligninger med de nytilkomne filer. Så GEDCOMP kan både finde personsammenfald i de første dage 18 <strong>DIS</strong>-<strong>Danmark</strong> - december <strong>1999</strong> efter sammenligningens start, og sammenfald med filer indsendt mange måneder senere. Den indledende sammenligningsrunde vil i langt de fleste tilfælde resultere i personsammenfald med en række GEDCOM-filer. I hvert tilfælde har GEDCOMP udregnet et antal points, der angiver hvor sandsynligt det er at sammenfaldene faktisk drejer sig om sammenfaldende personer. Antallet af points kan være fra 0 op til et par millioner. Hvis antallet af points er mindre end 100 bliver resultatet slettet. Hvis resultatet er større end 500 sender GEDCOMP automatisk en email afsted til de to GEDCOM-filers indsendere. Enkelte resultater får mellem 100 og 500 points. De er tvivlsomme og bliver lagt i en manuel kø. Med jævne mellemrum foretager jeg en delvist automatiseret vurdering af resultaterne i denne kø. Den helt manuelle modtagelse af emails og denne delvis manuelle lejlighedsvise behandling af tvivlstilfælde er den eneste manuelle betjening, som GEDCOMP kræver. Når GEDCOMP har afsendt en email med besked om person-sammenfald, ajourfører den de to ovennævnte www-status-sider, således at GEDCOMP’s brugere altid ved hvor mange emails, der er sendt til dem. Når en <strong>slægt</strong>sforsker har udvekslet oplysninger med de <strong>slægt</strong>sforskere, som GEDCOMP har givet kontakt til, så har denne <strong>slægt</strong>sforsker som oftest fået oplysninger om et antal nye personer. Når de nye oplysninger er færdigbehandlet, så vil det være en god ide at danne en ny GEDCOM-fil, og indsende den som erstatning for den gamle. For de nye personer kan jo give anledning til nye sammenfald. Når det sker, så bliver den nye fil behandlet præcis som ovenfor. Og den bliver sammenlignet med alle de filer, som den gamle fil blev sammenlignet med. Men der er en enkel forskel: Den nye GEDCOM-fil giver sammenfald med alle de filer som den gamle fil havde sammenfald med - plus forhåbentlig nogle flere. Lad os sige at filen dk20911b.ged havde sammenfald med filen dk21010a.ged, og at de to filers indsendere fik email om det. Derefter indsender ejeren af dk20911b.ged en ny fil, dk21113c.ged, som erstatning for den gamle. GEDCOMP vil herefter finde sammenfald mellem dk21113c.ged og dk21010a.ged. Hvis dette sammenfald ikke adskiller sig væsentligt fra sammenfaldet mellem dk20911b.ged og dk21010a.ged, så bliver det nye sammenfald ignoreret. Men hvis det nye sammenfald indeholder flere sammenfaldende par en det gamle, så sendes der email afsted om det nye sammenfald, med besked om at det er en forbedring af det gamle. På den måde kan man roligt lade sin GEDCOM-fil udskifte uden at det giver anledning til forvirring. Lars Lundin P.t. Los Alamos, USA email: lkl@runge.uni-c.dk
Nyt fra Kildeindtastningsprojektet Slægt & Data <strong>DIS</strong>-<strong>Danmark</strong> - december <strong>1999</strong> 19