Projekt Folketællinger/ konvertering fra DDD: Forskelle mellem versioner

Fra DS-Wiki
Spring til navigation Spring til søgning
(Oprettet, ej redigeret)
 
mNo edit summary
 
(14 mellemliggende versioner af den samme bruger vises ikke)
Linje 1: Linje 1:
De allerede indtastede folketællinger kopieres fra Dansk Data Arkivs DVD, DDD11 med senere rettelser. Rettelserne er tilgængelige http://ddd.dda.dk/opdateringer/ddd11erstatninger.zip.  
{{Skabelon:Projektboks FT}}
Før data kan lægges ind på Kildeportalen er det nødvendigt at tilpasse filerne. Tilpasningerne foretages i et regneark. Ved udarbejdelsen af denne vejledning har jeg benyttet 2 gratis programmer:
__NOTOC__
Regneark: Open Office Calc
 
Browser: Google Chrome
Denne artikel indeholder en vejledning til konvertering af folketællinger fra Dansk Demografisk Database, DDD, til Kildeportalen. Formålet med konverteringen er at sammenknytte data fra de allerede eksisterende indtastninger med billeder af kildematerialet. Disse billeder stammer primært fra Arkivalier Online. Denne sammenknytning med eksisterende indtastninger er en del af Projekt Folketællinger, som sammen med nye indtastninger vil give slægtsforskere langt bedre muligheder for at finde personer i folketællingerne. DIS-Danmark står som ansvarlig for projektet, der gennemføres i samarbejde med Statens Arkiver.
 
==Data og programmer==
De allerede indtastede folketællinger kopieres fra Dansk Data Arkivs DVD, DDD11 med senere rettelser. Rettelserne er tilgængelige [http://ddd.dda.dk/opdateringer/ddd11erstatninger.zip her].  
Før data kan lægges ind på Kildeportalen er det nødvendigt at tilpasse filerne. Tilpasningerne foretages i et regneark. Ved udarbejdelsen af denne vejledning er der benyttet 2 gratis programmer:
* Regneark: Open Office Calc
* Browser: Google Chrome
De måske mere almindelige programmer som MS Internet Explorer© og MS Office (Excel)© kan formodentlig også benyttes, men de er ikke testet.
De måske mere almindelige programmer som MS Internet Explorer© og MS Office (Excel)© kan formodentlig også benyttes, men de er ikke testet.


==Konvertering af datafil==
==Konvertering af datafil==
DDD11 er p.t. udsolgt fra DDA. Såfremt du ikke har DDD11, kan vi maile relevante filer til dig. En ny og opdateret DVD påregnes udgivet sidst på efteråret 2012. Når den bliver udgivet, vil vi anvende den nye DVD i stedet for DDD11.
DDD11 er udsolgt fra Dansk Data Arkiv, DDA. En ny og opdateret DVD påregnes udgivet sidst på efteråret 2012. Når den bliver udgivet, vil vi anvende filer fra den nye DVD.  
Åbn filen fra DDD11 i Calc og gem regnearket som en .ods fil.
* Åbn filen fra DDD11 i Calc og gem regnearket som en .ods fil.
Arket omdøbes til kp_censusdata.
* Arket omdøbes til kp_censusdata.
Feltoverskrifterne erstattes med de tilsvarende feltnavne til Kildeportalens database. Det nemmeste er at kopiere dem fra en allerede konverteret fil for at undgå trykfejl i feltnavnene.  
* Feltoverskrifterne erstattes med de tilsvarende feltnavne til Kildeportalens database. Det nemmeste er at kopiere dem fra en allerede konverteret fil for at undgå trykfejl i feltnavnene.  
Udfyld de ny felter:
* Udfyld de ny felter:
Første medlem af familien
** [[Projekt Folketællinger/ konvertering fra DDD#(AV) Første medlem af familien|Første medlem af familien]]
Billed-ID
** [[Projekt Folketællinger/ konvertering fra DDD#(AW) Billed-ID|Billed-ID]]
Personens nummer på siden
** [[Projekt Folketællinger/ konvertering fra DDD#(AX) Personens nummer på siden|Personens nummer på siden]]
Sognets ID
** [[Projekt Folketællinger/ konvertering fra DDD#(AY) Sognets ID|Sognets ID]]
Herredets ID
** [[Projekt Folketællinger/ konvertering fra DDD#(AZ) Herredets ID|Herredets ID]]
Amtets ID
** [[Projekt Folketællinger/ konvertering fra DDD#(BA) Amtets ID|Amtets ID]]
Folketællingens ID
** [[Projekt Folketællinger/ konvertering fra DDD#(BB) Folketællingens ID|Folketællingens ID]]
Indtasterens ID
** [[Projekt Folketællinger/ konvertering fra DDD#(BC) Indtasterens ID|Indtasterens ID]]
Normaliser følgende felter
* Normaliser følgende felter
Køn
** [[Projekt Folketællinger/ konvertering fra DDD#(G) Køn|Køn]]
Civilstand
** [[Projekt Folketællinger/ konvertering fra DDD#(H) Alder|Alder]]
Fødselsdato
** [[Projekt Folketællinger/ konvertering fra DDD#(I) Civilstand|Civilstand]]
Gem filen og send den til admin for Kildeportalen.
** [[Projekt Folketællinger/ konvertering fra DDD#(Y) Fødselsdato|Fødselsdato]]
Gem filen og send den til kontaktpersonen for Projekt Folketællinger på Kildeportalen.


==Kvalitetssikring==
==Kvalitetssikring==
De nye felter, som er indsat i regnearket, styrer hvordan billeder og data er parret på Kildeportalen. Det er derfor vigtigt, at de indtastede værdier er korrekte. En senere fejlretning er både besværlig og tidsrøvende.
De nye felter, som er indsat i regnearket, styrer hvordan billeder og data er parret på Kildeportalen. Det er derfor vigtigt, at de indtastede værdier er korrekte. En senere fejlretning er både besværlig og tidsrøvende.
En hurtig og enkel kontrol af de indtastede data kan udføres med funktionen Autofilter i Calc:
En hurtig og enkel kontrol af de indtastede data kan udføres med funktionen Autofilter i Calc:
Marker et felt i titellinien i række 1
* Marker et felt i titellinien i række 1
Vælg Data ? Filter ? Autofilter
* Vælg Data ⇒ Filter ⇒ Autofilter
Ved feltnavnene vises et rullefelt. Åbnes rullefeltet vises indholdet af alle felter sorteret, dog uden dubletter. Det er her overskueligt at checke både de nye og de normaliserede indtastninger.
Ved feltnavnene vises et rullefelt. Åbnes rullefeltet vises indholdet af alle felter sorteret, dog uden dubletter. Det er her overskueligt at checke både de nye og de normaliserede indtastninger.


Linje 52: Linje 59:


====(G) Køn====
====(G) Køn====
: Køn ⇒ cen_sex.
: '''Køn''' ⇒ '''cen_sex'''.
; Normalisering (tilladte værdier)
; Normalisering (tilladte værdier)
: M (mandkøn)
: M (mandkøn)
: K (kvindekøn)
: K (kvindekøn)
: ”” (tomt felt)
: U (ukendt)
: ”” (tomt felt - ikke oplyst)


====(H) Alder====
====(H) Alder====
Alder
: '''Alder''' ⇒ '''cen_alder'''.
cen_alder
; Normalisering (tilladte værdier)
: Positive heltal
: "" (tomt felt)
Tekst som "under 1 Aar" erstattes af "0" (nul).


I: Civilstand
====(I) Civilstand====
KIP data
: '''Civilstand''' ⇒ '''cen_civilstand'''.
Kildeportalen
; Normalisering (tilladte værdier)
: G (gift)
: U (ugift)
: E (enke eller enkemand)
: S (separeret)
: F (fraskilt)
: X (ukendt)
;Formel til konvertering
: Formlen indsættes i række 2 i en ny kolonne og kopieres til de øvrige felter i den nye kolonne.
=HVIS(ELLER(I2="Enkemand";I2="Enke");"E";HVIS(I2="Gift";"G";HVIS(I2="Ugift";"U";HVIS(I2="Separeret";"S";HVIS(I2="Fraskilt";"F";"")))))


Civilstand
====(J) Nummer ægteskab====
cen_civilstand
: '''Nr. ægteskab''' ⇒ '''cen_num_mar'''. De indtastede data overføres uændret.


====(K) Kildeerhverv====
: '''Kildeerhverv''' ⇒ '''cen_kildeerhverv'''. De indtastede data overføres uændret.


Normalisering: G (gift)
====(L) Kommentar====
(tilladte værdier) U (ugift)
: '''Kommentar''' ⇒ '''cen_kommentar'''. De indtastede data overføres uændret.
E (enke eller enkemand)
S (separeret)
F (fraskilt)
”” (tomt felt)


Formel til konvertering:
====(M) Stilling i husstanden====
=HVIS(ELLER(I2="Enkemand";I2="Enke");"E";HVIS(I2="Gift";"G";HVIS(I2="Ugift";"U";HVIS(I2="Separeret";"S";HVIS(I2="Fraskilt";"F";"")))))
'''Stilling_i_husstanden''' ⇒ '''cen_stilling_i_hus'''. De indtastede data overføres uændret.


J: Nummer ægteskab
====(N) Antal familier i husstanden====
KIP data
: '''Antal familier/hus''' ⇒ '''cen_antal_fam'''. De indtastede data overføres uændret.
Kildeportalen


Nr. ægteskab
====(O) Fødested====
cen_num_mar
: '''Kildefødested''' ⇒ '''cen_birthplace'''. De indtastede data overføres uændret.


K: Kildeerhverv
====(P) Trossamfund====
KIP data
: '''Trossamfund''' ⇒ '''cen_trossamfund'''. De indtastede data overføres uændret.
Kildeportalen


Kildeerhverv
====(Q) Handicap====
cen_kildeerhverv
: '''Handicaps''' ⇒ '''cen_handicaps'''. De indtastede data overføres uændret.


L: Kommentar
====(R) Midlertidigt opholdssted====
KIP data
: '''Midlertidig opholdssted''' ⇒ '''cen_midlertidigt_opholdssted'''. De indtastede data overføres uændret.
Kildeportalen


Kommentar
====(S) Hvornår flyttet til kommunen====
cen_kommentar
: '''Flyttet til kommunen''' ⇒ '''cen_flyttet_til_kommune'''. De indtastede data overføres uændret.


M: Stilling i husstanden
====(T) Hvornår gift====
KIP data
: '''Hvornår gift''' ⇒ '''cen_gift_dato'''. De indtastede data overføres uændret.
Kildeportalen


Stilling_i_husstanden
====(U) Antal levende børn====
cen_stilling_i_hus
: '''Antal levende børn''' ⇒ '''cen_levende_child'''. De indtastede data overføres uændret.


N: Antal familier i husstanden
====(V) Antal døde børn====
KIP data
: '''Antal døde børn''' ⇒ '''cen_dead_child'''. De indtastede data overføres uændret.
Kildeportalen


Antal familier/hus
====(W) Boligtælling====
cen_antal_fam
: '''Boligtælling''' ⇒ '''cen_homecount'''. De indtastede data overføres uændret.


O: Fødested
====(X) Erhvervssted====
KIP data
: '''Erhvervssted''' ⇒ '''cen_erhvervssted'''. De indtastede data overføres uændret.
Kildeportalen


Kildefødested
====(Y) Fødselsdato====
cen_birthplace
: Født kildedato ⇒ cen_borne_date.
; Normalisering
: YYYY-MM-DD.
: Ufuldstændige datoer erstattes af 0000-00-00.
I FT er fødselsdatoen indtastet i forskellige formater. Konvertering til MySQL formatet kan i nogle tilfælde klares med en formel. Det er hensigtsmæssigt at konvertere datoerne til en ny søjle og efterfølgende at slette søjlen med de oprindelige datoer. Husk at fjerne formlerne før den oprindelige søjle slettes. Her er et par typiske eksempler:
; Fast 2 cifre i dag og måned, f.eks. 01-04-1844:
=SAMMENKÆDNING(HØJRE(Y2;4);"-";MIDT(Y2;4;2);"-";VENSTRE(Y2;2))
:Eller på engelsk:
=CONCATENATE(RIGHT(Y2;4);"-";MID(Y2;4;2);"-";LEFT(Y2;2))
; 1 og 2 cifre i dag og måned med bindestreg, f.eks. 1-4-1844:
=HØJRE(Y2;4)&"-"&HVIS((SØG("-";Y2)-SØG("-";Y2;4))=-3;MIDT(Y2;FIND("-";Y2)+1;2);"0"&MIDT(Y2;FIND("-";Y2)+1;1))&"-"&HVIS(SØG("-";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
: Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND("-";Y2)-FIND("-";Y2;4))=3;MID(Y2;FIND("-";Y2)+1;2);"0"&MID(Y2;FIND("-";Y2)+1;1))&"-"&IF(FIND("-";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))
; 1 og 2 cifre i dag og måned med punktummer, f.eks.1.4.1844:
=HØJRE(Y2;4)&"-"&HVIS((SØG(".";Y2)-SØG(".";Y2;4))=-3;MIDT(Y2;FIND(".";Y2)+1;2);"0"&MIDT(Y2;FIND(".";Y2)+1;1))&"-"&HVIS(SØG(".";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
: Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND(".";Y2)-FIND(".";Y2;4))=3;MID(Y2;FIND(".";Y2)+1;2);"0"&MID(Y2;FIND(".";Y2)+1;1))&"-"&IF(FIND(".";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))
Andre datoformater kan eventuelt konverteres ved at udskifte ”-” eller ”.” med ”/” og ” ” (mellemrum) i ovennævnte formler.


P: Trossamfund
====(Z) Fødselsår====
KIP data
: '''Fødeår''' ⇒ '''cen_born_year'''. De indtastede data overføres uændret.
Kildeportalen


Trossamfund
Fødselsår benyttes sammen med fødselsdato til at danne den komplette fødselsdato YYYY.MM.DD i kolonne (Y) Fødselsdato.
cen_trossamfund


Q: Handicap
====(AA)) Sidste bopæl eller opholdssted====
KIP data
: '''Sidste bopæl/oph.sted''' &rArr '''cen_last_living'''. De indtastede data overføres uændret.
Kildeportalen


Handicaps
====(AB) Hvornår ægtefælle er død====
cen_handicaps
: '''Hvornår æf. død''' ⇒ '''cen_when_dead'''. De indtastede data overføres uændret.


R: Midlertidigt opholdssted
====(AC) Midlertidigt nærværende====
KIP data
: '''Midlertidigt nærværende''' ⇒ '''cen_tmp_present'''. De indtastede data overføres uændret.
Kildeportalen


Midlertidig opholdssted
====(AD) Erhvervskommune====
cen_midlertidigt_opholdssted
: '''Erhvervskommune''' ⇒ '''cen_erhvervskommune'''. De indtastede data overføres uændret.


S: Hvornår flyttet til kommunen
====(AE) Transportmiddel====
KIP data
: '''Transportmiddel''' ⇒ '''cen_transportmiddel'''. De indtastede data overføres uændret.
Kildeportalen


Flyttet til kommunen
====(AF) Adresse====
cen_flyttet_til_kommune
: '''Adresse''' ⇒ '''cen_adresse'''. De indtastede data overføres uændret.


T: Hvornår gift
====(AG) Matrikel====
KIP data
: '''Matrikel''' ⇒ '''cen_martrikkel'''. De indtastede data overføres uændret.
Kildeportalen


Hvornår gift
====(AH) Indkomst====
cen_gift_dato
: '''Indkomst''' &rArr '''cen_indkomst'''. De indtastede data overføres uændret.


U: Antal levende børn
====(AI) Formue====
KIP data
: '''Formue''' &rArr '''cen_formue'''. De indtastede data overføres uændret.
Kildeportalen


Antal levende børn
====(AJ) Statsskat====
cen_levende_child
: '''Statsskat''' ⇒ '''cen_statsskat'''. De indtastede data overføres uændret.


V: Antal døde børn
====(AK) Kommuneskat====
KIP data
: '''Kommuneskat''' ⇒ '''cen_kommuneskat'''. De indtastede data overføres uændret.
Kildeportalen


Antal døde børn
====(AL) Statsborger====
cen_dead_child
: '''Statsborgerforhold''' ⇒ '''cen_statsborgerskab'''. De indtastede data overføres uændret.


W: Boligtælling
====(AM) Bopæl 1924====
KIP data
: '''Bopæl_1924''' ⇒ '''cen_living_1924'''. De indtastede data overføres uændret.
Kildeportalen


Boligtælling
====(AN) Gadenummer====
cen_homecount
: '''Gade nr.''' ⇒ '''cen_gade_nr'''. De indtastede data overføres uændret.


X: Erhvervssted
====(AO) Etage====
KIP data
: '''Etage''' ⇒ '''cen_etage'''. De indtastede data overføres uændret.
Kildeportalen


Erhvervssted
====(AP) Forhus eller baghus====
cen_erhvervssted
: '''Forhus/Baghus''' ⇒ '''cen_forhus_baghus'''. De indtastede data overføres uændret.


Y: Fødselsdato
====(AQ) Skemanummer====
KIP data
: '''Skemanr''' ⇒ '''cen_skemaer'''. De indtastede data overføres uændret.
Kildeportalen


Født kildedato
====(AR) Skemaets løbenummer====
cen_borne_date
: '''Skema lbnr.''' ⇒ '''cen_skemalbnr'''. De indtastede data overføres uændret.


====(AS) År for folketælling====
: '''FTår''' ⇒ '''cen_FT_year'''. De indtastede data overføres uændret.


Normalisering: YYYY-MM-DD
====(AT) Kildehenvisning====
Ufuldstændige datoer erstattes af 0000-00-00.
: '''Kildehenvisning''' ⇒ '''cen_kildehenvisning'''. De indtastede data overføres uændret.
I FT er fødselsdatoen indtastet i forskellige formater. Konvertering til MySQL formatet kan i nogle tilfælde klares med en formel. Det er hensigtsmæssigt at konvertere datoerne til en ny søjle og efterfølgende at slette søjlen med de oprindelige datoer. Husk at fjerne formlerne før den oprindelige søjle slettes.
Her er et par typiske eksempler:
1. Fast 2 cifre i dag og måned, f.eks. 01-04-1844:
=SAMMENKÆDNING(HØJRE(P2;4);"-";MIDT(P2;4;2);"-";VENSTRE(P2;2))
Eller på engelsk:
=CONCATENATE(RIGHT(P2;4);"-";MID(P2;4;2);"-";LEFT(P2;2))


2. 1 og 2 cifre i dag og måned med bindestreg, f.eks. 1-4-1844:
====(AU) Kildekommentar====
=HØJRE(Y2;4)&"-"&HVIS((SØG("-";Y2)-SØG("-";Y2;4))=-3;MIDT(Y2;FIND("-";Y2)+1;2);"0"
: '''Kildekommentar''' ⇒ '''cen_kildekom'''. De indtastede data overføres uændret.
&MIDT(Y2;FIND("-";Y2)+1;1))&"-"&HVIS(SØG("-";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND("-";Y2)-FIND("-";Y2;4))=3;MID(Y2;FIND("-";Y2)+1;2);"0"
&MID(Y2;FIND("-";Y2)+1;1))&"-"&IF(FIND("-";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))
3. 1 og 2 cifre i dag og måned med punktummer, f.eks.1.4.1844:
=HØJRE(Y2;4)&"-"&HVIS((SØG(".";Y2)-SØG(".";Y2;4))=-3;MIDT(Y2;FIND(".";Y2)+1;2);"0"
&MIDT(Y2;FIND(".";Y2)+1;1))&"-"&HVIS(SØG(".";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND(".";Y2)-FIND(".";Y2;4))=3;MID(Y2;FIND(".";Y2)+1;2);"0"&
MID(Y2;FIND(".";Y2)+1;1))&"-"&IF(FIND(".";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))
Andre datoformater kan eventuelt konverteres ved at udskifte ”-” eller ”.” med ”/” og ” ” (mellemrum) i ovennævnte formler. Formlen i pkt. 2 kan også benyttes i stedet for den simplere formel under pkt. 1.
Z: Fødselsår
KIP data
Kildeportalen


Fødeår
====(AV) Første medlem af familien====
cen_born_year
: '''cen_first_in_fam'''
 
; Normalisering (tilladte værdier)
AA: Sidste bopæl eller opholdssted
: 1 (første medlem)
KIP data
: 0 (øvrige medlemmer)
Kildeportalen
 
Sidste bopæl/oph.sted
cen_last_living
 
 
AB: Hvornår er ægtefælle er død
KIP data
Kildeportalen
 
Hvornår æf. død
cen_when_dead
 
 
AC: Midlertidigt nærværende
KIP data
Kildeportalen
 
Midlertidigt nærværende
cen_tmp_present
 
 
AD: Erhvervskommune
KIP data
Kildeportalen
 
Erhvervskommune
cen_erhvervskommune
 
AE: Transportmiddel
KIP data
Kildeportalen
 
Transportmiddel
cen_transportmiddel
 
AF: Adresse
KIP data
Kildeportalen
 
Adresse
cen_adresse
 
AG: Matrikel
KIP data
Kildeportalen
 
Matrikel
cen_martrikkel
 
AH: Indkomst
KIP data
Kildeportalen
 
Indkomst
cen_indkomst
 
AI: Formue
KIP data
Kildeportalen


Formue
====(AW) Billed-ID====
cen_formue
: '''cen_pic_id'''
[[Billede:Billed_ID.jpg|200px|left]]
Værdien til cen_pic_id findes i venstre side under billedet af det aktuelle opslag i folketællingen. '''NB:''' ''Værdien er kun synlig, når man er logget ind på Kildeportalen''.
; Eksempel:
: Opslaget i den viste folketælling har billed-ID 31991.
Under gennemgang af billederne og indtastning af billed-ID i regnearket sættes feltet 'Sideindhold'. For sider uden indtastede data sættes feltet til 'Ingen data'. I alle andre tilfælde bibeholdes 'Ukendt'. Under den efterfølgende upload af regnearket sættes feltet samtidig til 'Er færdig'.
<br style="clear:both;">


AJ: Statsskat
====(AX) Personens nummer på siden====
KIP data
: '''cen_number_on_page'''
Kildeportalen
 
Statsskat
cen_statsskat
 
AK: Kommuneskat
KIP data
Kildeportalen
 
Kommuneskat
cen_kommuneskat
 
AL: Statsborger
KIP data
Kildeportalen
 
Statsborgerforhold
cen_statsborgerskab
 
AM: Bopæl 1924
KIP data
Kildeportalen
 
Bopæl_1924
cen_living_1924
 
AN: Gadenummer
KIP data
Kildeportalen
 
Gade nr.
cen_gade_nr
 
AO: Etage
KIP data
Kildeportalen
 
Etage
cen_etage
 
AP: Forhus eller baghus
KIP data
Kildeportalen
 
Forhus/Baghus
cen_forhus_baghus
 
AQ: Skemanummer
KIP data
Kildeportalen
 
Skemanr
cen_skemaer
 
AR: Skemaets løbenummer
KIP data
Kildeportalen
 
Skema lbnr.
cen_skemalbnr
 
AS: År for folketælling
KIP data
Kildeportalen
 
FTår
cen_FT_year
 
AT: Kildehenvisning
KIP data
Kildeportalen
 
Kildehenvisning
cen_kildehenvisning
 
 
 
 
AU: Kildekommentar
KIP data
Kildeportalen
 
Kildekommentar
cen_kildekom
 
AV: Første medlem af familien
KIP data
Kildeportalen
 
-
cen_first_in_fam
 
 
Normalisering: 1 (første medlem)
(tilladte værdier) 0 (øvrige medlemmer)
AW: Billed-ID
KIP data
Kildeportalen
 
-
cen_pic_id
 
 
Værdien til cen_pic_id findes i venstre side under billedet af det aktuelle opslag i folketællingen.
Eksempel:
 
Opslaget i denne folketælling har billed-ID 31991.
 
AX: Personens nummer på siden
KIP data
Kildeportalen
 
-
cen_number_on_page
 
 
Nummereringen startesmed 1 øverst på hver side i folketællingen og er fortløbende til sidste person på siden. Nummereringen benyttes til at bestemme rækkefølgen af de indtastede poster i skemaet under billedet på Kildeportalen.
AY: Sognets ID
KIP data
Kildeportalen
 
-
cen_sogn_id


Nummereringen startes med 1 øverst på hver side i folketællingen og er fortløbende til sidste person på siden. Nummereringen benyttes til at bestemme rækkefølgen af de indtastede poster i skemaet under billedet på Kildeportalen.


====(AY) Sognets ID====
: '''cen_sogn_id'''
Værdien af cen_sogn_id findes i URL til den aktuelle folketælling.
Værdien af cen_sogn_id findes i URL til den aktuelle folketælling.
Eksempel:  
[[Billede:Sogn_ID.jpg|500px|left]]
Sognets ID er her 65 (Veksø)
<br style="clear:both;">
 
; Eksempel  
 
: Sognets ID er her 65 (Veksø)
 
AZ: Herredets ID
KIP data
Kildeportalen
 
-
cen_herred_id
 


====(AZ) Herredets ID====
: '''cen_herred_id'''
Værdien af cen_herred _id findes i URL til den aktuelle folketælling.
Værdien af cen_herred _id findes i URL til den aktuelle folketælling.
Eksempel:
[[Billede:Herred_ID.jpg|500px|left]]
Herredets ID er her 69 (Ølstykke Herred)
<br style="clear:both;">
BA: Amtets ID
; Eksempel
KIP data
: Herredets ID er her 69 (Ølstykke Herred)
Kildeportalen
 
-
cen_amt_id
 


====(BA) Amtets ID====
: '''cen_amt_id'''
Værdien af cen_amt_id findes i URL til den aktuelle folketælling.
Værdien af cen_amt_id findes i URL til den aktuelle folketælling.
Eksempel:
[[Billede:Amt_ID.jpg|500px|left]]
ID er her 5 (Frederiksborg Amt)
<br style="clear:both;">
BB: Folketællingens ID
; Eksempel
KIP data
: ID er her 5 (Frederiksborg Amt)
Kildeportalen
 
-
cen_ft_id
 


====(BB) Folketællingens ID====
: '''cen_ft_id'''
Værdien af cen_ft_id findes i URL til den aktuelle folketælling.
Værdien af cen_ft_id findes i URL til den aktuelle folketælling.
Eksempel:
[[Billede:FT_ID.jpg|500px|left]]
ID er her 350 (FT-1901, Veksø Sogn)
<br style="clear:both;">
BC: Indtasterens ID
; Eksempel
KIP data
: ID er her 350 (FT-1901, Veksø Sogn)
Kildeportalen


-
====(BC) Indtasterens ID====
cen_indtaster
cen_indtaster


Værdien af cen_indtaster sættes til 5 (Dansk Demografisk Database).


Værdien af cen_indtaster sættes til 5 (Dansk Demografisk Database).
[[Kategori:Kildeportalen]]

Nuværende version fra 18. dec. 2012, 12:12

KILDEPORTALEN
Projekt Folketællinger
her: Projekt Folketællinger/ konvertering fra DDD

Søgning i folketællinger:

Kildebeskrivelse:

Information om projektet:

Download:

Kontakt:

Kategorier:


Denne artikel indeholder en vejledning til konvertering af folketællinger fra Dansk Demografisk Database, DDD, til Kildeportalen. Formålet med konverteringen er at sammenknytte data fra de allerede eksisterende indtastninger med billeder af kildematerialet. Disse billeder stammer primært fra Arkivalier Online. Denne sammenknytning med eksisterende indtastninger er en del af Projekt Folketællinger, som sammen med nye indtastninger vil give slægtsforskere langt bedre muligheder for at finde personer i folketællingerne. DIS-Danmark står som ansvarlig for projektet, der gennemføres i samarbejde med Statens Arkiver.

Data og programmer

De allerede indtastede folketællinger kopieres fra Dansk Data Arkivs DVD, DDD11 med senere rettelser. Rettelserne er tilgængelige her. Før data kan lægges ind på Kildeportalen er det nødvendigt at tilpasse filerne. Tilpasningerne foretages i et regneark. Ved udarbejdelsen af denne vejledning er der benyttet 2 gratis programmer:

  • Regneark: Open Office Calc
  • Browser: Google Chrome

De måske mere almindelige programmer som MS Internet Explorer© og MS Office (Excel)© kan formodentlig også benyttes, men de er ikke testet.

Konvertering af datafil

DDD11 er udsolgt fra Dansk Data Arkiv, DDA. En ny og opdateret DVD påregnes udgivet sidst på efteråret 2012. Når den bliver udgivet, vil vi anvende filer fra den nye DVD.

Gem filen og send den til kontaktpersonen for Projekt Folketællinger på Kildeportalen.

Kvalitetssikring

De nye felter, som er indsat i regnearket, styrer hvordan billeder og data er parret på Kildeportalen. Det er derfor vigtigt, at de indtastede værdier er korrekte. En senere fejlretning er både besværlig og tidsrøvende. En hurtig og enkel kontrol af de indtastede data kan udføres med funktionen Autofilter i Calc:

  • Marker et felt i titellinien i række 1
  • Vælg Data ⇒ Filter ⇒ Autofilter

Ved feltnavnene vises et rullefelt. Åbnes rullefeltet vises indholdet af alle felter sorteret, dog uden dubletter. Det er her overskueligt at checke både de nye og de normaliserede indtastninger.

Feltbeskrivelser

(A) KIP nummer

KIPnrcen_KIPnr. De indtastede data overføres uændret.

(B) Løbenummer

Løbenrcen_lbnr. De indtastede data overføres uændret.

(C) Kildestednavn

Kildestednavncen_kildestednavn. De indtastede data overføres uændret.

(D) Husstands-/ familienummer

Husstands/familienr.cen_husstand_famnr. De indtastede data overføres uændret.

(E) Matrikelnummer/ adresse

Matr.nr./Adressecen_matnr_adr. De indtastede data overføres uændret.

(F) Kildenavn

Kildenavncen_kildenavn. De indtastede data overføres uændret.

(G) Køn

Køncen_sex.
Normalisering (tilladte værdier)
M (mandkøn)
K (kvindekøn)
U (ukendt)
”” (tomt felt - ikke oplyst)

(H) Alder

Aldercen_alder.
Normalisering (tilladte værdier)
Positive heltal
"" (tomt felt)

Tekst som "under 1 Aar" erstattes af "0" (nul).

(I) Civilstand

Civilstandcen_civilstand.
Normalisering (tilladte værdier)
G (gift)
U (ugift)
E (enke eller enkemand)
S (separeret)
F (fraskilt)
X (ukendt)
Formel til konvertering
Formlen indsættes i række 2 i en ny kolonne og kopieres til de øvrige felter i den nye kolonne.
=HVIS(ELLER(I2="Enkemand";I2="Enke");"E";HVIS(I2="Gift";"G";HVIS(I2="Ugift";"U";HVIS(I2="Separeret";"S";HVIS(I2="Fraskilt";"F";"")))))

(J) Nummer ægteskab

Nr. ægteskabcen_num_mar. De indtastede data overføres uændret.

(K) Kildeerhverv

Kildeerhvervcen_kildeerhverv. De indtastede data overføres uændret.

(L) Kommentar

Kommentarcen_kommentar. De indtastede data overføres uændret.

(M) Stilling i husstanden

Stilling_i_husstandencen_stilling_i_hus. De indtastede data overføres uændret.

(N) Antal familier i husstanden

Antal familier/huscen_antal_fam. De indtastede data overføres uændret.

(O) Fødested

Kildefødestedcen_birthplace. De indtastede data overføres uændret.

(P) Trossamfund

Trossamfundcen_trossamfund. De indtastede data overføres uændret.

(Q) Handicap

Handicapscen_handicaps. De indtastede data overføres uændret.

(R) Midlertidigt opholdssted

Midlertidig opholdsstedcen_midlertidigt_opholdssted. De indtastede data overføres uændret.

(S) Hvornår flyttet til kommunen

Flyttet til kommunencen_flyttet_til_kommune. De indtastede data overføres uændret.

(T) Hvornår gift

Hvornår giftcen_gift_dato. De indtastede data overføres uændret.

(U) Antal levende børn

Antal levende børncen_levende_child. De indtastede data overføres uændret.

(V) Antal døde børn

Antal døde børncen_dead_child. De indtastede data overføres uændret.

(W) Boligtælling

Boligtællingcen_homecount. De indtastede data overføres uændret.

(X) Erhvervssted

Erhvervsstedcen_erhvervssted. De indtastede data overføres uændret.

(Y) Fødselsdato

Født kildedato ⇒ cen_borne_date.
Normalisering
YYYY-MM-DD.
Ufuldstændige datoer erstattes af 0000-00-00.

I FT er fødselsdatoen indtastet i forskellige formater. Konvertering til MySQL formatet kan i nogle tilfælde klares med en formel. Det er hensigtsmæssigt at konvertere datoerne til en ny søjle og efterfølgende at slette søjlen med de oprindelige datoer. Husk at fjerne formlerne før den oprindelige søjle slettes. Her er et par typiske eksempler:

Fast 2 cifre i dag og måned, f.eks. 01-04-1844
=SAMMENKÆDNING(HØJRE(Y2;4);"-";MIDT(Y2;4;2);"-";VENSTRE(Y2;2))
Eller på engelsk:
=CONCATENATE(RIGHT(Y2;4);"-";MID(Y2;4;2);"-";LEFT(Y2;2)) 
1 og 2 cifre i dag og måned med bindestreg, f.eks. 1-4-1844
=HØJRE(Y2;4)&"-"&HVIS((SØG("-";Y2)-SØG("-";Y2;4))=-3;MIDT(Y2;FIND("-";Y2)+1;2);"0"&MIDT(Y2;FIND("-";Y2)+1;1))&"-"&HVIS(SØG("-";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND("-";Y2)-FIND("-";Y2;4))=3;MID(Y2;FIND("-";Y2)+1;2);"0"&MID(Y2;FIND("-";Y2)+1;1))&"-"&IF(FIND("-";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))
1 og 2 cifre i dag og måned med punktummer, f.eks.1.4.1844
=HØJRE(Y2;4)&"-"&HVIS((SØG(".";Y2)-SØG(".";Y2;4))=-3;MIDT(Y2;FIND(".";Y2)+1;2);"0"&MIDT(Y2;FIND(".";Y2)+1;1))&"-"&HVIS(SØG(".";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND(".";Y2)-FIND(".";Y2;4))=3;MID(Y2;FIND(".";Y2)+1;2);"0"&MID(Y2;FIND(".";Y2)+1;1))&"-"&IF(FIND(".";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))

Andre datoformater kan eventuelt konverteres ved at udskifte ”-” eller ”.” med ”/” og ” ” (mellemrum) i ovennævnte formler.

(Z) Fødselsår

Fødeårcen_born_year. De indtastede data overføres uændret.

Fødselsår benyttes sammen med fødselsdato til at danne den komplette fødselsdato YYYY.MM.DD i kolonne (Y) Fødselsdato.

(AA)) Sidste bopæl eller opholdssted

Sidste bopæl/oph.sted &rArr cen_last_living. De indtastede data overføres uændret.

(AB) Hvornår ægtefælle er død

Hvornår æf. dødcen_when_dead. De indtastede data overføres uændret.

(AC) Midlertidigt nærværende

Midlertidigt nærværendecen_tmp_present. De indtastede data overføres uændret.

(AD) Erhvervskommune

Erhvervskommunecen_erhvervskommune. De indtastede data overføres uændret.

(AE) Transportmiddel

Transportmiddelcen_transportmiddel. De indtastede data overføres uændret.

(AF) Adresse

Adressecen_adresse. De indtastede data overføres uændret.

(AG) Matrikel

Matrikelcen_martrikkel. De indtastede data overføres uændret.

(AH) Indkomst

Indkomst &rArr cen_indkomst. De indtastede data overføres uændret.

(AI) Formue

Formue &rArr cen_formue. De indtastede data overføres uændret.

(AJ) Statsskat

Statsskatcen_statsskat. De indtastede data overføres uændret.

(AK) Kommuneskat

Kommuneskatcen_kommuneskat. De indtastede data overføres uændret.

(AL) Statsborger

Statsborgerforholdcen_statsborgerskab. De indtastede data overføres uændret.

(AM) Bopæl 1924

Bopæl_1924cen_living_1924. De indtastede data overføres uændret.

(AN) Gadenummer

Gade nr.cen_gade_nr. De indtastede data overføres uændret.

(AO) Etage

Etagecen_etage. De indtastede data overføres uændret.

(AP) Forhus eller baghus

Forhus/Baghuscen_forhus_baghus. De indtastede data overføres uændret.

(AQ) Skemanummer

Skemanrcen_skemaer. De indtastede data overføres uændret.

(AR) Skemaets løbenummer

Skema lbnr.cen_skemalbnr. De indtastede data overføres uændret.

(AS) År for folketælling

FTårcen_FT_year. De indtastede data overføres uændret.

(AT) Kildehenvisning

Kildehenvisningcen_kildehenvisning. De indtastede data overføres uændret.

(AU) Kildekommentar

Kildekommentarcen_kildekom. De indtastede data overføres uændret.

(AV) Første medlem af familien

cen_first_in_fam
Normalisering (tilladte værdier)
1 (første medlem)
0 (øvrige medlemmer)

(AW) Billed-ID

cen_pic_id
Billed ID.jpg

Værdien til cen_pic_id findes i venstre side under billedet af det aktuelle opslag i folketællingen. NB: Værdien er kun synlig, når man er logget ind på Kildeportalen.

Eksempel
Opslaget i den viste folketælling har billed-ID 31991.

Under gennemgang af billederne og indtastning af billed-ID i regnearket sættes feltet 'Sideindhold'. For sider uden indtastede data sættes feltet til 'Ingen data'. I alle andre tilfælde bibeholdes 'Ukendt'. Under den efterfølgende upload af regnearket sættes feltet samtidig til 'Er færdig'.

(AX) Personens nummer på siden

cen_number_on_page

Nummereringen startes med 1 øverst på hver side i folketællingen og er fortløbende til sidste person på siden. Nummereringen benyttes til at bestemme rækkefølgen af de indtastede poster i skemaet under billedet på Kildeportalen.

(AY) Sognets ID

cen_sogn_id

Værdien af cen_sogn_id findes i URL til den aktuelle folketælling.

Sogn ID.jpg


Eksempel
Sognets ID er her 65 (Veksø)

(AZ) Herredets ID

cen_herred_id

Værdien af cen_herred _id findes i URL til den aktuelle folketælling.

Herred ID.jpg


Eksempel
Herredets ID er her 69 (Ølstykke Herred)

(BA) Amtets ID

cen_amt_id

Værdien af cen_amt_id findes i URL til den aktuelle folketælling.

Amt ID.jpg


Eksempel
ID er her 5 (Frederiksborg Amt)

(BB) Folketællingens ID

cen_ft_id

Værdien af cen_ft_id findes i URL til den aktuelle folketælling.

FT ID.jpg


Eksempel
ID er her 350 (FT-1901, Veksø Sogn)

(BC) Indtasterens ID

cen_indtaster

Værdien af cen_indtaster sættes til 5 (Dansk Demografisk Database).