Projekt Folketællinger/ konvertering fra DDD
KILDEPORTALEN |
---|
Projekt Folketællinger |
her: Projekt Folketællinger/ konvertering fra DDD |
Søgning i folketællinger: Kildebeskrivelse: Information om projektet:
Download: Kontakt:
Kategorier: |
De allerede indtastede folketællinger kopieres fra Dansk Data Arkivs DVD, DDD11 med senere rettelser. Rettelserne er tilgængelige på http://ddd.dda.dk/opdateringer/ddd11erstatninger.zip.
Før data kan lægges ind på Kildeportalen er det nødvendigt at tilpasse filerne. Tilpasningerne foretages i et regneark. Ved udarbejdelsen af denne vejledning har jeg benyttet 2 gratis programmer:
Regneark: Open Office Calc
Browser: Google Chrome
De måske mere almindelige programmer som MS Internet Explorer© og MS Office (Excel)© kan formodentlig også benyttes, men de er ikke testet.
Konvertering af datafil
DDD11 er p.t. udsolgt fra DDA. Såfremt du ikke har DDD11, kan vi maile relevante filer til dig. En ny og opdateret DVD påregnes udgivet sidst på efteråret 2012. Når den bliver udgivet, vil vi anvende den nye DVD i stedet for DDD11. Åbn filen fra DDD11 i Calc og gem regnearket som en .ods fil. Arket omdøbes til kp_censusdata. Feltoverskrifterne erstattes med de tilsvarende feltnavne til Kildeportalens database. Det nemmeste er at kopiere dem fra en allerede konverteret fil for at undgå trykfejl i feltnavnene. Udfyld de ny felter: Første medlem af familien Billed-ID Personens nummer på siden Sognets ID Herredets ID Amtets ID Folketællingens ID Indtasterens ID Normaliser følgende felter Køn Civilstand Fødselsdato Gem filen og send den til admin for Kildeportalen.
Kvalitetssikring
De nye felter, som er indsat i regnearket, styrer hvordan billeder og data er parret på Kildeportalen. Det er derfor vigtigt, at de indtastede værdier er korrekte. En senere fejlretning er både besværlig og tidsrøvende. En hurtig og enkel kontrol af de indtastede data kan udføres med funktionen Autofilter i Calc: Marker et felt i titellinien i række 1 Vælg Data ? Filter ? Autofilter Ved feltnavnene vises et rullefelt. Åbnes rullefeltet vises indholdet af alle felter sorteret, dog uden dubletter. Det er her overskueligt at checke både de nye og de normaliserede indtastninger.
Feltbeskrivelser
(A) KIP nummer
- KIPnr ⇒ cen_KIPnr. De indtastede data overføres uændret.
(B) Løbenummer
- Løbenr ⇒ cen_lbnr. De indtastede data overføres uændret.
- Kildestednavn ⇒ cen_kildestednavn. De indtastede data overføres uændret.
(D) Husstands-/ familienummer
- Husstands/familienr. ⇒ cen_husstand_famnr. De indtastede data overføres uændret.
(E) Matrikelnummer/ adresse
- Matr.nr./Adresse ⇒ cen_matnr_adr. De indtastede data overføres uændret.
- Kildenavn ⇒ cen_kildenavn. De indtastede data overføres uændret.
(G) Køn
- Køn ⇒ cen_sex.
- Normalisering (tilladte værdier)
- M (mandkøn)
- K (kvindekøn)
- ”” (tomt felt)
(H) Alder
- Alder ⇒ cen_alder.
- Normalisering (tilladte værdier)
- Heltal
- "" (tomt felt)
Tekst som "under 1 Aar" erstattes af "0" (nul).
(I) Civilstand
- Civilstand ⇒ cen_civilstand.
- Normalisering (tilladte værdier)
- G (gift)
- U (ugift)
- E (enke eller enkemand)
- S (separeret)
- F (fraskilt)
- ”” (tomt felt)
- Formel til konvertering
- Formlen indsættes i række 2 i en ny kolonne og kopieres til de øvrige felter i den nye kolonne.
=HVIS(ELLER(I2="Enkemand";I2="Enke");"E";HVIS(I2="Gift";"G";HVIS(I2="Ugift";"U";HVIS(I2="Separeret";"S";HVIS(I2="Fraskilt";"F";"")))))
(J) Nummer ægteskab
- Nr. ægteskab ⇒ cen_num_mar. De indtastede data overføres uændret.
(K) Kildeerhverv
- Kildeerhverv ⇒ cen_kildeerhverv. De indtastede data overføres uændret.
(L) Kommentar
- Kommentar ⇒ cen_kommentar. De indtastede data overføres uændret.
(M) Stilling i husstanden
Stilling_i_husstanden ⇒ cen_stilling_i_hus. De indtastede data overføres uændret.
(N) Antal familier i husstanden
- Antal familier/hus ⇒ cen_antal_fam. De indtastede data overføres uændret.
(O) Fødested
- Kildefødested ⇒ cen_birthplace. De indtastede data overføres uændret.
(P) Trossamfund
- Trossamfund ⇒ cen_trossamfund. De indtastede data overføres uændret.
(Q) Handicap
- Handicaps ⇒ cen_handicaps. De indtastede data overføres uændret.
(R) Midlertidigt opholdssted
- Midlertidig opholdssted ⇒ cen_midlertidigt_opholdssted. De indtastede data overføres uændret.
(S) Hvornår flyttet til kommunen
- Flyttet til kommunen ⇒ cen_flyttet_til_kommune. De indtastede data overføres uændret.
(T) Hvornår gift
- Hvornår gift ⇒ cen_gift_dato. De indtastede data overføres uændret.
(U) Antal levende børn
- Antal levende børn ⇒ cen_levende_child. De indtastede data overføres uændret.
(V) Antal døde børn
- Antal døde børn ⇒ cen_dead_child. De indtastede data overføres uændret.
(W) Boligtælling
- Boligtælling ⇒ cen_homecount. De indtastede data overføres uændret.
(X) Erhvervssted
- Erhvervssted ⇒ cen_erhvervssted. De indtastede data overføres uændret.
(Y) Fødselsdato
- Født kildedato ⇒ cen_borne_date.
- Normalisering
- YYYY-MM-DD.
- Ufuldstændige datoer erstattes af 0000-00-00.
I FT er fødselsdatoen indtastet i forskellige formater. Konvertering til MySQL formatet kan i nogle tilfælde klares med en formel. Det er hensigtsmæssigt at konvertere datoerne til en ny søjle og efterfølgende at slette søjlen med de oprindelige datoer. Husk at fjerne formlerne før den oprindelige søjle slettes. Her er et par typiske eksempler:
- Fast 2 cifre i dag og måned, f.eks. 01-04-1844
=SAMMENKÆDNING(HØJRE(P2;4);"-";MIDT(P2;4;2);"-";VENSTRE(P2;2))
- Eller på engelsk:
=CONCATENATE(RIGHT(P2;4);"-";MID(P2;4;2);"-";LEFT(P2;2))
- 1 og 2 cifre i dag og måned med bindestreg, f.eks. 1-4-1844
=HØJRE(Y2;4)&"-"&HVIS((SØG("-";Y2)-SØG("-";Y2;4))=-3;MIDT(Y2;FIND("-";Y2)+1;2);"0"&MIDT(Y2;FIND("-";Y2)+1;1))&"-"&HVIS(SØG("-";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
- Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND("-";Y2)-FIND("-";Y2;4))=3;MID(Y2;FIND("-";Y2)+1;2);"0"&MID(Y2;FIND("-";Y2)+1;1))&"-"&IF(FIND("-";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))
- 1 og 2 cifre i dag og måned med punktummer, f.eks.1.4.1844
=HØJRE(Y2;4)&"-"&HVIS((SØG(".";Y2)-SØG(".";Y2;4))=-3;MIDT(Y2;FIND(".";Y2)+1;2);"0"&MIDT(Y2;FIND(".";Y2)+1;1))&"-"&HVIS(SØG(".";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
- Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND(".";Y2)-FIND(".";Y2;4))=3;MID(Y2;FIND(".";Y2)+1;2);"0"&MID(Y2;FIND(".";Y2)+1;1))&"-"&IF(FIND(".";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))
Andre datoformater kan eventuelt konverteres ved at udskifte ”-” eller ”.” med ”/” og ” ” (mellemrum) i ovennævnte formler.
(Z) Fødselsår
- Fødeår ⇒ cen_born_year. De indtastede data overføres uændret.
(AA)) Sidste bopæl eller opholdssted
- Sidste bopæl/oph.sted &rArr cen_last_living. De indtastede data overføres uændret.
(AB) Hvornår ægtefælle er død
- Hvornår æf. død ⇒ cen_when_dead. De indtastede data overføres uændret.
(AC) Midlertidigt nærværende
- Midlertidigt nærværende ⇒ cen_tmp_present. De indtastede data overføres uændret.
(AD) Erhvervskommune
- Erhvervskommune ⇒ cen_erhvervskommune. De indtastede data overføres uændret.
(AE) Transportmiddel
- Transportmiddel ⇒ cen_transportmiddel. De indtastede data overføres uændret.
(AF) Adresse
- Adresse ⇒ cen_adresse. De indtastede data overføres uændret.
(AG) Matrikel
- Matrikel ⇒ cen_martrikkel. De indtastede data overføres uændret.
(AH) Indkomst
- Indkomst &rArr cen_indkomst. De indtastede data overføres uændret.
(AI) Formue
- Formue &rArr cen_formue. De indtastede data overføres uændret.
(AJ) Statsskat
- Statsskat ⇒ cen_statsskat. De indtastede data overføres uændret.
(AK) Kommuneskat
- Kommuneskat ⇒ cen_kommuneskat. De indtastede data overføres uændret.
(AL) Statsborger
- Statsborgerforhold ⇒ cen_statsborgerskab. De indtastede data overføres uændret.
(AM) Bopæl 1924
- Bopæl_1924 ⇒ cen_living_1924. De indtastede data overføres uændret.
(AN) Gadenummer
- Gade nr. ⇒ cen_gade_nr. De indtastede data overføres uændret.
(AO) Etage
- Etage ⇒ cen_etage. De indtastede data overføres uændret.
(AP) Forhus eller baghus
- Forhus/Baghus ⇒ cen_forhus_baghus. De indtastede data overføres uændret.
(AQ) Skemanummer
- Skemanr ⇒ cen_skemaer. De indtastede data overføres uændret.
(AR) Skemaets løbenummer
- Skema lbnr. ⇒ cen_skemalbnr. De indtastede data overføres uændret.
(AS) År for folketælling
- FTår ⇒ cen_FT_year. De indtastede data overføres uændret.
(AT) Kildehenvisning
- Kildehenvisning ⇒ cen_kildehenvisning. De indtastede data overføres uændret.
(AU) Kildekommentar
- Kildekommentar ⇒ cen_kildekom. De indtastede data overføres uændret.
(AV) Første medlem af familien
- cen_first_in_fam
- Normalisering (tilladte værdier)
- 1 (første medlem)
- 0 (øvrige medlemmer)
(AW) Billed-ID
- cen_pic_id
Værdien til cen_pic_id findes i venstre side under billedet af det aktuelle opslag i folketællingen.
- Eksempel
- Opslaget i denne folketælling har billed-ID 31991.
(AX) Personens nummer på siden
- cen_number_on_page
Nummereringen startes med 1 øverst på hver side i folketællingen og er fortløbende til sidste person på siden. Nummereringen benyttes til at bestemme rækkefølgen af de indtastede poster i skemaet under billedet på Kildeportalen.
(AY) Sognets ID
- cen_sogn_id
Værdien af cen_sogn_id findes i URL til den aktuelle folketælling.
- Eksempel
- Sognets ID er her 65 (Veksø)
(AZ) Herredets ID
- cen_herred_id
Værdien af cen_herred _id findes i URL til den aktuelle folketælling.
- Eksempel
- Herredets ID er her 69 (Ølstykke Herred)
(BA) Amtets ID
- cen_amt_id
Værdien af cen_amt_id findes i URL til den aktuelle folketælling.
- Eksempel
- ID er her 5 (Frederiksborg Amt)
(BB) Folketællingens ID
- cen_ft_id
Værdien af cen_ft_id findes i URL til den aktuelle folketælling.
Eksempel:
ID er her 350 (FT-1901, Veksø Sogn)
BC: Indtasterens ID
KIP data
Kildeportalen
- cen_indtaster
Værdien af cen_indtaster sættes til 5 (Dansk Demografisk Database).