Jeg skriver et program, der skal generere GEOID-værdier fra 2000 og 2010-folketællingsdata for at forbinde folketællingsdataene til TIGER / Line-poster. I ” m starter med staten, amt, regionblok osv., værdier i folketællings GEO-filer og har brug for at oprette GEOIDer.
Jeg har brug for at arbejde med alle opsummeringsniveauerne, og da strukturen for GEOID-værdien ser ud til at variere afhængigt af typen af geografi, ville det være rigtig rart at have en spec til at konstruere den.
Jeg fandt dette dokument, men det specificerer kun GEOID-strukturen for omfordelingsfilerne:
http://www.census.gov/rdo/pdf/0GEOID_Construction_for_Matching.pdf
Jeg vil gerne have det samme, men for alle opsummeringsniveauer.
Jeg har overvejet at downloade alle tigerfilerne og udpakning af GEOID10-værdierne og reverse engineering af dem fra de poster, der er knyttet til formfilerne, men programmeringen koster mere end bare at betale nogen for at gøre det manuelt ved at inspicere filerne eller dokumentationen ( http://www.census.gov/geo/www/tiger/tgrshp2010/TGRSHP10SF1.pdf )
Har du andre ideer til, hvordan man nemmest kan generere GEOID fra GEO-folketællinger til alle poster og oversigtsniveauer?
Kan alternativt 0GEOID_Construction_for_Matching.pdf-filen, der er skrevet til omfordelingsfilerne, bruges som en spec for 2010 SF1-opsummeringsniveauer og GEOIDerne for de tilsvarende TIGER-filer?
Tak!
Kommentarer
- Indtil videre er et ja senere er det bedste, jeg ' har formået, at reverse engineering fra TIGER-filerne. Det ' er kedeligt, men ikke svært.
Svar
Nedstem med mig, hvis jeg tager fejl, men GEOID er en sammenkædning af en masse felter som angivet i dokumentationsoversigt på side 13. I det geografiske områdekoder, du vil lede efter felter på position 26-65.
Kommentarer
- Dette betyder ikke ' t besvar spørgsmålet " for alle opsummeringsniveauer. " Så igen, det ' er overraskende svært selv at finde en liste med " alle opsummeringsniveauer. " Dette er det tætteste jeg ' er fundet fra folketælling factfinder2.census.gov/help/en/glossary/s/… Dette har mere, men er samlet uden for folketællingen mcdc2.missouri.edu/cgi-bin/browse?/pub/sasfmats/Ssumle v.sas @
Svar
Efter flere år oprettede jeg endelig min egen kode til opbygge et skema. Imidlertid er det i øjeblikket indlejret i et pythonbibliotek, så det kan generelt ikke bruges som en spec. Her er geoidmodulet, som parser og genererer Census-geoider med varianter for Census-, Tiger- og ACS-formater:
https://github.com/CivicKnowledge/geoid.git
Hvis du er praktisk med programmering, kan du udtrække alt krævet information fra en af kildefilerne, selvom det kan være lettere bare at bruge modulet i python.
https://github.com/CivicKnowledge/geoid/blob/master/geoid/ init .py
segments
ordbogen har lister over komponenter til hvert af oversigtsniveaunumrene, og lengths
ordbogen har længden i decimalcifre for hver af komponenterne. Bemærk, at nogle få af længder er angivet som strenge; dette er et signal om, at komponenten kan tage tegn såvel som cifre.
Denne kode genereres fra en python-notesbog, som en nalyserer dataene fra det første link i dette svar.
https://github.com/CivicKnowledge/geoid/blob/master/support/GenerateNames.ipynb
Der er en kort spec for nogle geoider på folketællingswebstedet i afsnittet “GEOID-struktur for geografiske områder”.
Svar
Her finder du en simpel forklaring på de kolonner, som du skal samkøre for at generere GeoIDerne til forskellige geografiske områder
https://www.census.gov/geo/reference/geoidentifiers.html
Kommentarer
- Tak. At ' nærmer sig, men desværre er ' ikke omfattende. Der er meget flere opsummeringsniveauer – mindst 209 af dem.