Jeg skriver et program som trenger å generere GEOID-verdier fra 2000 og 2010 Census data, for å koble tellingsdataene til TIGER / Line records. I » m begynner med staten, fylket, regionblokk osv., verdier i folketellingen GEO-filer, og trenger å opprette GEOIDer.
Jeg trenger å jobbe med alle sammendragsnivåene, og siden strukturen til GEOID-verdien ser ut til å variere avhengig av typen geografi, ville det vært veldig hyggelig å ha en spesifikasjon for å konstruere den.
Jeg fant dette dokumentet, men det spesifiserer bare GEOID-strukturen for omfordelingsfilene:
http://www.census.gov/rdo/pdf/0GEOID_Construction_for_Matching.pdf
Jeg vil gjerne få det samme, men for alle sammendragsnivåer.
Jeg har vurdert å laste ned alle tigerfilene og trekke ut GEOID10-verdiene og reverse engineering dem fra postene som er knyttet til formfilene, men programmeringen vil koste mer enn å bare betale noen for å gjøre det manuelt ved å inspisere filene eller dokumentasjonen ( http://www.census.gov/geo/www/tiger/tgrshp2010/TGRSHP10SF1.pdf )
Noen andre ideer for hvordan du enklest kan generere GEOID fra GEO-filer fra folketellingen, for alle poster og sammendragsnivåer?
Kan alternativt 0GEOID_Construction_for_Matching.pdf-filen, som er skrevet for omfordelingsfilene, brukes som spesifikasjon for SF1-sammendragsnivåene 2010 og GEOIDene til de tilsvarende TIGER-filene?
Takk!
Kommentarer
- Så langt er det ja senere, er det beste jeg ' har klart å konvertere fra TIGER-filene. Det ' er kjedelig, men ikke vanskelig.
Svar
Stem ned på meg hvis jeg tar feil, men GEOID er en sammenkobling av en haug med felt som nevnt i sammendragsfildokumentasjon på side 13. I det geografiske områdekoder, vil du lete etter felt på posisjon 26-65.
Kommentarer
- Dette ' t svar på spørsmålet " for alle sammendragsnivåer. " Så igjen, det ' er overraskende vanskelig å til og med finne en liste over " alle sammendragsnivåer. " Dette er det nærmeste jeg ' er funnet fra Census factfinder2.census.gov/help/en/glossary/s/… Dette har mer, men er samlet utenfor Census mcdc2.missouri.edu/cgi-bin/browse?/pub/sasfmats/Ssumle v.sas @
Svar
Etter flere år opprettet jeg endelig min egen kode til bygge et skjema. Imidlertid er den for tiden innebygd i et pythonbibliotek, så det er generelt ikke brukbart som en spesifikasjon. Her er geoidmodulen, som analyserer og genererer Census geoids, med varianter for Census, Tiger og ACS-formater:
https://github.com/CivicKnowledge/geoid.git
Hvis du er hendig med programmering, kan du trekke ut alt nødvendig informasjon fra en av kildefilene, selv om det kan være lettere å bare bruke modulen i python.
https://github.com/CivicKnowledge/geoid/blob/master/geoid/ init .py
segments
ordbok har lister over komponenter for hvert av sammendragsnivånumrene, og lengths
ordbok har lengden i desimaltall for hver av komponentene. Merk at noen av lengder er spesifisert som strenger; dette er et signal om at komponenten kan ta tegn, så vel som sifre.
Denne koden genereres fra en python-notatbok som nalyserer dataene fra den første lenken i dette svaret.
https://github.com/CivicKnowledge/geoid/blob/master/support/GenerateNames.ipynb
Det er en kort spesifikasjon for noen geoider på nettstedet for folketellingen i delen «GEOID-struktur for geografiske områder».
Svar
Her finner du en enkel forklaring på kolonnene som du må samkante for å generere GeoID for forskjellige geografiske områder
https://www.census.gov/geo/reference/geoidentifiers.html
Kommentarer
- Takk. At ' nærmer seg, men er dessverre ikke ' t omfattende. Det er mange flere sammendragsnivåer – minst 209 av dem.