Píšu program, který potřebuje generovat hodnoty GEOID z údajů ze sčítání lidu z let 2000 a 2010, aby bylo možné údaje ze sčítání propojit se záznamy TIGER / Line. I “ m počínaje stavem, krajem, blokem regionu atd., hodnotami v souborech sčítání GEO a je třeba vytvořit GEOID.
Musím pracovat se všemi souhrnnými úrovněmi a protože struktura hodnoty GEOID se zdá odlišná v závislosti na typu geografie, bylo by opravdu hezké mít specifika pro její konstrukci.
Našel jsem tento dokument, ale určuje pouze strukturu GEOID pro redistriktivní soubory:
http://www.census.gov/rdo/pdf/0GEOID_Construction_for_Matching.pdf
Chtěl bych získat totéž, ale pro všechny souhrnné úrovně.
Zvažoval jsem stažení všech tygřích souborů a extrahování hodnot GEOID10 a jejich reverzní inženýrství ze záznamů připojených k souborům tvarů, ale programování by stálo víc než pouhé zaplacení někomu, kdo to provede ručně, kontrolou souborů nebo dokumentace ( http://www.census.gov/geo/www/tiger/tgrshp2010/TGRSHP10SF1.pdf )
Nějaké další nápady, jak nejsnadněji vygenerovat GEOID ze sčítání GEO souborů pro všechny záznamy a souhrnné úrovně?
Alternativně lze použít soubor 0GEOID_Construction_for_Matching.pdf, který je napsán pro redistrikční soubory, jako specifikace pro souhrnné úrovně SF1 2010 a GEOID odpovídajících souborů TIGER?
Děkujeme!
Komentáře
- Zatím ano později je nejlepší, co se mi ' podařilo, je zpětná analýza ze souborů TIGER. Je to ' zdlouhavé, ale ne těžké.
Odpovědět
Pokud se mýlím, hlasujte proti mě, ale GEOID je zřetězením řady polí, jak je uvedeno v souhrnné dokumentaci souborů na straně 13. V geografickém předvolby, budete hledat pole na pozicích 26–65.
Komentáře
- Toto ' t neodpovídá na otázku " pro všechny souhrnné úrovně. " A pak znovu ' je překvapivě těžké najít ani seznam " všech souhrnných úrovní. " Toto je nejbližší I ' našel jsem ze sčítání factfinder2.census.gov/help/en/glossary/s/… This has more, but is compiled outside of Census mcdc2.missouri.edu/cgi-bin/browse?/pub/sasfmats/Ssumle v.sas @
Odpověď
Po několika letech jsem konečně vytvořil svůj vlastní kód vytvořit schéma. Aktuálně je však zabudován v knihovně pythonu, takže jej nelze použít jako specifikaci. Zde je geoidní modul, který analyzuje a generuje sčítání geoidů, s variantami pro formáty Census, Tiger a ACS:
https://github.com/CivicKnowledge/geoid.git
Máte-li zkušenosti s programováním, můžete extrahovat všechny požadované informace z jednoho ze zdrojových souborů, i když může být jednodušší použít modul v pythonu.
https://github.com/CivicKnowledge/geoid/blob/master/geoid/ init .py
segments
obsahuje seznamy komponent pro každé z čísel na souhrnné úrovni a slovník lengths
má délku každé desítkové číslice pro každou z komponent. Upozorňujeme, že několik z délky jsou specifikovány jako řetězce; toto je signál, že komponenta může mít znaky i číslice.
Tento kód je generován z poznámkového bloku pythonu, který nalyzuje data z prvního odkazu v této odpovědi.
https://github.com/CivicKnowledge/geoid/blob/master/support/GenerateNames.ipynb
U některých geoidů existuje krátká specifikace na webových stránkách sčítání lidu v části „Struktura GEOID pro geografické oblasti“.
Odpověď
Zde najdete jednoduché vysvětlení sloupců, které musíte zřetězit, abyste vygenerovali GeoID pro různé geografické oblasti
https://www.census.gov/geo/reference/geoidentifiers.html
Komentáře
- Díky. ' se blíží, ale bohužel není ' komplexní. Souhrnných úrovní je mnohem více – alespoň 209 z nich.