Píšu program, který potřebuje generovat hodnoty GEOID z údajů ze sčítání lidu z let 2000 a 2010, aby bylo možné údaje ze sčítání propojit se záznamy TIGER / Line. I “ m počínaje stavem, krajem, blokem regionu atd., hodnotami v souborech sčítání GEO a je třeba vytvořit GEOID.

Musím pracovat se všemi souhrnnými úrovněmi a protože struktura hodnoty GEOID se zdá odlišná v závislosti na typu geografie, bylo by opravdu hezké mít specifika pro její konstrukci.

Našel jsem tento dokument, ale určuje pouze strukturu GEOID pro redistriktivní soubory:

http://www.census.gov/rdo/pdf/0GEOID_Construction_for_Matching.pdf

Chtěl bych získat totéž, ale pro všechny souhrnné úrovně.

Zvažoval jsem stažení všech tygřích souborů a extrahování hodnot GEOID10 a jejich reverzní inženýrství ze záznamů připojených k souborům tvarů, ale programování by stálo víc než pouhé zaplacení někomu, kdo to provede ručně, kontrolou souborů nebo dokumentace ( http://www.census.gov/geo/www/tiger/tgrshp2010/TGRSHP10SF1.pdf )

Nějaké další nápady, jak nejsnadněji vygenerovat GEOID ze sčítání GEO souborů pro všechny záznamy a souhrnné úrovně?

Alternativně lze použít soubor 0GEOID_Construction_for_Matching.pdf, který je napsán pro redistrikční soubory, jako specifikace pro souhrnné úrovně SF1 2010 a GEOID odpovídajících souborů TIGER?

Děkujeme!

Komentáře

  • Zatím ano později je nejlepší, co se mi ' podařilo, je zpětná analýza ze souborů TIGER. Je to ' zdlouhavé, ale ne těžké.

Odpovědět

Pokud se mýlím, hlasujte proti mě, ale GEOID je zřetězením řady polí, jak je uvedeno v souhrnné dokumentaci souborů na straně 13. V geografickém předvolby, budete hledat pole na pozicích 26–65.

Komentáře

Odpověď

Po několika letech jsem konečně vytvořil svůj vlastní kód vytvořit schéma. Aktuálně je však zabudován v knihovně pythonu, takže jej nelze použít jako specifikaci. Zde je geoidní modul, který analyzuje a generuje sčítání geoidů, s variantami pro formáty Census, Tiger a ACS:

https://github.com/CivicKnowledge/geoid.git

Máte-li zkušenosti s programováním, můžete extrahovat všechny požadované informace z jednoho ze zdrojových souborů, i když může být jednodušší použít modul v pythonu.

https://github.com/CivicKnowledge/geoid/blob/master/geoid/ init .py

segments obsahuje seznamy komponent pro každé z čísel na souhrnné úrovni a slovník lengths má délku každé desítkové číslice pro každou z komponent. Upozorňujeme, že několik z délky jsou specifikovány jako řetězce; toto je signál, že komponenta může mít znaky i číslice.

Tento kód je generován z poznámkového bloku pythonu, který nalyzuje data z prvního odkazu v této odpovědi.

https://github.com/CivicKnowledge/geoid/blob/master/support/GenerateNames.ipynb

U některých geoidů existuje krátká specifikace na webových stránkách sčítání lidu v části „Struktura GEOID pro geografické oblasti“.

Odpověď

Zde najdete jednoduché vysvětlení sloupců, které musíte zřetězit, abyste vygenerovali GeoID pro různé geografické oblasti

https://www.census.gov/geo/reference/geoidentifiers.html

Komentáře

  • Díky. ' se blíží, ale bohužel není ' komplexní. Souhrnných úrovní je mnohem více – alespoň 209 z nich.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *