Piszę program, który musi generować wartości GEOID z danych Spisu Powszechnego 2000 i 2010, aby połączyć dane spisu z zapisami TIGER / Line. I ” m zaczynając od stanu, hrabstwa, bloku regionu, itp., wartości w plikach spisu GEO i potrzebuję utworzyć GEOID.
Muszę popracować ze wszystkimi poziomami podsumowania, a ponieważ struktura wartości GEOID wydaje się różnić w zależności od typu geografii, byłoby naprawdę fajnie mieć specyfikację do jej skonstruowania.
Udało mi się znaleźć ten dokument, ale określa on tylko strukturę GEOID dla plików redystrybucji:
http://www.census.gov/rdo/pdf/0GEOID_Construction_for_Matching.pdf
Chciałbym uzyskać to samo, ale na wszystkich poziomach podsumowania.
Rozważałem pobranie wszystkich plików Tiger i wyodrębnianie wartości GEOID10 i inżynieria wsteczna ich z rekordów dołączonych do plików shape, ale programowanie kosztowałoby więcej niż zwykłe płacenie komuś za zrobienie tego ręcznie poprzez sprawdzenie plików lub dokumentacji ( http://www.census.gov/geo/www/tiger/tgrshp2010/TGRSHP10SF1.pdf )
Czy są jakieś inne pomysły, jak najłatwiej wygenerować GEOID z plików GEO spisu dla wszystkich rekordów i poziomów podsumowań?
Alternatywnie, czy plik 0GEOID_Construction_for_Matching.pdf, który jest napisany dla plików redystrybucji, może być użyty jako specyfikacja dla poziomów podsumowania SF1 2010 i GEOID odpowiednich plików TIGERa?
Dzięki!
Komentarze
- Jak dotąd tak r później, najlepszym ' jaki udało mi się osiągnąć, jest odtworzenie kodu źródłowego z plików TIGERa. To ' jest żmudne, ale nie trudne.
Odpowiedź
Głosuj w dół, jeśli się mylę, ale GEOID jest konkatenacją szeregu pól, jak podano w dokumentacji zbiorczej na stronie 13. W obszarze geograficznym numery kierunkowe, będziesz szukać pól na pozycjach 26-65.
Komentarze
- To nie ' t odpowiedz na pytanie " dla wszystkich poziomów podsumowania. " Z drugiej strony ' jest zadziwiająco trudne do znalezienia listy " wszystkich poziomów podsumowania. " To jest najbliższa I ' znalezione w Spisie ludności factfinder2.census.gov/help/en/glossary/s/… To ma więcej, ale jest skompilowane poza spisem ludności mcdc2.missouri.edu/cgi-bin/browse?/pub/sasfmats/Ssumle v.sas @
Odpowiedź
Po kilku latach w końcu stworzyłem własny kod, zbudować schemat. Jednak obecnie jest on osadzony w bibliotece Pythona, więc nie jest generalnie użyteczny jako specyfikacja. Oto moduł geoidy, który analizuje i generuje geoidy Census, z wariantami formatów Census, Tiger i ACS:
https://github.com/CivicKnowledge/geoid.git
Jeśli jesteś biegły w programowaniu, możesz wyodrębnić wszystkie wymagane informacje z jednego z plików źródłowych, chociaż może być łatwiej po prostu użyć modułu w pythonie.
https://github.com/CivicKnowledge/geoid/blob/master/geoid/ init .py
segments
zawiera listy komponentów dla każdego z numerów poziomów podsumowania, a słownik lengths
ma długość w cyfrach dziesiętnych dla każdego ze składników. Zauważ, że kilka z długości są określane jako ciągi znaków; jest to sygnał, że komponent może przyjmować zarówno znaki, jak i cyfry.
Ten kod jest generowany z notatnika w języku Python, analizuje dane z pierwszego łącza w tej odpowiedzi.
https://github.com/CivicKnowledge/geoid/blob/master/support/GenerateNames.ipynb
Istnieje krótka specyfikacja niektórych geoidów w witrynie spisu ludności w sekcji „Struktura GEOID dla obszarów geograficznych”.
Odpowiedź
Tutaj można znaleźć proste wyjaśnienie kolumn, które należy połączyć w konkantenację, aby wygenerować identyfikatory geograficzne dla różnych obszarów geograficznych
https://www.census.gov/geo/reference/geoidentifiers.html
Komentarze
- Dzięki. To ' coraz bliżej, ale niestety nie jest ' nie wyczerpujące. Istnieje znacznie więcej poziomów podsumowania – co najmniej 209 z nich.