Piszę program, który musi generować wartości GEOID z danych Spisu Powszechnego 2000 i 2010, aby połączyć dane spisu z zapisami TIGER / Line. I ” m zaczynając od stanu, hrabstwa, bloku regionu, itp., wartości w plikach spisu GEO i potrzebuję utworzyć GEOID.

Muszę popracować ze wszystkimi poziomami podsumowania, a ponieważ struktura wartości GEOID wydaje się różnić w zależności od typu geografii, byłoby naprawdę fajnie mieć specyfikację do jej skonstruowania.

Udało mi się znaleźć ten dokument, ale określa on tylko strukturę GEOID dla plików redystrybucji:

http://www.census.gov/rdo/pdf/0GEOID_Construction_for_Matching.pdf

Chciałbym uzyskać to samo, ale na wszystkich poziomach podsumowania.

Rozważałem pobranie wszystkich plików Tiger i wyodrębnianie wartości GEOID10 i inżynieria wsteczna ich z rekordów dołączonych do plików shape, ale programowanie kosztowałoby więcej niż zwykłe płacenie komuś za zrobienie tego ręcznie poprzez sprawdzenie plików lub dokumentacji ( http://www.census.gov/geo/www/tiger/tgrshp2010/TGRSHP10SF1.pdf )

Czy są jakieś inne pomysły, jak najłatwiej wygenerować GEOID z plików GEO spisu dla wszystkich rekordów i poziomów podsumowań?

Alternatywnie, czy plik 0GEOID_Construction_for_Matching.pdf, który jest napisany dla plików redystrybucji, może być użyty jako specyfikacja dla poziomów podsumowania SF1 2010 i GEOID odpowiednich plików TIGERa?

Dzięki!

Komentarze

  • Jak dotąd tak r później, najlepszym ' jaki udało mi się osiągnąć, jest odtworzenie kodu źródłowego z plików TIGERa. To ' jest żmudne, ale nie trudne.

Odpowiedź

Głosuj w dół, jeśli się mylę, ale GEOID jest konkatenacją szeregu pól, jak podano w dokumentacji zbiorczej na stronie 13. W obszarze geograficznym numery kierunkowe, będziesz szukać pól na pozycjach 26-65.

Komentarze

Odpowiedź

Po kilku latach w końcu stworzyłem własny kod, zbudować schemat. Jednak obecnie jest on osadzony w bibliotece Pythona, więc nie jest generalnie użyteczny jako specyfikacja. Oto moduł geoidy, który analizuje i generuje geoidy Census, z wariantami formatów Census, Tiger i ACS:

https://github.com/CivicKnowledge/geoid.git

Jeśli jesteś biegły w programowaniu, możesz wyodrębnić wszystkie wymagane informacje z jednego z plików źródłowych, chociaż może być łatwiej po prostu użyć modułu w pythonie.

https://github.com/CivicKnowledge/geoid/blob/master/geoid/ init .py

segments zawiera listy komponentów dla każdego z numerów poziomów podsumowania, a słownik lengths ma długość w cyfrach dziesiętnych dla każdego ze składników. Zauważ, że kilka z długości są określane jako ciągi znaków; jest to sygnał, że komponent może przyjmować zarówno znaki, jak i cyfry.

Ten kod jest generowany z notatnika w języku Python, analizuje dane z pierwszego łącza w tej odpowiedzi.

https://github.com/CivicKnowledge/geoid/blob/master/support/GenerateNames.ipynb

Istnieje krótka specyfikacja niektórych geoidów w witrynie spisu ludności w sekcji „Struktura GEOID dla obszarów geograficznych”.

Odpowiedź

Tutaj można znaleźć proste wyjaśnienie kolumn, które należy połączyć w konkantenację, aby wygenerować identyfikatory geograficzne dla różnych obszarów geograficznych

https://www.census.gov/geo/reference/geoidentifiers.html

Komentarze

  • Dzięki. To ' coraz bliżej, ale niestety nie jest ' nie wyczerpujące. Istnieje znacznie więcej poziomów podsumowania – co najmniej 209 z nich.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *