Ich schreibe ein Programm, das GEOID-Werte aus Volkszählungsdaten 2000 und 2010 generieren muss, um die Volkszählungsdaten mit TIGER / Line-Datensätzen zu verknüpfen. I “ Ich beginne mit den Werten für Bundesstaat, Landkreis, Region usw. in den GEO-Volkszählungsdateien und muss GEOIDs erstellen.
Ich muss mit allen Zusammenfassungsebenen arbeiten, und da die Struktur des GEOID-Werts je nach Art der Geografie zu variieren scheint, wäre es wirklich schön, eine Spezifikation für die Erstellung zu haben.
Ich habe dieses Dokument gefunden, aber es gibt nur die GEOID-Struktur für die Umverteilung von Dateien an:
http://www.census.gov/rdo/pdf/0GEOID_Construction_for_Matching.pdf
Ich möchte das Gleiche erhalten, aber für alle Zusammenfassungsebenen.
Ich habe überlegt, alle Tigerdateien und herunterzuladen Das Extrahieren der GEOID10-Werte und das Reverse Engineering aus den an die Formdateien angehängten Datensätzen würde jedoch mehr kosten, als nur jemanden dafür zu bezahlen, dies manuell durch Überprüfen der Dateien oder der Dokumentation zu tun ( http://www.census.gov/geo/www/tiger/tgrshp2010/TGRSHP10SF1.pdf )
Gibt es weitere Ideen, wie GEOID am einfachsten aus GEO-Volkszählungsdateien für alle Datensätze und Zusammenfassungsebenen generiert werden kann?
Kann alternativ die Datei 0GEOID_Construction_for_Matching.pdf, die für die Umverteilungsdateien geschrieben wurde, als Spezifikation für die SF1-Zusammenfassungsebenen 2010 und die GEOIDs der entsprechenden TIGER-Dateien verwendet werden?
Danke!
Kommentare
- Bisher ein Ja r später ist das Beste, was ich ' geschafft habe, das Reverse Engineering von den TIGER-Dateien. ' ist mühsam, aber nicht schwer.
Antwort
Stimmen Sie mich ab, wenn ich falsch liege, aber die GEOID ist eine Verkettung einer Reihe von Feldern, wie in der -Dokumentation der Zusammenfassungsdatei auf Seite 13 angegeben Vorwahlen, Sie werden nach Feldern an den Positionen 26-65 suchen.
Kommentare
- Dies ist nicht ' Beantworte die Frage " für alle Zusammenfassungsebenen nicht. " Andererseits ' Es ist überraschend schwierig, eine Liste von " allen Zusammenfassungsebenen zu finden. " Dies ist die nächstgelegene I ' aus der Volkszählung gefunden factfinder2.census.gov/help/en/glossary/s/… Dies hat mehr, wird jedoch außerhalb der Volkszählung mcdc2.missouri.edu/cgi-bin/browse?/pub/sasfmats/Ssumle kompiliert v.sas @
Antwort
Nach einigen Jahren habe ich endlich meinen eigenen Code für erstellt Erstellen Sie ein Schema. Derzeit ist es jedoch in eine Python-Bibliothek eingebettet, sodass es im Allgemeinen nicht als Spezifikation verwendet werden kann. Hier ist das Geoid-Modul, das Census-Geoide analysiert und generiert, mit Varianten für die Formate Census, Tiger und ACS:
https://github.com/CivicKnowledge/geoid.git
Wenn Sie mit der Programmierung vertraut sind, können Sie alle extrahieren erforderliche Informationen aus einer der Quelldateien, obwohl es möglicherweise einfacher ist, das Modul nur in Python zu verwenden.
https://github.com/CivicKnowledge/geoid/blob/master/geoid/ init .py
Die segments
-Wörterbuch enthält Listen mit Komponenten für jede der Zahlen auf Zusammenfassungsebene, und das lengths
-Wörterbuch hat die Länge in Dezimalstellen für jede der Komponenten. Beachten Sie, dass einige der Längen werden als Zeichenfolgen angegeben. Dies ist ein Signal, dass die Komponente sowohl Zeichen als auch Ziffern aufnehmen kann.
Dieser Code wird aus einem Python-Notizbuch generiert, das a analysiert die Daten des ersten Links in dieser Antwort.
https://github.com/CivicKnowledge/geoid/blob/master/support/GenerateNames.ipynb
Für einige Geoide gibt es eine kurze Spezifikation auf der Volkszählungswebsite im Abschnitt „GEOID-Struktur für geografische Gebiete“.
Antwort
Hier finden Sie eine einfache Erklärung für die Spalten, die Sie konkantenieren müssen, um die GeoIDs für verschiedene geografische Gebiete zu generieren
https://www.census.gov/geo/reference/geoidentifiers.html
Kommentare
- Danke. Das ' rückt näher, ist aber leider nicht ' nicht umfassend. Es gibt viel mehr Zusammenfassungsebenen – mindestens 209 davon.