Ik “ben een programma aan het schrijven dat GEOID-waarden moet genereren uit 2000 en 2010 Census-gegevens, om de census-gegevens te koppelen aan TIGER / Line-records. I” m beginnend met de staat, provincie, regioblok, enz., waarden in de volkstelling GEO-bestanden, en moeten GEOIDs maken.
Ik moet met alle samenvattingsniveaus werken, en aangezien de structuur van de GEOID-waarde lijkt te variëren afhankelijk van het type geografie, zou het erg leuk zijn om een specificatie te hebben om deze te construeren.
Ik heb dit document gevonden, maar het specificeert alleen de GEOID-structuur voor de herverdelende bestanden:
http://www.census.gov/rdo/pdf/0GEOID_Construction_for_Matching.pdf
Ik “zou graag hetzelfde willen krijgen, maar voor alle samenvattingsniveaus.
Ik heb overwogen om alle tijgerbestanden te downloaden en het extraheren van de GEOID10-waarden en ze reverse-engineering uit de records die aan de vormbestanden zijn gekoppeld, maar het programmeren zou meer kosten dan alleen iemand betalen om het handmatig te doen door de bestanden of de documentatie te inspecteren ( http://www.census.gov/geo/www/tiger/tgrshp2010/TGRSHP10SF1.pdf )
Nog andere ideeën om het gemakkelijkst GEOID te genereren op basis van GEO-bestanden voor volkstellingen, voor alle records en samenvattingsniveaus?
Kan als alternatief het 0GEOID_Construction_for_Matching.pdf-bestand, dat is geschreven voor de redistricting-bestanden, worden gebruikt als een specificatie voor de 2010 SF1-samenvattingsniveaus en de GEOIDs van de overeenkomstige TIGER-bestanden?
Bedankt!
Reacties
- Tot nu toe, ja Later is het beste dat ik ' heb weten te verbeteren door reverse-engineering uit de TIGER-bestanden. Het ' is vervelend, maar niet moeilijk.
Antwoord
Stem me af als ik het mis heb, maar de GEOID is een aaneenschakeling van een aantal velden, zoals vermeld in de samenvattingsdocumentatie op pagina 13. In de geografische netnummers, u “zult zoeken naar velden op posities 26-65.
Reacties
- Dit doet niet ' beantwoord de vraag " voor alle samenvattingsniveaus. " En nogmaals, het is ' is verrassend moeilijk om zelfs maar een lijst te vinden van " alle samenvattingsniveaus. " Dit is de dichtstbijzijnde I ' gevonden in Census factfinder2.census.gov/help/en/glossary/s/… Dit heeft meer, maar is gecompileerd buiten Census mcdc2.missouri.edu/cgi-bin/browse?/pub/sasfmats/Ssumle v.sas @
Answer
Na enkele jaren heb ik eindelijk mijn eigen code gemaakt om bouw een schema. Het is momenteel echter ingebed in een python-bibliotheek, dus het is over het algemeen niet bruikbaar als een specificatie. Hier is de geoïde module, die Census-geoïden parseert en genereert, met varianten voor de formaten Census, Tiger en ACS:
https://github.com/CivicKnowledge/geoid.git
Als je handig bent met programmeren, kun je alle vereiste informatie uit een van de bronbestanden, hoewel het misschien eenvoudiger is om de module in python te gebruiken.
https://github.com/CivicKnowledge/geoid/blob/master/geoid/ init .py
De segments
woordenboek heeft lijsten met componenten voor elk van de samenvattingsniveaus, en het lengths
woordenboek heeft de lengte in decimalen voor elk van de componenten. Merk op dat een paar van de lengtes worden gespecificeerd als strings; dit is een signaal dat de component zowel karakters als cijfers kan bevatten.
Deze code wordt gegenereerd vanuit een python-notebook dat een analyseert de gegevens van de eerste link in dit antwoord.
https://github.com/CivicKnowledge/geoid/blob/master/support/GenerateNames.ipynb
Er is een korte specificatie voor sommige geoïden op de censuswebsite in het gedeelte “GEOID-structuur voor geografische gebieden”.
Antwoord
Hier vindt u een eenvoudige uitleg voor de kolommen die u moet samenbrengen om de GeoIDs voor verschillende geografische gebieden te genereren
https://www.census.gov/geo/reference/geoidentifiers.html
Reacties
- Bedankt. Dat ' komt steeds dichterbij, maar is helaas niet ' t uitgebreid. Er zijn veel meer samenvattingsniveaus – minstens 209 van hen.