Sqlserver
 sql >> Base de données >  >> RDS >> Sqlserver

Comment obtenir les coordonnées de délimitation d'un code postal américain ?

Une élaboration de mon commentaire, que les codes postaux ne sont pas des polygones....

Nous considérons souvent les codes postaux comme des zones (polygones) parce que nous disons :"Oh, j'habite dans ce code postal..." qui donne l'impression d'une région contenante, et peut-être le fait que ZIP signifie "Zone Plan d'amélioration" aide la fausse association avec des polygones.

En réalité, les codes postaux sont des lignes qui représentent, en quelque sorte, les itinéraires des transporteurs de courrier. Géométriquement, les lignes n'ont pas d'aire. Tout comme les lignes sont des chaînes de points le long d'un plan de coordonnées, les lignes de code postal sont des chaînes de points de livraison dans l'espace abstrait des adresses désignées par USPS.

Ils ne sont pas corrélée aux coordonnées géographiques. Ce que vous trouverez, cependant, c'est qu'ils apparaissent être orienté géographiquement car il serait inefficace pour les transporteurs d'avoir un itinéraire complètement indépendant de la distance et de l'emplacement.

Qu'est-ce que cet "espace abstrait d'adresses désignées par USPS" ? C'est ainsi que je décris la vaste et mystérieuse base de données des emplacements livrables maintenue par le service postal américain. Les adresses ne sont pas attribuées en fonction de la géographie, mais des itinéraires empruntés par les transporteurs, ce qui est généralement lié aux rues et à la mobilité.

Certains codes postaux à 5 chiffres ne correspondent qu'à un seul bâtiment, ou à un complexe de bâtiments, ou même à un seul étage d'un bâtiment (oui, plusieurs codes postaux peuvent être à une seule coordonnée car leurs points de livraison sont superposés verticalement). Certains d'entre eux, entre autres, sont des ZIP "uniques". Les entreprises et les universités obtiennent souvent leurs propres codes postaux à des fins de marketing ou d'organisation. Par exemple, le code postal "12345" appartient à General Electric à Schenectady, NY. (Modifier :dans une version précédente de Google Maps, lorsque vous suiviez ce lien, vous remarquiez que le marqueur de placement planait, car il pointe vers un code postal, qui n'est pas une coordonnée. Alors que la plupart des codes postaux américains affichaient une région sur Google Maps, ces types ne peuvent pas parce que l'USPS ne les "possède" pas, pour ainsi dire, et ils n'ont pas de zone.)

Juste pour le plaisir, essayons de vérifier une adresse dans un code postal unique. Rendez-vous sur SmartyStreets et tapez une fausse adresse en 12345, comme :

Rue : 999 Sdf sdf

Code postal : 12345

Lorsque vous essayez de vérifier cela, notez que... c'est VALIDE ! Pourquoi? L'USPS livrera une pièce au réceptacle pour ce code postal unique, mais à ce stade, c'est à GE de le distribuer. Pratiquement tout ce qui est interne au code postal n'est pas pertinent pour l'USPS, y compris l'adresse postale (techniquement "ligne de livraison 1"). De nombreuses universités fonctionnent de manière similaire. Voici plus d'informations à ce sujet.

Maintenant, essayez la même fausse adresse, mais sans code postal, et faites plutôt la ville/l'état :

Rue : 999 Sdf sdf

Ville : Schenectady

État : NY

Ça ne valide pas. En effet, même si Schenectady contient 12345, où l'adresse est "valide", elle croise géométriquement les "vrais" codes postaux de Schenectady.

Prenons un autre exemple :militaire. Certains navires de la marine ont leurs propres codes postaux. Les adresses militaires sont une classe d'adresses entièrement différente utilisant le même espace de noms . Les navires bougent. Les coordonnées géographiques ne le font pas.

La précision ZIP en est une autre amusante. Les codes postaux à 5 chiffres sont les moins "précis" (bien que le terme "spécifique" puisse être plus significatif ici, puisque les codes postaux n'identifient rien). Les codes postaux à 7 et 9 chiffres sont les plus spécifiques, souvent au niveau du bloc ou du quartier dans les zones urbaines. Mais comme chaque code postal a une taille différente, c'est vraiment difficile pour savoir de quelles distances réelles vous parlez.

Un code postal à 9 chiffres peut être attribué à un étage d'un bâtiment, vous avez donc des codes postaux qui se chevauchent pour potentiellement des centaines d'adresses.

Conclusion :contrairement à la croyance populaire, les codes postaux ne fournissent pas de données géographiques ou de délimitation. Ils varient considérablement et sont en fait assez inutiles à moins que vous ne livriez du courrier ou des colis... mais le travail de l'USPS consistait à concevoir des itinéraires de transport efficaces, et non à diviser autant la population en régions coordonnées.

C'est plutôt le travail du bureau de recensement. Ils ont compilé une liste de limites cartographiques puisque les codes postaux sont "pratiques" pour travailler avec. Pour ce faire, ils ont sectionné des groupes d'adresses en blocs de recensement. Ensuite, ils ont agrégé les données de code postal USPS pour trouver la relation entre leurs blocs de recensement (qui ont des données de coordonnées approximatives) et les codes postaux. Ainsi, nous avons des approximations de ce à quoi cela ressemblerait de tracer une ligne sous forme de polygone. (Apparemment, ils ont converti une ligne 1D en un polygone 2D en transformant un polygone 2D en fonction de son contenu pour s'adapter aux données linéaires - pour chaque code postal régulier non unique.)

Depuis leur site Web (lien ci-dessus) :

Une zone de tabulation de code postal (ZCTA) est une entité géographique statistique qui se rapproche de la zone de livraison d'un code postal à cinq ou trois chiffres du service postal américain. Les ZCTA sont des agrégations de blocs de recensement qui ont le même code postal prédominant associé aux adresses dans le fichier principal d'adresses (MAF) du U.S. Census Bureau. Informations sur le code dans son MAF. Les ZCTA ne décrivent pas précisément les zones de livraison des codes postaux et n'incluent pas tous les codes postaux utilisés pour la livraison du courrier. Le U.S. CensusBureau a établi les ZCTA comme une nouvelle entité géographique similaire, mais remplaçant, les tabulations de données pour les codes postaux entreprises en conjonction avec les recensements de 1990 et antérieurs.

L'ensemble de données de l'USCB est incomplet et parfois inexact. Google a également encore des trous dans ses données (le 12345 est un assez bon exemple) - mais Google finira par le corriger en passant en revue chaque adresse et code postal à la main. Ils le font déjà, mais n'ont pas encore rendu toutes leurs données cartographiques parfaites. Naturellement, l'accès à ces données est limité aux termes de l'API, et il est très coûteux de les augmenter.

Phew. Je suis battu. J'espère que cela aide à clarifier les choses. Avis de non-responsabilité :j'étais développeur chez SmartyStreets. Plus d'informations sur le géocodage avec les données d'adresse.

Encore plus d'informations sur les codes postaux.