Geocodificación

Compartir Imprimir Citar

La geocodificación de direcciones, o simplemente geocodificación, es el proceso de tomar una descripción basada en texto de una ubicación, como una dirección o el nombre de un lugar, y devolver coordenadas geográficas, con frecuencia un par de latitud/longitud, para identificar una ubicación en la Tierra. superficie. La geocodificación inversa, por otro lado, convierte las coordenadas geográficas en una descripción de una ubicación, generalmente el nombre de un lugar o una ubicación direccionable. La geocodificación se basa en una representación informática de los puntos de dirección, la red de calles/carreteras, junto con los límites postales y administrativos.

Las coordenadas geográficas que representan ubicaciones a menudo varían mucho en la precisión posicional. Los ejemplos incluyen centroides de edificios, centroides de parcelas de terreno, ubicaciones interpoladas basadas en rangos de carreteras, centroides de segmentos de calles, centroides de códigos postales (p. ej., códigos postales, CEDEX) y centroides de divisiones administrativas.

Historia

La geocodificación, un subconjunto del análisis espacial del Sistema de Información Geográfica (SIG), ha sido un tema de interés desde principios de la década de 1960.

1960

En 1960, el Dr. Roger Tomlinson, quien desde entonces ha sido reconocido como el padre de los SIG, inventó el primer SIG operativo, denominado Sistema de Información Geográfica de Canadá (CGIS). El CGIS se usó para almacenar y analizar los datos recopilados para el Inventario de tierras de Canadá, que mapeó información sobre agricultura, vida silvestre y silvicultura a una escala de 1:50 000, para regular la capacidad de la tierra en las zonas rurales de Canadá. Sin embargo, el CGIS duró hasta la década de 1990 y nunca estuvo disponible comercialmente.

El 1 de julio de 1963, el Departamento de Correos de los Estados Unidos (USPOD) introdujo códigos postales de cinco dígitos en todo el país. En 1983, se introdujeron los códigos ZIP+4 de nueve dígitos como un identificador adicional para ubicar direcciones con mayor precisión.

En 1964, el Laboratorio de Gráficos por Computadora y Análisis Espacial de Harvard desarrolló un código de software innovador, por ejemplo, GRID y SYMAP, todos los cuales fueron fuentes para el desarrollo comercial de GIS.

En 1967, un equipo de la Oficina del Censo, que incluía al matemático James Corbett y Donald Cooke, inventó la codificación de mapa dual independiente (DIME), el primer modelo moderno de mapeo vectorial, que cifraba los rangos de direcciones en los archivos de la red de calles e incorporaba el "porcentaje a lo largo". algoritmo de geocodificación.Todavía en uso por plataformas como Google Maps y MapQuest, el algoritmo "porcentaje a lo largo" indica dónde se encuentra una dirección coincidente a lo largo de una función de referencia como un porcentaje de la longitud total de la función de referencia. DIME fue diseñado para el uso de la Oficina del Censo de los Estados Unidos e implicó mapear con precisión las caras de los bloques, digitalizar los nodos que representan las intersecciones de calles y formar relaciones espaciales. New Haven, Connecticut, fue la primera ciudad en la Tierra con una base de datos de redes de calles geocodificables.

1980

A fines de la década de 1970, se estaban desarrollando dos plataformas principales de geocodificación de dominio público: GRASS GIS y MOSS. A principios de la década de 1980, surgieron muchos más proveedores comerciales de software de geocodificación, a saber, Intergraph, ESRI, CARIS, ERDAS y MapInfo Corporation. Estas plataformas fusionaron el enfoque de la década de 1960 de separar la información espacial con el enfoque de organizar esta información espacial en estructuras de bases de datos.

En 1986, Mapping Display and Analysis System (MIDAS) se convirtió en el primer software de geocodificación de escritorio, diseñado para el sistema operativo DOS. La codificación geográfica pasó del departamento de investigación al mundo de los negocios con la adquisición de MIDAS por parte de MapInfo. Desde entonces, MapInfo ha sido adquirida por Pitney Bowes y ha sido pionera en fusionar la codificación geográfica con la inteligencia comercial; permitiendo que la inteligencia de ubicación brinde soluciones para los sectores público y privado.

1990

A fines del siglo XX, la geocodificación se volvió más orientada al usuario, especialmente a través del software GIS de código abierto. Las aplicaciones cartográficas y los datos geoespaciales se han vuelto más accesibles a través de Internet.

Debido a que la técnica de envío/devolución por correo tuvo tanto éxito en el Censo de 1980, la Oficina del Censo de EE. UU. pudo armar una gran base de datos geoespacial, utilizando la geocodificación interpolada de calles. Esta base de datos, junto con la cobertura nacional de hogares del Censo, permitió el nacimiento de TIGER (Codificación y referencia geográfica integrada topológicamente).

TIGER, que contiene rangos de direcciones en lugar de direcciones individuales, se ha implementado desde entonces en casi todas las plataformas de software de geocodificación que se utilizan en la actualidad. A finales del censo de 1990, TIGER "contenía una coordenada de latitud/longitud para más de 30 millones de intersecciones y extremos de características y casi 145 millones de puntos de 'forma' de características que definían los más de 42 millones de segmentos de características que delineaban más de 12 millones polígonos".

TIGER fue el gran avance para las soluciones geoespaciales de "grandes datos".

Años 2000

A principios de la década de 2000, se produjo el surgimiento de la estandarización de direcciones del Sistema de soporte de precisión de codificación (CASS). La certificación CASS se ofrece a todos los proveedores de software y remitentes publicitarios que desean que el Servicio Postal de los Estados Unidos (USPS) evalúe la calidad de su software de estandarización de direcciones. La certificación CASS, que se renueva anualmente, se basa en códigos de puntos de entrega, códigos postales y códigos postales+4. La adopción de un software certificado por CASS por parte de los proveedores de software les permite recibir descuentos en los costos de envío y envío masivo. Pueden beneficiarse de una mayor precisión y eficiencia en esos envíos masivos, después de tener una base de datos certificada. A principios de la década de 2000, las plataformas de geocodificación también podían admitir múltiples conjuntos de datos.

En 2003, las plataformas de geocodificación fueron capaces de fusionar códigos postales con datos de calles, actualizados mensualmente. Este proceso se conoció como "combinación".

A partir de 2005, las plataformas de geocodificación incluyeron geocodificación de centroide de parcela. La geocodificación de centroide de parcela permitió mucha precisión en la geocodificación de una dirección. Por ejemplo, el centroide de parcela permitía que un geocodificador determinara el centroide de un edificio específico o un lote de terreno. Las plataformas ahora también podían determinar la elevación de parcelas específicas.

2005 también vio la introducción del Número de Parcela del Tasador (APN). El tasador de impuestos de una jurisdicción pudo asignar este número a parcelas de bienes raíces. Esto permitió una identificación adecuada y el mantenimiento de registros. Un APN es importante para geocodificar un área que está cubierta por un contrato de arrendamiento de gas o petróleo e indexar la información de impuestos a la propiedad proporcionada al público.

En 2006, la geocodificación inversa y la búsqueda inversa de APN se introdujeron en las plataformas de geocodificación. Esto implicaba geocodificar una ubicación de punto numérico, con una longitud y una latitud, en una dirección textual y legible.

2008 y 2009 vieron el crecimiento de las plataformas de geocodificación interactivas y orientadas al usuario, a saber, MapQuest, Google Maps, Bing Maps y Global Positioning Systems (GPS). Estas plataformas se hicieron aún más accesibles al público con el crecimiento simultáneo de la industria móvil, específicamente los teléfonos inteligentes.

2010s

En la década de 2010, los proveedores admitieron completamente la geocodificación y la geocodificación inversa a nivel mundial. La interfaz de programación de aplicaciones (API) de geocodificación basada en la nube y la geocodificación local han permitido una mayor tasa de coincidencia, mayor precisión y mayor velocidad. Ahora hay una popularidad en la idea de que la geocodificación pueda influir en las decisiones comerciales. Esta es la integración entre el proceso de geocodificación y la inteligencia comercial.

El futuro de la geocodificación también implica la geocodificación tridimensional, la geocodificación en interiores y los retornos en varios idiomas para las plataformas de geocodificación.

Proceso de geocodificación

La geocodificación es una tarea que involucra múltiples conjuntos de datos y procesos, todos los cuales trabajan juntos. Un geocodificador consta de dos componentes importantes: un conjunto de datos de referencia y el algoritmo de geocodificación. Cada uno de estos componentes se compone de suboperaciones y subcomponentes. Sin comprender cómo funcionan estos procesos de geocodificación, es difícil tomar decisiones comerciales informadas basadas en la geocodificación.

Los datos de entrada

Los datos de entrada son la información descriptiva y textual (dirección o nombre del edificio) que el usuario desea convertir en datos numéricos y espaciales (latitud y longitud), a través del proceso de geocodificación.

Clasificación de los datos de entrada

Los datos de entrada se clasifican en dos categorías: datos de entrada relativos y datos de entrada absolutos.

Datos de entrada relativos

Los datos de entrada relativos son las descripciones textuales de una ubicación que, por sí solas, no pueden generar una representación espacial de esa ubicación. Dichos datos generan un geocódigo relativo, que depende y es geográficamente relativo a otras ubicaciones de referencia. Un ejemplo de un geocódigo relativo es la interpolación de direcciones utilizando unidades de área o vectores de línea. "Al otro lado de la calle del Empire State Building" es un ejemplo de datos de entrada relativos. La ubicación que se busca no se puede determinar sin identificar el Empire State Building. Las plataformas de geocodificación a menudo no admiten tales ubicaciones relativas, pero se están logrando avances en esta dirección.

Datos de entrada absolutos

Los datos de entrada absolutos son las descripciones textuales de una ubicación que, por sí solas, pueden generar una representación espacial de esa ubicación. Este tipo de datos genera una ubicación conocida absoluta independientemente de otras ubicaciones. Por ejemplo, códigos postales de USPS; USPS ZIP+4 códigos; direcciones postales completas y parciales; Apartados postales de USPS; rutas rurales; ciudades; condados; intersecciones; y los lugares con nombre se pueden referenciar absolutamente en una fuente de datos.

Cuando hay mucha variabilidad en la forma en que se pueden representar las direcciones, como demasiados datos de entrada o muy pocos datos de entrada, los geocodificadores utilizan la normalización de direcciones y la estandarización de direcciones para resolver este problema.

Interpolación de direcciones

Un método simple de geocodificación es la interpolación de direcciones. Este método utiliza datos de un sistema de información geográfica de calles donde la red de calles ya está mapeada dentro del espacio de coordenadas geográficas. A cada segmento de calle se le atribuyen rangos de direcciones (por ejemplo, números de casas de un segmento al siguiente). La codificación geográfica toma una dirección, la hace coincidir con una calle y un segmento específico (como un bloque, en ciudades que usan la convención de "bloque"). Luego, la codificación geográfica interpola la posición de la dirección, dentro del rango a lo largo del segmento.

Ejemplo

Tomemos por ejemplo: 742 Evergreen Terrace

Digamos que este segmento (por ejemplo, una cuadra) de Evergreen Terrace va del 700 al 799. Las direcciones con números pares caen en el lado este de Evergreen Terrace, con las direcciones con números impares en el lado oeste de la calle. 742 Evergreen Terrace estaría (probablemente) ubicado un poco menos de la mitad de la cuadra, en el lado este de la calle. Se mapearía un punto en esa ubicación a lo largo de la calle, tal vez compensado una distancia al este de la línea central de la calle.

Factores que complican

Sin embargo, este proceso no siempre es tan sencillo como en este ejemplo. Las dificultades surgen cuando

Si bien podría haber un 742 Evergreen Terrace en Springfield, también podría haber un 742 Evergreen Terrace en Shelbyville. Solicitar el nombre de la ciudad (y estado, provincia, país, etc., según sea necesario) puede resolver este problema. Boston, Massachusetts tiene varias ubicaciones de "100 Washington Street" porque se han anexado varias ciudades sin cambiar los nombres de las calles, lo que requiere el uso de códigos postales únicos o nombres de distrito para la desambiguación. La precisión de la codificación geográfica se puede mejorar en gran medida utilizando primero buenas prácticas de verificación de direcciones. La verificación de la dirección confirmará la existencia de la dirección y eliminará las ambigüedades. Una vez que se determina la dirección válida, es muy fácil geocodificar y determinar las coordenadas de latitud/longitud. Finalmente, varias advertencias sobre el uso de la interpolación:

Un error muy común es creer en las calificaciones de precisión de los atributos geocodificables de un mapa dado. La precisión citada por los proveedores no influye en que una dirección se atribuya al segmento correcto o al lado correcto del segmento, ni da como resultado una posición precisa a lo largo de ese segmento correcto. Con el proceso de codificación geográfica utilizado para los conjuntos de datos TIGER del censo de EE. UU., entre el 5 y el 7,5 % de las direcciones pueden asignarse a un distrito censal diferente, mientras que un estudio del sistema similar al TIGER de Australia encontró que el 50 % de los puntos codificados geográficamente se asignaron a la propiedad incorrecta terreno. La precisión de los datos geocodificados también puede influir en la calidad de la investigación que utiliza estos datos. Un estudiopor un grupo de investigadores de Iowa descubrió que el método común de geocodificación que usa conjuntos de datos TIGER como se describió anteriormente, puede causar una pérdida de hasta el 40% del poder de un análisis estadístico. Una alternativa es utilizar ortofotos o datos codificados con imágenes, como los datos de punto de dirección de Ordnance Survey en el Reino Unido, pero dichos conjuntos de datos suelen ser costosos.

Debido a esto, es muy importante evitar el uso de resultados interpolados excepto para aplicaciones no críticas. La geocodificación interpolada generalmente no es adecuada para tomar decisiones autorizadas, por ejemplo, si la seguridad de la vida se verá afectada por esa decisión. Los servicios de emergencia, por ejemplo, no toman una decisión autoritativa basada en sus interpolaciones; siempre se enviará una ambulancia o un camión de bomberos, independientemente de lo que diga el mapa.

Otras técnicas

En áreas rurales u otros lugares que carecen de datos y direccionamiento de la red de calles de alta calidad, el GPS es útil para mapear una ubicación. Para los accidentes de tráfico, la geocodificación de una intersección de calles o un punto medio a lo largo de la línea central de una calle es una técnica adecuada. La mayoría de las carreteras en los países desarrollados tienen marcadores de millas para ayudar en la respuesta de emergencia, el mantenimiento y la navegación. También es posible usar una combinación de estas técnicas de geocodificación, usando una técnica particular para ciertos casos y situaciones y otras técnicas para otros casos. En contraste con la geocodificación de registros de direcciones postales estructurados, la resolución de topónimos asigna nombres de lugares en colecciones de documentos no estructurados a sus huellas espaciales correspondientes.

Los códigos de lugar ofrecen una nueva forma de crear direcciones generadas digitalmente donde no existe información utilizando imágenes satelitales y aprendizaje automático, por ejemplo, Robocodes.

Investigar

La investigación ha introducido un nuevo enfoque para los aspectos de control y conocimiento de la geocodificación, mediante el uso de un paradigma basado en agentes. Además del nuevo paradigma de geocodificación, se han desarrollado técnicas de corrección y algoritmos de control adicionales. El enfoque representa los elementos geográficos que se encuentran comúnmente en las direcciones como agentes individuales. Esto proporciona una similitud y dualidad para el control y la representación geográfica. Además de la publicación científica, el nuevo enfoque y el prototipo subsiguiente ganaron cobertura mediática nacional en Australia. La investigación se llevó a cabo en la Universidad de Curtin en Perth, Australia Occidental.

Con el avance reciente en Deep Learning y Computer Vision, se ha propuesto un nuevo flujo de trabajo de geocodificación que aprovecha las técnicas de detección de objetos para extraer directamente el centroide de los techos de los edificios como salida de geocodificación.

Usos

Las ubicaciones geocodificadas son útiles en muchos análisis GIS, cartografía, flujo de trabajo de toma de decisiones, combinación de transacciones o se inyectan en procesos comerciales más grandes. En la web, la codificación geográfica se usa en servicios como el enrutamiento y la búsqueda local. La geocodificación, junto con el GPS, proporciona datos de ubicación para geoetiquetar medios, como fotografías o elementos RSS.

Preocupaciones sobre la privacidad

La proliferación y la facilidad de acceso a los servicios de geocodificación (y geocodificación inversa) plantea problemas de privacidad. Por ejemplo, en el mapeo de incidentes delictivos, las agencias de aplicación de la ley tienen como objetivo equilibrar los derechos de privacidad de las víctimas y los delincuentes, con el derecho del público a saber. Los organismos encargados de hacer cumplir la ley han experimentado con técnicas alternativas de codificación geográfica que les permiten enmascarar una parte de los detalles de la ubicación (p. ej., direcciones específicas que conducirían a la identificación de una víctima o un delincuente). Además, al proporcionar al público cartografía de la delincuencia en línea, también colocan descargos de responsabilidad con respecto a la precisión de ubicación de los puntos en el mapa, reconocen estas técnicas de enmascaramiento de ubicación e imponen términos de uso para la información.