Skip to Main content Skip to Navigation
Journal articles

Integration of automatic spatial annotations from different sources by means of semantic technologies

Abstract : Integration of automatic spatial annotations from different sources by means of semantic technologies. Resumen La extracción de información es una de las tareas prin-cipales de la minería de textos que resulta de gran uti-lidad para todo tipo de aplicaciones que exploten la in-formación geográfica ya que hay gran cantidad de in-formación geográfica que no se recopila directamente en formatos reconocibles por Sistemas de Información Geográfica, sino directamente como texto plano. Ac-tualmente existen diversas soluciones informáticas para el procesamiento de textos y la anotación de en-tidades espaciales. Sin embargo, el problema que tie-nen estas herramientas es que producen como resul-tado de este procesamiento un texto anotado con len-guajes de marcado propio, que dificulta su integración en otros sistemas. El objetivo de este trabajo es pro-poner la conversión de la salida de estas herramientas a un lenguaje de anotación espacial común basado en tecnologías semánticas que facilite su integración e in-teroperabilidad. Como factor común de los lenguajes de marcado se propone una anotación de textos ba-sada en RDFa y utilizando el vocabulario de la inicia-tiva internacional Schema.org. Para validar la utilidad de esta propuesta se ha creado la infraestructura ne-cesaria para construir un repositorio semántico de do-cumentos donde se integren y armonicen las anotacio-nes generadas por diversas herramientas de anota-ción existentes. Palabras clave: Extracción de información. Integra-ción de datos. Información geográfica. Web semántica. RDFa. Schema.org. Abstract Information extraction is one of the main tasks in text mining, which is essential for all types of applications exploiting geographic information because there is a big volume of geographic information not directly compiled in specific formats proposed by Geographic Information Systems, but just embedded in plain text sources. Currently, there are several software solutions for the processing of texts and the annotation of spatial named entities. However, the problem of these tools is that their output is based on heterogeneous annotation languages, which make it difficult their integration in other systems. The objective of this work is to propose the conversion of the output of these tools into a common spatial annotation language based on semantic technologies to facilitate their integration and in-teroperability. As a common annotation language we propose the use of a text annotation based on RDFa and using the vocabulary proposed by the international initiative Schema.org. In order to validate this proposal, we have created the necessary infrastructure to build a semantic repository of documents, where the annotations generated by different annotation tools can be integrated and harmonized.
Document type :
Journal articles
Complete list of metadatas

Cited literature [19 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01396158
Contributor : Ludovic Moncla <>
Submitted on : Monday, November 14, 2016 - 10:14:40 AM
Last modification on : Wednesday, May 13, 2020 - 1:38:02 AM
Long-term archiving on: : Monday, March 20, 2017 - 7:22:11 PM

File

scire_nogueras2016.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-01396158, version 1

Collections

Citation

Javier Nogueras-Iso, Verónica Lázaro, Ludovic Moncla. Integration of automatic spatial annotations from different sources by means of semantic technologies. Scire: Representación y Organización del Conocimiento, Université de Zaragoza, 2016, 22 (2). ⟨hal-01396158⟩

Share

Metrics

Record views

170

Files downloads

186