Actions
  • shareshare
  • link
  • cite
  • add
add
auto_awesome_motion View all 4 versions
Publication . Conference object . 2019

From massive databases to Web of data: disambiguation and alignment of geographical entities in scientific texts

Pascal Cuxac; Alain Collignon; Stéphanie Gregorio; François Parmentier;
French
Published: 09 Oct 2019
Publisher: HAL CCSD
Country: France
Abstract

International audience; In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.; Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée.

Subjects

Web of Data, Linked Open Data, Automatic alignment, Disambiguation, Geographic entities, Web de données, Données ouvertes liées, Alignement automatique, Désambiguïsation, Entités géographiques, [SHS.INFO]Humanities and Social Sciences/Library and information sciences

moresidebar