Extraction automatique d'entités spatiales imbriquées et de relations spatiales à partir de texte pour la création de graphes de connaissances : Une approche et deux jeux de données - Institut national de l’information géographique et forestière - Ecole nationale des sciences géographiques Accéder directement au contenu
Communication Dans Un Congrès Année : 2024

Extraction automatique d'entités spatiales imbriquées et de relations spatiales à partir de texte pour la création de graphes de connaissances : Une approche et deux jeux de données

Résumé

Automatically extracting geographic information from text is the key to harnessing the vast amount of spatial knowledge that only exists in this unstructured form. The fundamental elements of spatial knowledge include spatial entities, their types and the spatial relations between them. Structuring the spatial knowledge contained within text as a geospatial knowledge graph, and disambiguating the spatial entities, significantly facilitates its reuse. We present a baseline approach for nested spatial entity and binary spatial relation extraction from text, a new annotated French-language benchmark dataset on the maritime domain that can be used to train algorithms for both extraction tasks, and benchmark results for the two tasks carried out individually and end-to-end. Our approach involves applying the Princeton University Relation Extraction system (PURE), made for flat, generic entity extraction and generic binary relation extraction, to the extraction of nested, spatial entities and spatial binary relations.
L’extraction automatique d’informations géographiques à partir de texte est essentielle pour exploiter l’ensemble des connaissances spatiales qui n’existent que sous cette forme non structurée. Les éléments clés sont les entités spatiales, leurs types et les relations spatiales entre elles. Structurées en graphe de connaissances géospatial, les connaissances spatiales ambiguës peuvent être désambiguïsées, ce qui facilite considérablement leur accessibilité et réutilisation. Nous présentons une approche pour l’extraction d’entités spatiales imbriquées et de relations spatiales binaires à partir de texte, un jeu de données annoté en français sur le domaine maritime qui peut être utilisé pour entraîner des algorithmes pour les deux tâches d’extraction, ainsi que des résultats de référence pour les deux tâches effectuées individuellement et de bout en bout. Notre approche applique le Princeton University Relation Extraction system (PURE), conçu pour l’extraction d’entités génériques plates et de relations binaires génériques, à l’extraction d’entités spatiales imbriquées et de relations binaires spatiales.
Fichier principal
Vignette du fichier
textmine_egc_hmr_2024.pdf (175.92 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04444358 , version 1 (07-02-2024)

Licence

Licence Ouverte - etalab

Identifiants

  • HAL Id : hal-04444358 , version 1

Citer

Helen Mair Rawsthorne, Nathalie Abadie, Eric Kergosien, Cécile Duchêne, Éric Saux. Extraction automatique d'entités spatiales imbriquées et de relations spatiales à partir de texte pour la création de graphes de connaissances : Une approche et deux jeux de données. TextMine'24, 24ème conférence francophone sur l'Extraction et la Gestion des Connaissances (EGC'24), Jan 2024, Dijon, France. pp.75-86. ⟨hal-04444358⟩
29 Consultations
10 Téléchargements

Partager

Gmail Facebook X LinkedIn More