Recherche et sélection de publications
Interface en ou

Constitution d’un corpus d’articles scientifiques avec représentation sémantique

Jean-Claude Moissinac #1
#1 Laboratoire traitement et communication de l'information (LTCI)
  • Télécm ParisTech
  • Institut Mines-Télécom
  • Université Paris-Saclay
Références 
TextMine, Paris, Janvier 2018,
Résumé

Dans le cadre du projet SemBib, nous avons entrepris une représentation sémantique de la production scientifique de Télécom Paristech. Au delà des objectifs internes, ce corpus enrichi est une source d’expérimentation et une ressource pédagogique. ce travail repose sur l’utilisation de méthodes de fouilles de texte pour construire des graphes de connaissances, puis sur la production d’analyses à partir de ces graphes. La proposition principale exposée est la méthodologie de production de graphes disjoints, aux rôles bien identifiés, afin de permettre des utilisations différenciées, et en particulier la comparaison entre méthodes de production et d’exploitation des graphes. Cet article est avant tout une proposition méthodologique pour l’organisation de représentation sémantique de publications, en s’appuyant sur des méthodes de fouille de texte. La méthode proposée facilite des approches d’enrichissement progressifs des représentations avec possibilités d’évaluation à chaque étape

Mots-clés
bibliométrie, sémantique
Catégorie 
Article de colloque avec actes
Domaine(s) 
Informatique/Informatique et langage
Informatique/Traitement du texte et du document
Informatique/Web
Identifiant(s)
Clé de citation JCM:TXM2018
Fichier(s)
Export
Dernière mise à jour
le 10 septembre 2018 par Jean-Claude Moissinac


Responsable du service
Dominique Asselineau dominique.asselineau@telecom-paristech.fr
Copyright © 1998-2017, Télécom ParisTech/Dominique Asselineau