- Recherche et sélection de publications
|
Constitution d’un corpus d’articles scientifiques avec représentation sémantique
- Jean-Claude Moissinac #1
-
#1 |
Laboratoire traitement et communication de l'information (LTCI)
- Télécm ParisTech
- Institut Mines-Télécom
- Université Paris-Saclay
|
- Références
- TextMine, Paris, Janvier 2018,
- Résumé
Dans le cadre du projet SemBib, nous avons entrepris une représentation
sémantique de la production scientifique de Télécom Paristech. Au delà des
objectifs internes, ce corpus enrichi est une source d’expérimentation et une ressource
pédagogique. ce travail repose sur l’utilisation de méthodes de fouilles
de texte pour construire des graphes de connaissances, puis sur la production
d’analyses à partir de ces graphes. La proposition principale exposée est la méthodologie
de production de graphes disjoints, aux rôles bien identifiés, afin de
permettre des utilisations différenciées, et en particulier la comparaison entre
méthodes de production et d’exploitation des graphes. Cet article est avant tout
une proposition méthodologique pour l’organisation de représentation sémantique
de publications, en s’appuyant sur des méthodes de fouille de texte. La
méthode proposée facilite des approches d’enrichissement progressifs des représentations
avec possibilités d’évaluation à chaque étape
- Mots-clés
- bibliométrie, sémantique
- Catégorie
- Article de colloque avec actes
- Domaine(s)
- Informatique/Informatique et langage
Informatique/Traitement du texte et du document Informatique/Web
- Identifiant(s)
-
Clé de citation JCM:TXM2018
- Fichier(s)
-
- Export
-
- Dernière mise à jour
- le 10 septembre 2018 par Jean-Claude Moissinac
|