Recherche et sélection de publications
Interface en ou

Visualisations des thématiques d’un centre de recherche

Jean-Claude Moissinac #1
#1 Laboratoire traitement et communication de l'information (LTCI)
  • Télécm ParisTech
  • Institut Mines-Télécom
  • Université Paris-Saclay
Références 
SemWebPro, Paris, France, Novembre 2016,
Résumé

Les mécanismes de financement et d’évaluation de la recherche ont conduit à une très forte croissance de la production d’articles scientifiques. Cette croissance a rendu difficile la recherche d’informations dans cette masse de données. Divers travaux dans le monde s’attachent à améliorer cette situation. Dans ce cadre, le département Traitement du Signal et des Images de Telecom ParisTech a entrepris un travail d’analyse sémantique des publications scientifiques de cet organisme au cours des cinq dernières années. Des méthodes assez classiques de traitement des langues naturelles combinées avec les travaux récents de description sémantique d’articles scientifiques permettent de proposer des regards nouveaux sur ces productions. Par exemple, il est possible des thématiques communes à des groupes chercheurs qui ne recoupent pas nécessairement la structure organisationnelle, essentiellement arborescente, des départements de recherche ou les rapprochements entre co-auteurs de publications. Il est également possible, par exemple, de visualiser l’évolution des thématiques pour des chercheurs ou des groupes de chercheur. Les visualisations proposées sont destinées à faciliter en interne les collaborations, notamment pour les nouveaux arrivants, et, à donner à l’extérieur une meilleure visibilité sur les résultats produits : recherche de spécialistes, coopération sur des projets… Le travail porte sur environ 4000 publications. Seulement 1200 environ sont directement disponibles sur la base de donnée interne à l’école. Pour les autres, divers problèmes, dont des problèmes de copyright, rendent l’accès plus complexe. La question de l’accessibilité des publications scientifiques sera abordée, mais pas traitée en profondeur. Nous verrons la chaine de traitement mise en œuvre, les données intermédiaires produites et les visualisations qui en sont issues. Nous montrerons comment la chaîne de production retenue se prête bien à l’ajout progressif des nouvelles publications et comment celle-ci pourrait être transposée à d’autres organismes ou d’autres activités.

Mots-clés
Catégorie 
Communication sans actes (séminaire...)
Domaine(s) 
Informatique/Recherche d'information
Informatique/Autre
Informatique/Traitement du texte et du document
Informatique/Web
Identifiant(s)
Réf. HAL  hal-01546072
Clé de citation JCM:SWPRO-16
Fichier(s)
Export
Dernière mise à jour
le 23 juin 2017 par Jean-Claude Moissinac


Responsable du service
Dominique Asselineau dominique.asselineau@telecom-paristech.fr
Copyright © 1998-2017, Télécom ParisTech/Dominique Asselineau