Activité de la 3ème année (2015)

Démonstrateur SHS Béta test dans le cadre du Cleo, phase 1 et 2


Qwam s’est efforcé de synthétiser toutes les réalisations effectuées dans le cadre du projet dans un démonstrateur INTERTEXTES dédié aux SHS. Un démonstrateur a été monté sur la base de la plateforme QES (Qwam E-Content Server) afin de mettre en oeuvre et implémenter certaines des réalisations du projet INTERTEXTES.


Une première implémentation a été effectué en phase 1.


Le Cléo a effectué une campagne d’évaluation et édité une série de remarques.

Ces remarques ont été revues en comité de pilotage et une série de modifications a été retenue.


Qwam a implémenté ces modifications sur le démonstrateur SHS en phase 2


Des corpus dédiés aux SHS, fournis par le CLEO ont été intégrés au démonstrateur SHS:

  • 2000 billets en phase 1 puis un deuxième lot de 5000 en phase 2

  • 2500 livres de SHS environ

  • Le produit de 2 années et demi de veille sur les thèmes définis par le CLEO en début de projet soit 190 000 documents


Ce démonstrateur a permis d’illustrer plusieurs réalisations:

  • La génération de facettes par annotation basées sur les entités nommées : Lieux, Personnes, Organisations en phase 1, les mêmes plus segmentés avec les événements en phase 2

  • La détection de concepts “chauds” sur la veille web et leur utilisation en annotation sur les autres corpus en phase 1

  • La détection de concepts “froids” en phase 2

  • Le passage à l’annotation en masse industrialisée et parallélisée en phase 2

  • Le passage à la géolocalisation en masse industrialisée et parallélisée en phase 2

  • Les facettes de géolocalisation avec “heatmap”

  • La représentation graphique de liens de cooccurence

  • La représentation graphique de liens de documents similaires par “More like this”

  • La mise en oeuvre d’un thesaurus dédié au SHS et son utilisation pour l’annotation

  • Le rapprochement des termes trouvés d’une ontologie SHS


Le système de recommandation développé dans le cadre du projet INTER-TEXTES est la mise en relation des documents en ajoutant des métadonnées permettant dans le cadre d’une recherche d’information :

  • d’obtenir un aperçu d’un domaine de recherche

  • de proposer une liste de contenus en fonction d’un document


Le système de recommandation se compose de différents modules logiciels permettant :

  • l’analyse des citations et des références bibliographiques

    • détection et annotation automatique des références bibliographiques avec le logiciel Bilbo

  • l’analyse du voisinage

    • la détection des communautés

    • les statistiques de fréquentation


Nous proposons d’évaluer les résultats du système en utilisant un corpus de requêtes. L’évaluation se fera par des experts qui attribueront une note aux résultats.
Sous-pages (1) : Livrables
Comments