Activité de la 2ème année (2014)

Outil en vue de la validation des sources et des contenus


Dans le cadre de ses activités de veille, Qwam est régulièrement confronté à deux questions récurrentes: Mon spectre de veille est il suffisant ? et ma couverture peut elle garantir une veille valable ? C’est une démarche de validation des sources qui permettra d’y répondre.


Afin de s’assurer que les sources ont une couverture suffisante, Qwam doit fournir une aide à la lecture, permettant d’obtenir une vue ensembliste d’un corpus agrégé et de pouvoir juger sur une requête de la pertinence de la couverture disponible.

La veille web passe par l'agrégation de contenus, au rang desquels figure les flux RSS en première position. C’est donc sur ce type de matériau que les travaux Qwam travaux ont porté.

Pour cela, cette aide à la lecture est constituée de facettes qui sont calculées sur le contenu web aggrégé à partir une requête proche du sujet. Ainsi leur consultation, couplée à leur fréquence d’apparition permet rapidement de déterminer les sources valides et susceptibles d’assurer une couverture correcte.

Ces facettes sont obtenues à partir d’un process d’annotation et d’enrichissement, basé sur des ontologies dédiées. C’est ce mode d’annotation qui est principalement décrit dans ce livrable.


Qwam disposant de trop peu de données et de recul  sur les SHS, au début de 2014, ce process de validation a d’abord été mis au point sur le premier coeur de métier de Qwam qui est les sciences de la vie. Il sera appliqué ensuite sur des corpus SHS sur le démonstrateur Intertextes en 2015.
Sous-pages (1) : Livrables
Comments