Pickanews, moteur de veille média, l’indexation géante

Press Index, une société du groupe Kantar Media, lance la nouvelle version de Pickanews, le moteur de recherche européen du groupe. Dédié à la veille et la gestion de réputation plurimédia, il indexe plus de 50 000 sources presse écrite, radio, TV, web en France, Royaume-Uni, Italie, et Espagne, et permet d’élargir ses recherches à Twitter, Facebook et Youtube.

Pickanews s’appuie sur les solutions logicielles d’Antidot pour répondre au niveau d’exigence très élevé de ce projet : l’ouverture d’Antidot Information Factory, la richesse fonctionnelle d’Antidot Finder Suite et la flexibilité d’Antidot Collaboration Services facilitent un traitement industriel et intelligent de l’information en répondant à 3 défis majeurs :

Transformer un flux sonore en texte

Prise en compte par le moteur de recherche de formats d’information très variés : pages de texte des journaux et magazines, flux audiovisuels issus des chaînes de télévision, flux sonores provenant des stations de radio, pages web captées sur Internet. Il était indispensable d’indexer intelligemment cette masse d’information hétérogène afin de faciliter l’accès de l’utilisateur à une information synthétique et pertinente.

Ainsi, pour les sources audiovisuelles, des logiciels spécifiques de transcription automatique de la parole – technologies « speech to text » – ont été mis en œuvre en complément du moteur de recherche : transformant un flux sonore en texte, qui est ensuite indexé par le moteur de recherche, cette approche permet la recherche exhaustive de mots-clés au sein des flux télé et radio. À chaque mot-clé est associé le time code précis où il est prononcé. Ainsi, lors de la consultation des résultats d’une recherche, il est possible de lancer un lecteur audio ou vidéo en positionnant le début de la lecture quelques secondes avant le moment où le mot clé cherché est prononcé dans l’extrait audiovisuel trouvé.

Plus de 50 000 sources d’information traitées

Indexation d’un volume important d’information : avec plus de 50 000 sources d’information traitées (environ 10 000 titres de presse écrite, 30 000 blogs et sites web d’information et près de 250 chaînes de télévision et radios) et ceci en 4 langues, Pickanews indexe chaque jour plus de 3 millions de nouveaux documents avant 10 h du matin.

Capacité d’envoyer des milliers d’alertes automatiques selon les demandes programmées par les utilisateurs qui ont mémorisé des requêtes sur les mots-clés qu’ils surveillent.

L’architecture distribuée multi-agents des solutions Antidot, qui parallélise les traitements et répartit la charge sur autant de serveurs que nécessaire, permet à Press Index de garantir aux utilisateurs une excellente qualité de service.

Dans :Cas utilisateur, France, Intranet - Extranet, Médias / Communication Tags: 

Sur le même thème :

Pierre Col (Antidot) : Data ou Smart Information, quel enjeu réel pour les entreprises ? Pierre Col (Antidot) : Data ou Smart Information, quel enjeu réel pour les entreprises ?
Par Pierre Col (Antidot) : Culture et patrimoine sont à la pointe du web sémantique! Par Pierre Col (Antidot) : Culture et patrimoine sont à la pointe du web sémantique!
Antidot / Fluid Topics : publication en ligne de documentation structurée Antidot / Fluid Topics : publication en ligne de documentation structurée
Moteur de recherche e-commerce : un composant clé pour mettre en valeur son catalogue produits… et donc vendre plus ! Moteur de recherche e-commerce : un composant clé pour mettre en valeur son catalogue produits… et donc vendre plus !

Laisser une réponse

Submit Comment

© 2018 IT Pro News. Tous droits réservés. XHTML / CSS Valide.
Fièrement propulsé par Theme Junkie.