Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

vendredi, septembre 03, 2010

Moteurs: Orange utilise de plus en plus Wikipedia

Je vous avais signalé il y a quelques mois qu'Orange avait intégré une fonction de recherche géographique sur Le Moteur, qui pouvait donner des réponses directes à des requêtes du type "maire drancy" ou "habitants créteil". Cela plaît visiblement aux utilisateurs, et Orange vient de mettre en ligne une fonction de recherche sur la bio des personnalités. Par exemple, "date naissance victor hugo" apprendra aux lycéens qu'un certain siècle avait deux ans (souvenez-vous : Rome remplaçait Sparte, déjà Napoléon perçait sous Bonaparte...) :

dans Besançon, vieille ville espagnole :



Comme pour les recherches géographiques, cette fonctionnalité se base sur les "infobox" présentes dans Wikipedia.



D'autres requêtes sont possibles, sous réserve, évidemment, que l'information demandée soit présente dans l'encyclopédie. On aura par exemple pour "vrai nom coluche" :

et pour "profession loana" :


Jolie réalisation, qui montre la tendance de plus en plus nette des moteurs à donner des résultats directs, hors des résultats organiques. A la limite, sur des requêtes de ce type (et bien d'autres : "météo Paris", "date vacances scolaires", etc.) qu'est-ce qui justifie la présentation d'une page de résultats Web, à part la force de l'habitude ?

7 Commentaires:

Anonymous Jérôme Charron a écrit...

Effectivement, belle réalisation. Ce n'est pas hyper complexe à mettre en place et c'est très efficace. Petite nuance sur le fait que les utilisateurs aiment bien : ne serait-ce pas simplement parce que le résultat est en premier et surligné par un icone, une fonte plus grasse, etc....

En revanche en testant, j'ai trouvé un bug sur les résultats organiques sur la requête date victor hugo : tous les résultats organiques sont identiques.

04 septembre, 2010 09:57  
Anonymous Got a écrit...

Petite question : savez-vous si Orange utilise Dbpedia (http://dbpedia.org) pour réaliser ces recherches structurées ? Dans ce cas, ce n'est pas très compliqué et dans le cas contraire, Orange a réinventé la poudre...

A signaler que le moteur Powerset (Propriété de Microsoft depuis 2 ans) permet de réaliser des choses comparables voire plus avancées depuis pas mal de temps avec un corpus plus large.

04 septembre, 2010 10:59  
Anonymous Lloyb a écrit...

Et pour Orange Gina ? :-))

04 septembre, 2010 11:17  
Blogger TOMHTML a écrit...

Pour répondre à votre dernière question, Jean, il me semble qu'afficher les résultats naturels reste important. Rappelez-vous qu'il y a quelques mois, l'une des requêtes les plus populaires était "président polonais". Est-ce qu'avoir juste son nom affiché aurait suffit ?

04 septembre, 2010 17:00  
Blogger Jean Véronis a écrit...

Oui, c'est vrai... Encore que pour "date de naissance Bronislaw Komorowski" ça se discuterait sans doute... Mais bon, on est tellement habitués de toute façon que ça n'est pas prêt de changer !

04 septembre, 2010 19:33  
Blogger Jean Véronis a écrit...

Got> Non, Orange n'utilise pas DBpedia, mais l'analyse directe des dumps. J'avais testé DBPedia, mais je m'étais heurté à pas mal de difficultés, notamment le fait que les dumps ne sont pas toujours très frais, et l'analyse des dumps n'est pas spécialement compliquée.

Pour ce qui est de Powerset, oui, je connais, mais je n'ai pas l'impression que le projet traite d'autres langues que l'anglais pour l'instant ?

06 septembre, 2010 14:39  
Anonymous Le Moteur a écrit...

Bonjour à tous,

@Jean Véronis : Merci pour cet article qui décrit bien le fonctionnement des réponses sémantiques personnalités que nous venons d'intégrer
aux moteurs de recherche orange, voila, lemoteur il y a quelques jours.

@GOT : Nous avions étudié la possibilité d'utiliser dbpedia comme solution pour afficher nos réponses directes.
Nous avons rencontré 2 obstacles majeurs :
1) fraîcheur des données : dbpedia n'a pas été mis à jour depuis mars 2010. A terme nous prévoyons de mettre à jour les réponses sémantiques 1 fois / mois.
2) temps de réponse : dbpedia est trop "lent" pour nous à interroger... En l'utilisant nous aurions dégradé le temps d'affichage des résultats.

C'est pour cela que nous préférons stocker directement les dumps publiques de Wikipedia et les interroger à notre façon. Dbpedia ou les extractions de Wikipedia ne se suffisent pas à elles seules. Il y aussi un travail important qui est fait du côté de l'interprétation et de l'analyse linguistique de la recherche (cf. article sur Dream Orange).

@TOMHTML Nous avons des mécanismes qui privilégient les réponses naturelles d'actualité lorsque la recherche s'y prête (ex: aujourd'hui bosnie france)

06 septembre, 2010 15:42  

Enregistrer un commentaire