Moteurs: Orange utilise de plus en plus Wikipedia
Je vous avais signalé il y a quelques mois qu'Orange avait intégré une fonction de recherche géographique sur Le Moteur, qui pouvait donner des réponses directes à des requêtes du type "maire drancy" ou "habitants créteil". Cela plaît visiblement aux utilisateurs, et Orange vient de mettre en ligne une fonction de recherche sur la bio des personnalités. Par exemple, "date naissance victor hugo" apprendra aux lycéens qu'un certain siècle avait deux ans (souvenez-vous : Rome remplaçait Sparte, déjà Napoléon perçait sous Bonaparte...) :
dans Besançon, vieille ville espagnole :
Comme pour les recherches géographiques, cette fonctionnalité se base sur les "infobox" présentes dans Wikipedia.
D'autres requêtes sont possibles, sous réserve, évidemment, que l'information demandée soit présente dans l'encyclopédie. On aura par exemple pour "vrai nom coluche" :
et pour "profession loana" :
Jolie réalisation, qui montre la tendance de plus en plus nette des moteurs à donner des résultats directs, hors des résultats organiques. A la limite, sur des requêtes de ce type (et bien d'autres : "météo Paris", "date vacances scolaires", etc.) qu'est-ce qui justifie la présentation d'une page de résultats Web, à part la force de l'habitude ?
dans Besançon, vieille ville espagnole :
Comme pour les recherches géographiques, cette fonctionnalité se base sur les "infobox" présentes dans Wikipedia.
D'autres requêtes sont possibles, sous réserve, évidemment, que l'information demandée soit présente dans l'encyclopédie. On aura par exemple pour "vrai nom coluche" :
et pour "profession loana" :
Jolie réalisation, qui montre la tendance de plus en plus nette des moteurs à donner des résultats directs, hors des résultats organiques. A la limite, sur des requêtes de ce type (et bien d'autres : "météo Paris", "date vacances scolaires", etc.) qu'est-ce qui justifie la présentation d'une page de résultats Web, à part la force de l'habitude ?
7 Commentaires:
Effectivement, belle réalisation. Ce n'est pas hyper complexe à mettre en place et c'est très efficace. Petite nuance sur le fait que les utilisateurs aiment bien : ne serait-ce pas simplement parce que le résultat est en premier et surligné par un icone, une fonte plus grasse, etc....
En revanche en testant, j'ai trouvé un bug sur les résultats organiques sur la requête date victor hugo : tous les résultats organiques sont identiques.
Petite question : savez-vous si Orange utilise Dbpedia (http://dbpedia.org) pour réaliser ces recherches structurées ? Dans ce cas, ce n'est pas très compliqué et dans le cas contraire, Orange a réinventé la poudre...
A signaler que le moteur Powerset (Propriété de Microsoft depuis 2 ans) permet de réaliser des choses comparables voire plus avancées depuis pas mal de temps avec un corpus plus large.
Et pour Orange Gina ? :-))
Pour répondre à votre dernière question, Jean, il me semble qu'afficher les résultats naturels reste important. Rappelez-vous qu'il y a quelques mois, l'une des requêtes les plus populaires était "président polonais". Est-ce qu'avoir juste son nom affiché aurait suffit ?
Oui, c'est vrai... Encore que pour "date de naissance Bronislaw Komorowski" ça se discuterait sans doute... Mais bon, on est tellement habitués de toute façon que ça n'est pas prêt de changer !
Got> Non, Orange n'utilise pas DBpedia, mais l'analyse directe des dumps. J'avais testé DBPedia, mais je m'étais heurté à pas mal de difficultés, notamment le fait que les dumps ne sont pas toujours très frais, et l'analyse des dumps n'est pas spécialement compliquée.
Pour ce qui est de Powerset, oui, je connais, mais je n'ai pas l'impression que le projet traite d'autres langues que l'anglais pour l'instant ?
Bonjour à tous,
@Jean Véronis : Merci pour cet article qui décrit bien le fonctionnement des réponses sémantiques personnalités que nous venons d'intégrer
aux moteurs de recherche orange, voila, lemoteur il y a quelques jours.
@GOT : Nous avions étudié la possibilité d'utiliser dbpedia comme solution pour afficher nos réponses directes.
Nous avons rencontré 2 obstacles majeurs :
1) fraîcheur des données : dbpedia n'a pas été mis à jour depuis mars 2010. A terme nous prévoyons de mettre à jour les réponses sémantiques 1 fois / mois.
2) temps de réponse : dbpedia est trop "lent" pour nous à interroger... En l'utilisant nous aurions dégradé le temps d'affichage des résultats.
C'est pour cela que nous préférons stocker directement les dumps publiques de Wikipedia et les interroger à notre façon. Dbpedia ou les extractions de Wikipedia ne se suffisent pas à elles seules. Il y aussi un travail important qui est fait du côté de l'interprétation et de l'analyse linguistique de la recherche (cf. article sur Dream Orange).
@TOMHTML Nous avons des mécanismes qui privilégient les réponses naturelles d'actualité lorsque la recherche s'y prête (ex: aujourd'hui bosnie france)
Enregistrer un commentaire