Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mardi, février 16, 2010

Moteurs: Recherche géographique sur Orange

Vous savez que je ne rate jamais une occasion de souligner qu'il n'y pas que Google sur la Terre, fût-elle virtuelle. On fait de la très belle techno du côté de Mountain View, avouons-le (et un très beau marketing), mais cette tendance à la pensée unique 2.0 m'effraie un peu. J'aime bien la diversité. Voici donc des nouvelles d'un petit moteur gaulois, qui résiste encore (et toujours) à l'envahisseur...

Orange vient de mettre en ligne sa fonction de recherche géographique. Tapez "Quelle est la capitale de l'Australie ?", "Quelle est la population du Liechtenstein ?" ou "Quelle est la monnaie de l'Islande ?" dans lemoteur.fr et vous aurez la réponse à vos questions. Vous n'avez pas besoin de taper tout ça, d'ailleurs, tapez seulement "capitale australie", "population liechtenstein", "monnaie islande" et le résultat sera le même.




Oui, j'entends déjà les commentaires. Google le fait... Ok. Mais comme souvent, Google le fait à peu près, et dans ce cas précis notre technologie gauloise le fait mieux, même s'il reste encore et bien sûr de petites améliorations à apporter (c'est un problème difficile).

Cherchez par exemple "prince monaco" sur orange :

 et sur Google :
 

Quand Google n'est pas complètement à côté de la plaque...


Mais surtout, ce qui me paraît intéressant c'est qu'Orange va plus loin au niveau local. Exemples :

Le mécanisme se base d'un côté sur une analyse des requêtes, qui essaie de détecter la conjonction d'un terme déclencheur (maire, population, superficie, monnaie, etc.) et d'une entité géographique (pays, région, département, commune, etc.), et de l'autre côté sur l'analyse des entrées Wikipedia. Vous avez certainement remarqué que, depuis quelque temps, la quasi totalité des entrées géographiques contiennent des encadrés avec de nombreux détails administratifs, démographiques ou autres. Il "suffit" de les analyser pour constituer une base de faits tout à fait impressionnante :


 

Le projet DBPedia, d'ailleurs, vise à analyser de façon systématique les entrées de Wikipedia (pas seulement géographiques !) et à les transformer en une base de données exploitable. Gageons que les moteurs intercepteront une proportion de plus en plus grande de nos requêtes, et que "chansons cabrel", "albums michael jackson" ou "romans victor hugo" nous renverront des résultats structurés. Peut-être que c'est ça le Web sémantique, finalement. Je connais des lycéens qui vont être ravis !


Voir aussi



10 Commentaires:

Blogger Mathieu a écrit...

Un site comme Wolfram Alpha donne aussi d'exellent résultat sur ce type de recherche même si a base est encore assez pauvre hors des US et que seul l'anglais est disponnible.
Le summum étant atteind avec une recherche complexe du type "Weather in Los Angeles when Angela Merkel was born"

16 février, 2010 15:18  
Blogger Jean Véronis a écrit...

Le but de Wolfram Alpha est encore bien plus ambitieux, mais pour l'instant effectivement, restreint à l'anglais. D'ailleurs ça a attiré l'attention de Microsoft (voir ici, qui est évidemment aussi sur ce genre de recherches.

16 février, 2010 15:27  
Anonymous Anonyme a écrit...

euh par contre... mauvaise blague... regardez donc la première suggestion lorsque vous commencez à taper "comment s"
C'est un moteur Orange c'est ça ? :-/

16 février, 2010 15:51  
Blogger Jean Véronis a écrit...

La fonction d'autocomplétion n'est pas bonne, c'est clair - ça fait partie des points à améliorer !

16 février, 2010 16:04  
Blogger Jérôme Charron a écrit...

J'ai déjà eu l'occasion d'en parler qqs fois, mais DBPedia est un formidable projet sur lequel il est possible de construire des services à forte valeur ajoutée.

16 février, 2010 16:05  
Blogger Jean Véronis a écrit...

Oui, au début j'étais unpeu sceptique, mais il y a eu des progrès spectaculaires. C'est tout à fait fascinant de voir une telle auto-organisation de la connaissance émerger - je veux dire par des milliers d'humains qui apportent chacun leur petite brindilles, comme des fourmis... Je crois que c'est unique dans l'histoire de l'humanité.

16 février, 2010 16:08  
Blogger L'autre je a écrit...

Merci pour l'info !

16 février, 2010 18:12  
Blogger Jean a écrit...

2 détails :
1 Si j'ai tout compris (ce qui reste à voir) on passe de l'hégémonie Google à celle de Wikipedia (éminemment plus transparente, j'en conviens)

2 comme suggéré, j'ai tapé "comment s" avide de découverte, franchement je m'attendais à plus grivois et moins glauque ;-)

Bonjour chez vous

16 février, 2010 21:03  
Blogger Jean Véronis a écrit...

Jean>

1) Oui, c'est à surveiller aussi, mais on n'a pas Wikipedia comme filtre de l'accès information et réservoir mondial de données personnells pour l'instant... Ceci étant, il y a là aussi une forme de pensée unique qui me gêne (la soi-disant neutralité qui transforme la pensée en bouillie pour les chats, etc.).

2) Ca reflète ce que tapent les internautes "brut de décoffrage" (ou avec juste un petit filtre anti-porn), donc c'est une reflet de la grandeur et de la misère humaine... Enfin, c'est à améliorer, c'est clair !

16 février, 2010 21:08  
Anonymous Anonyme a écrit...

le moteur tiens aussi compte de faute de frappe sur les noms de ville, et peut même faire parfois dl sémantique

Par exemple essayez :
population bretagne
puis:
population région bretagne
puis:
population ville bretagne
et enfin
population bretagne dans l'indre

pas mal non , merci la linguistique ;-)

04 mars, 2010 18:10  

Enregistrer un commentaire