Moteurs: Recherche géographique sur Orange
Vous savez que je ne rate jamais une occasion de souligner qu'il n'y pas que Google sur la Terre, fût-elle virtuelle. On fait de la très belle techno du côté de Mountain View, avouons-le (et un très beau marketing), mais cette tendance à la pensée unique 2.0 m'effraie un peu. J'aime bien la diversité. Voici donc des nouvelles d'un petit moteur gaulois, qui résiste encore (et toujours) à l'envahisseur...
Orange vient de mettre en ligne sa fonction de recherche géographique. Tapez "Quelle est la capitale de l'Australie ?", "Quelle est la population du Liechtenstein ?" ou "Quelle est la monnaie de l'Islande ?" dans lemoteur.fr et vous aurez la réponse à vos questions. Vous n'avez pas besoin de taper tout ça, d'ailleurs, tapez seulement "capitale australie", "population liechtenstein", "monnaie islande" et le résultat sera le même.
Oui, j'entends déjà les commentaires. Google le fait... Ok. Mais comme souvent, Google le fait à peu près, et dans ce cas précis notre technologie gauloise le fait mieux, même s'il reste encore et bien sûr de petites améliorations à apporter (c'est un problème difficile).
Cherchez par exemple "prince monaco" sur orange :
Quand Google n'est pas complètement à côté de la plaque...
Mais surtout, ce qui me paraît intéressant c'est qu'Orange va plus loin au niveau local. Exemples :
Le mécanisme se base d'un côté sur une analyse des requêtes, qui essaie de détecter la conjonction d'un terme déclencheur (maire, population, superficie, monnaie, etc.) et d'une entité géographique (pays, région, département, commune, etc.), et de l'autre côté sur l'analyse des entrées Wikipedia. Vous avez certainement remarqué que, depuis quelque temps, la quasi totalité des entrées géographiques contiennent des encadrés avec de nombreux détails administratifs, démographiques ou autres. Il "suffit" de les analyser pour constituer une base de faits tout à fait impressionnante :
Le projet DBPedia, d'ailleurs, vise à analyser de façon systématique les entrées de Wikipedia (pas seulement géographiques !) et à les transformer en une base de données exploitable. Gageons que les moteurs intercepteront une proportion de plus en plus grande de nos requêtes, et que "chansons cabrel", "albums michael jackson" ou "romans victor hugo" nous renverront des résultats structurés. Peut-être que c'est ça le Web sémantique, finalement. Je connais des lycéens qui vont être ravis !
Orange vient de mettre en ligne sa fonction de recherche géographique. Tapez "Quelle est la capitale de l'Australie ?", "Quelle est la population du Liechtenstein ?" ou "Quelle est la monnaie de l'Islande ?" dans lemoteur.fr et vous aurez la réponse à vos questions. Vous n'avez pas besoin de taper tout ça, d'ailleurs, tapez seulement "capitale australie", "population liechtenstein", "monnaie islande" et le résultat sera le même.
Oui, j'entends déjà les commentaires. Google le fait... Ok. Mais comme souvent, Google le fait à peu près, et dans ce cas précis notre technologie gauloise le fait mieux, même s'il reste encore et bien sûr de petites améliorations à apporter (c'est un problème difficile).
Cherchez par exemple "prince monaco" sur orange :
et sur Google :
Quand Google n'est pas complètement à côté de la plaque...
Mais surtout, ce qui me paraît intéressant c'est qu'Orange va plus loin au niveau local. Exemples :
- maire rognes = Jacky Pin
- président paca = Michel Vauzelle
- préfecture 83 = Toulon
- préfet 93 = Nacer Meddah
- superficie paca = 31400 km2
- etc.
Le mécanisme se base d'un côté sur une analyse des requêtes, qui essaie de détecter la conjonction d'un terme déclencheur (maire, population, superficie, monnaie, etc.) et d'une entité géographique (pays, région, département, commune, etc.), et de l'autre côté sur l'analyse des entrées Wikipedia. Vous avez certainement remarqué que, depuis quelque temps, la quasi totalité des entrées géographiques contiennent des encadrés avec de nombreux détails administratifs, démographiques ou autres. Il "suffit" de les analyser pour constituer une base de faits tout à fait impressionnante :
Voir aussi
- Billet de Jean-Baptiste Viet (chef de projet chez Orange)
10 Commentaires:
Un site comme Wolfram Alpha donne aussi d'exellent résultat sur ce type de recherche même si a base est encore assez pauvre hors des US et que seul l'anglais est disponnible.
Le summum étant atteind avec une recherche complexe du type "Weather in Los Angeles when Angela Merkel was born"
Le but de Wolfram Alpha est encore bien plus ambitieux, mais pour l'instant effectivement, restreint à l'anglais. D'ailleurs ça a attiré l'attention de Microsoft (voir ici, qui est évidemment aussi sur ce genre de recherches.
euh par contre... mauvaise blague... regardez donc la première suggestion lorsque vous commencez à taper "comment s"
C'est un moteur Orange c'est ça ? :-/
La fonction d'autocomplétion n'est pas bonne, c'est clair - ça fait partie des points à améliorer !
J'ai déjà eu l'occasion d'en parler qqs fois, mais DBPedia est un formidable projet sur lequel il est possible de construire des services à forte valeur ajoutée.
Oui, au début j'étais unpeu sceptique, mais il y a eu des progrès spectaculaires. C'est tout à fait fascinant de voir une telle auto-organisation de la connaissance émerger - je veux dire par des milliers d'humains qui apportent chacun leur petite brindilles, comme des fourmis... Je crois que c'est unique dans l'histoire de l'humanité.
Merci pour l'info !
2 détails :
1 Si j'ai tout compris (ce qui reste à voir) on passe de l'hégémonie Google à celle de Wikipedia (éminemment plus transparente, j'en conviens)
2 comme suggéré, j'ai tapé "comment s" avide de découverte, franchement je m'attendais à plus grivois et moins glauque ;-)
Bonjour chez vous
Jean>
1) Oui, c'est à surveiller aussi, mais on n'a pas Wikipedia comme filtre de l'accès information et réservoir mondial de données personnells pour l'instant... Ceci étant, il y a là aussi une forme de pensée unique qui me gêne (la soi-disant neutralité qui transforme la pensée en bouillie pour les chats, etc.).
2) Ca reflète ce que tapent les internautes "brut de décoffrage" (ou avec juste un petit filtre anti-porn), donc c'est une reflet de la grandeur et de la misère humaine... Enfin, c'est à améliorer, c'est clair !
le moteur tiens aussi compte de faute de frappe sur les noms de ville, et peut même faire parfois dl sémantique
Par exemple essayez :
population bretagne
puis:
population région bretagne
puis:
population ville bretagne
et enfin
population bretagne dans l'indre
pas mal non , merci la linguistique ;-)
Enregistrer un commentaire