Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mardi, octobre 28, 2008

Moteurs: Y a-t-il un Web apres Google ?

Orange m'a demandé ce que m'inspirait la longévité de Google, qui vient de fêter son dixième anniversaire. Je sais que je vais choquer bien des admirateurs inconditionnels, mais ce qui me frappe surtout c'est la stabilité extraordinaire, je dirais presque l'immobilité, du produit-phare de la firme, son moteur de recherche. Car si celui-ci a su remarquablement s'adapter au fil des années à l'explosion de taille du Web et à son changement de nature, son design et ses fonctionnalités sont incroyablement proches, à des détails près, de ce qu'elles étaient en 1998. Pourtant, pendant ce temps, le Web a connu une véritable révolution... Le plus étrange est que la concurrence est quasi éteinte, comme hypnotisée par la firme de Mountain View. Tous les concurrents, Orange compris, se présentent comme de pâles clones du moteur de référence... Comment cela peut-il s'expliquer ?

Je vous laisse lire la suite sur DreamOrange :


PS: Je précise que je suis conseiller scientifique de France Télécom et d'Orange depuis de nombreuses années, mais que ceci n'est pas un "publi-rédactionnel". J'ai été libre d'écrire exactement ce que je voulais sans la moindre censure. Ce papier reflète donc exactement mon point de vue.

Merci de commenter plutôt là-bas : j'aurais du mal à suivre deux fils de discussion ! [màj : apparemment il faut s'inscrire pour commenter sur DreamOrange -- mauvaise idée : c'est dissuasif !]

Libellés :


17 Commentaires:

Anonymous Anonyme a écrit...

AS: Je vais commenter ici, car "envie de réagir, connectez-vous ou inscrivez-vous à dream Orange.", or, désolé, mais je ne rêve pas d'Orange, même en anglais. Devoir s'inscrire sur un nouveau bidule à chaque fois que l'on désire commenter est vraiment une plaie (pour l'utilisateur; pour la compagnie, je suppose que c'est un réservoir à spam ou autre usages du genre.

Bonjour,

Je suis surpris de ne pas voir les raisons simples qui sont régulièrement avancées pour expliquer le succès de l'interface de google et donc sa stabilité.

Je commence par une simple mesure quantitative:
wc google.html
2 224 5961 google.html
wc orange.html
562 1890 39191 orange.html

Pour afficher grosso-modo la même chose (et surtout le même usage), Orange utilise plus de 6 fois plus de caractères que Google!

Coté serveur, le gain est évident: imaginez le débit actuel des serveurs google, multipliez par 6: n'y aurait-il pas quelque part dans cette simplicité un début d'explication de son étonnante rapidité?

Mais coté client aussi, même si de nos jours 30ko cela peut paraître peu, la légèreté de l'interface Google a été un facteur décisif dans la migration d'AltaVista vers Google.

Un peu d'histoire: lorsque AltaVista apparaît, son interface est très simple, assez semblable au Google actuel (elle est en fait issue de l'interface de WebCrawler, qui lui-même... là, je ne sais pas ;), mais bientôt la mode du "portail" déferle sur le web. Altavista s'y met: la page d'accueil, jusqu'ici agréable se couvre de liens dans tous les sens catégories, pubs plus ou moins déguisée, etc. A cette époque, comme tant d'autres, je me met donc à la recherche d'un autre moteur, qui conserverait la simplicité nécessaire à une recherche efficace, et comme beaucoup, j'arrive sur Google.

Le succès de Google est en grande partie du à son refus de suivre les modes, de mettre tout et n'importe quoi sur sa page, de prendre l'utilisateur pour un idiot en pré-mâchant des liens et des fonctions finalement peu efficace comparée à une simple et prédictible recherche en texte simple.

Certes, il faut souvent raffiner la recherche, mais non ce n'est pas lassant: c'est au contraire un exercice particulièrement stimulant et surtout puissant.

Cependant, depuis quelques années, quelque chose a en effet changé (et ce n'est pas le PHP ou le Web 2.0) mais simplement la masse d'information qui est devenu beaucoup plus grande.

Et en effet, alors qu'il y a quelques années je savais pouvoir retrouver n'importe quoi sur le web pourvu que Google l'ait indexé, aujourd'hui, ce n'est plus possible.

Cependant, j'ignore quel serait la bonne solution. J'avais été très intéressé par Cow9 (sur AltaVista), puis par Kartoo (OK, Flash: pas beau), mais en dehors de la jolie mise en évidence de relation sémantiques curieuses ou instructives, l'usage est finalement plus gadget qu'autre chose.

Un mot sur l"ordre linéaire": nous lisons et écrivons depuis des siècles de manière linéaire, et nous n'avons encore rien trouvé de plus puissant, les systèmes qui s'en écartent sont amusants (Kartoo, etc.), mais dès que l'ont veut faire un travail séreux, montrent leurs limites: un humain peut parcourir une liste de 100 URL/description sur une ou deux lignes et y repérer un sujet d'intérêt en quelques secondes. Une interface à la Kartoo est illisible dès que l'on dépasse quelques petites dizaines d'entrées, dont la consultation dans le plan (non linéaire donc) est fastidieuse et peu efficace...

Les moteurs produisent certes une "liste de résultats mélangés dans un ordre linéaire", mais le mélange tente de faire sens. Si vous analysez la sortie de google sur une requête, vous verrez que les premiers liens pointent vers les branches principales de ce qu'il estime être les différents champs sémantiques de la recherche, ce qui permet de suggérer au lecteur des axes sur lesquels raffiner sa recherche.

En résumé: Google a de bonnes raisons de garder son interface épurée. Toutefois, la masse de donnée accessible nécessiterait autre chose; cependant, je crains que personne ne sache encore bien quoi...

Yannick

29 octobre, 2008 00:07  
Anonymous Anonyme a écrit...

(pour commenter chez dreamOrange, il faut s'inscrire car ils ne reconnaissent pas mon openId, pas envie)

Cet article ressemble beaucoup à du Publi-rédactionnel. Ayant égard la pertinence de que tu publies habituellement, je doute que tu aies pu croire un instant qu'il suffisait à voilà d'être aussi pertinent que google pour le concurrencer.

Orange parle de Web2.0, leur as-tu seulement conseillé la lecture de "Why $0.00 Is the Future of Business" par exemple ?

29 octobre, 2008 00:47  
Blogger Bertil Hatt a écrit...

Merci pour cette très belle synthèse — je suis content que mon bientôt-ex-employeur (je termine une thèse en Cifre) soit capable de soutenir des belles choses comme ça.

Trois (gros) oublis, très excusables parce que ça apparaît tout juste, mais les trois sont clairement prometteurs.

1/ Tous ces réseaux sociaux ne sont pas contrôlés par Google, qui a eu du mal à utliser son levier pour imposer son modèle, que ça soit GReader Sahred links, ou Orkut — et ils contrôlent une information très importante pour proposer des suggestions pertinentes.

2/ La meilleure réponse à la fois à une question sur le monopole et sur la présentation des résultats, les moteurs verticaux, etc. : Yahoo! lance des programmes assez ambitieux d'externalisation et de modularisation de tout ce qui est imaginable. Boss, FireEagle, OAuth : des acronymes abscons et des idées étranges, mais surtout une stratégie du “Rélisez vous-même le Yahoo! de vos rêves” qui promet une concurrence très intelligente de la société.

3/ Rien sur le Web Sémantique — un débat ouvert ou Google n'a encore rien dit d'officiel, alors que c'est sans doute l'entreprise la mieux placée pour réveiller le monde entier un matin avec un stupéfiant “Voilà le monde tel qu'il est.” porté par un AI ‘réelle’.


Gaspard : oui, nous sommes beaucoup à Orange a suivre de près Chris Anderson — et j'ai fait beaucoup de remarques sur son blog pour affiner et critiquer ses idées. Sa présentation des externalités est sommaire et maladroite ; on a publié des typologies de modèles d'affaire, en particulier basé sur la gratuité, plus fines que ce qu'il propose — et l'idée que gratuit, c'est zéro en dollar, ça me gêne toujours autant.

Cependant, Orange est une très grosse entreprise avec des difficulté manifeste à coordonner ses dizaines de milliers d'employés (Coase, si tu m'entends) et surtout, c'est une marque forte, tenue par des gens qui sont payés très chers controler beaucoup de choses : c'est —disons— maladroit de réclamer une inscription ("dream Orange", ça n'est pas la même chose qu' "Orange" c'est pour ça qu'OpenID ne marche pas) mais tant mieux : la discussion est avec l'auteur, pas le commanditeur/mécène.

29 octobre, 2008 02:26  
Blogger Jean Véronis a écrit...

Yannick> je partage votre avis sur l'inscription obligatoire sur dreamOrange pour les commentaires. Je n'avais pas réalisé (c'est la première fois que j'y publie quelque chose). C'est une mauvaise idée de leur part. Je doute qu'il y ait beaucoup de commentaires à l'arrivée : c'est dissuasif. Discutons donc ici !

Vous avez raison sur le poids des pages. Mais cela n'explique pas tout. Yahoo et Google ont des volumes de pages à peu près comparables (et, comme je l'ai montré, une pertinence comparable également). Or Yahoo fait peanuts... L'argument était peut-être plus fort au temps des modems 56kb, et ça a sans doute pesé dans l'implantation de Google. Mais je ne suis pas sûr que ça fasse la différence de nos jours.

Quoi qu'il en soit, nous arrivons à peu près aux mêmes conclusions... Le système actuel n'est pas parfait, mais nous ne savons pas encore très bien par quoi il faudrait le remplacer.

Mon argument est que l'hégémonie que Google a su se créer est un justement un frein à l'innovation : plus de compétition = appauvrissement général.

Bien entendu, je n'ai jamais prétendu que le moteur d'Orange était (dans l'état actuel) une alternative crédible à Google ! Mais ça me plaît de voir qu'il y a encore quelques boîtes qui résistent un peu (Yahoo, MSN, Exalead aussi). Si je peux modestement les aider, je suis prêt à le faire, non pas par anti-Googlisme primaire, mais par souci de pluralisme et de diversité. Je n'aime l'hégémonie dans aucun domaine (en politique non plus !).

29 octobre, 2008 10:09  
Blogger Jean Véronis a écrit...

Gaspard > je doute que tu aies pu croire un instant qu'il suffisait à voilà d'être aussi pertinent que google pour le concurrencer. -- tu as vraiment lu ça dans mon article ?

29 octobre, 2008 10:14  
Blogger Jean Véronis a écrit...

Bertil> Sur les 3 points que tu soulèves :

1/ Tous ces réseaux sociaux ne sont pas contrôlés par Google -- oui, justement. Il me semblait en avoir aprlé : c'est une des "faiblesses" de Google, ou du moins un des points par lequel la concurrence pourrait attaquer. Mais Google y a pensé (et ne se positionne pas tropp mal avec Open Social).

2/ Yahoo! -- Oui. Je pense que c'est du point de vue tehcnique le seul concurrent immédiat possible. J'aime (et j'utilise) beaucoup certaines de leurs réalisation, comme Boss, YUI : superbe travail (et comme je l'ai souvent dit la qualité du moteur n'est pas éloignée de celle de Google). Mais le problème de Yahoo est autre... Il a bien du mal à survivre tout court. Hélas. Les espèces se raréfient. Un concurrent qui a les reins beaucoup plus solide, mais qui part de plus loin en termes de moteurs c'est Microsoft. La recherche qui s'y fait est excellente, et à un horizon de trois ou quatre ans, je ne serais pas surpris qu'on ait des surprises. Quant à Orange... il y a du retard, ne soyons pas naïfs ! Mais c'est une grosse boîte, qui a du potentiel (et qui fait de la belle innovation dans d'autres domaines). Elle pourrait se positionner fort bien dans la recherche mobile. Si... et si... Mais espérons ! Ce serait dommage que tout l'accès à l'information du XXIe siècle soit contrôlé par des boîtes américaines.

3/ Rien sur le Web Sémantique -- oui, j'avoue que j'ai fait (volontairement) l'impasse sur ça. A dire vrai je n'y crois pas trop. Ou plutôt, pour fonctionner, le Web sémantique aurait besoin de technologies sémantiques qui me semblent encore assez hypothétiques (car personne ne taguera à la main ses pages, ou alors ce sera totalement bordélique et/ou spammé). Donc à suivre, mais je ne vois pas ça à grande échelle pour tout de suite.

29 octobre, 2008 10:24  
Blogger Jean Véronis a écrit...

Bertil> j'ai oublié le dernier point : Orange est une très grosse entreprise -- Oui, c'est son problème. Avec une culture hérité du "passé soviétique" de la France,même si ça change peu à peu (pas toujours en bien d'ailleurs). Mais d'autres boîtes sont des géants (je pense à IBM ou Microsoft), avec les mêmes problèmes, et ça ne les empêche pas de faire de la belle innovation. D'ailleurs dans certains secteurs, Orange est assez innovant, je trouve.

29 octobre, 2008 10:27  
Blogger Jean Véronis a écrit...

ps: quand les commentaires sont aussi longs que le billet, j'adore !

29 octobre, 2008 12:34  
Anonymous Anonyme a écrit...

J'en profite pour te glisser une question qui est pour moi un mystère, surement signifiant :

> pourquoi google ne donne pas accès (sous le bloc de recherche par exemple) au permalink qui renverrait aux résultats "permaments".

je m'explique : dans l'url qui découle de ma recherche il y a des infos sans intérêt (navigateur, etc). Si google me proposait de pouvoir lier vers ce résultat (pas celui que JE vois - car il est différent pour tous le monde en fonction de nos usages et habitudes repérées par google - mais celui "par défaut"... comme sur wikio ou wikipedia) je linkerai sans doute facilement vers ces pages des notions ou des identités numériques...

alors pourquoi ?

- 1 : car le résultat "par défaut" (non personnalisé) n'existerait pas ? j'en serais fort surpris. Car il n'est pas "permanent" ? et alors ?

- 2 : car ils n'y ont pas pensé ? pas plus probable.

- 3 : car personne ne s'est posé cette question via le prisme de l'identité numérique" ?

quand un moteur fait 80% des recherches, mon "identité numérique" ou celle d'une marque ou une personnalité, ce ne serait pas d'abord, par défaut, ce permalink ?

Je pense que si google permettait ce lien permanent cela aurait un impact sur nos usages : une personnalité publique (ou un nouveau né !) peut-il se passer en 2008 d'avoir son prenomnom.com, un "site" et des pages référencentes pour administrer ses premiers résultats ?)

et après on dit qu'on ne blog plus... Ceci est un blogpost :-)

29 octobre, 2008 12:46  
Anonymous Anonyme a écrit...

Jean.philo: J'utilise aussi un moteur qui présente les résultats par grappage: clusty (vivisimo). Et les deux ou trois moteurs cartographiques, inspirés du mind mapping probablement avec Kartoo et mapstan, ainsi que grokker, me livrent souvent des résultats qui ne sont pas des copies carbone (comme disent les anglo-saxons) des résultats livrés par google. Je dis ça, je dis (presque) rien...

29 octobre, 2008 21:45  
Blogger Loran a écrit...

Bonjour,
votre article est remarquable.
J'aurais deux remarques.
La premiere concerne le changement de choix technologique rapide qui s'est effectué en 1998 au benefice de Google et de la reproduction de ce changement aujourd'hui. Le public de 1998 était composé d'early adopters pre-geek :o). C'est une population qu'il est plus facile de faire switcher (swinguer -c'est d'actualité-?) que le commun des usagers qui utilisent aujourd'hui Google. La preuve en est, que cette population a déja switchée aujourd'hui vers facebook ou Twitter, mais que le gros des troupes ne suit pas (et de très loin).


La deuxième remarque concerne l'utilisation mobile. Je ne crois pas qu'il y est une différence d'utilisation durable entres mobiles et PCs. L'observation des djeuns montrent qu'ils utilisent, quand ils en ont un, leur iPhone (ou hiphone, comme en Chine), pour les memes choses que leur poste fixe. Et cela est d'autant plus vrai, que le site qu'ils accedent est disponible en version mobile.
Il est beaucoup plus simple de chercher sur wapedia, sans bouger de devant la télé, que de se lever :o). Et que dire du surf dans le métro ou en ... cours...


Cordialement,
Loran

30 octobre, 2008 23:28  
Blogger Jean Véronis a écrit...

Nicolas> Je ne sais pas si je comprends bien ce que tu proposes, mais il me semble qu'effectivement il n'y a pas de résultat standard dans la logique gouguelienne. Ne serait-ce que d'une part pour une raison tehcnique : la recherche est (très fortement) distribuée, et les résultats arrivent au bon gré des réponses des serveurs et de leur charge (c'est pour ça par exemple que le nb de résultats affichés différe d'un moment à l'autre). D'autre part, il y a une raison liée au changement de nature du web, et à sa nature de plus en plus éphémère : de plus en plus de pages sont des résultats d'actu, ou des billets de blogs, qui peuvent difficilement être figés sur une période longue...

31 octobre, 2008 10:32  
Blogger Jean Véronis a écrit...

Anonyme> Oui, ces moteurs proposent des visualisations différentes, mais ils ne sont jamais parvenus à s'imposer. Le fossé qui les sépare des moteurs classiques est très grand en terme d'expérience utilisateur. Cela ne veut pas dire que ce soit rédhibitoire. Je crois que les utilisateurs sont beaucoup plus audacieux qu'on ne dit souvent, mais je crois qu'ils sont prêts à faire l'effort de réapprentissage si le jeu en vaut la chandelle (exemple: ils ont appris spontanément à utiliser un clavier complétement différent de l'AZERTY pour envoyer des SMS). Dans le cas de Kartoo et autres, le résultat est malheureusement décevant.

31 octobre, 2008 10:35  
Blogger Jean Véronis a écrit...

Loran> Oui (pour les deux points).

C'est vrai que plus il y a d'utilisateurs, plus le "switch" est difficile. Je me souviens par exemple de la période Minitel, qui nous a fait prendre un retard considérable dans l'implantation d'internet. Mais ça a finit par se produire malgré tout.

Sur la convergence des différentes sources, je crois aussi que ça va dans ce sens. De plus en plus de gens regardent la télé tout en surfant sur leur PC. Et évidemment l'iPhone abolit les frontières PC/téléphone.

Si la tendance s'accentue, Google aura du mal, car ce ne sont pas les mieux placés sur ces créneaux (bien qu'évidemment ils se positionnent : Android, Google phone etc.). Mais on a tout dit sur a lourdeur de la boîte etc., mais dans l'absolue Orange est idéalement bien placé et fait d'ailleurs par mal d'innovation en téléphonie et télévision. La boîte saura-t-elle faire la jonction avec le search (y compris le local search), et les réseaux sociaux ? A suivre. Mais c'est à mon avis une piste gagnante.

31 octobre, 2008 10:41  
Anonymous Anonyme a écrit...

Bonjour Jean,

En sport il existe un vieil adage : On ne change pas une équipe qui gagne.

Je crois que cela s'applique parfaitement de Google.
L'immobilisme de sa page d'accueil n'est découle que de la volonté de Google de conserver la recette qui a fait son succès.
Dans un Web dont le modèle économique est : créer de l’audience pour vendre de la pub, il n’est donc pas du tout étonnant que Google ne risque pas à faire évoluer sa page d’accueil.

Si tant d'internautes l'utilisent de préférence à d'autres moteurs de recherche, c'est tout simplement parce que Google est plus facile à utiliser.
Depuis son lancement Google a compris qu'il devait se concentrer sur son métier de moteur de recherche robotisé.
C’est pourquoi, Google n’affiche qu'une interface dénuée de pub et de frames multiples, et cantonne ses innovations ( etou celles qu’il rachète fort cher pour éviter l’émergence d’un concurrent qui drainerait son audience,) derrière des liens discrets et qui n’évoluent que très lentement.

Le focus de Google est de délivrer à tout utilisateur - même et surtout s’il est novice - un usage très simple et immédiatement efficace.

Il vous suffit de saisir un ou plusieurs mots clés et hop magique, il y a toujours des réponses.

Peu importe, si ces réponses sont plus pertinentes ou rapides à afficher que celles d'autres moteurs. De toute façon seules les réponses des toutes premières pages comptent, personne n’ayant de temps à perdre pour consulter la totalité des réponses.


Ce qui est réellement étonnant et qui fait la force de Google n’est en fait pas la puissance de son moteur de recherche mais celle de son système de commercialisation des mots clés de recherche sur sa première page et surtout dans les pages d’innombrables sites partenaires.
C’est du grand art, mais c’est aussi ce qui cantonne le Web dans un usage finalement pas très évolué depuis 10 ans.

A titre indicatif notre équipe de R&D a imaginé et développé d’autres mécanismes de valeur pour utiliser le Web notamment au travers d’un concept innovant que nous appelons le moteur de Trouvage.
Là où un moteur de recherche vous permet au premier chef de découvrir des informations dont vous ignorez tout, un moteur de trouvage vous permet de retrouver des informations dont vous savez qu’elles existent mais dont vous ne savez pas où elles se trouvent en ligne.


Je vous invite à en découvrir des applications notammenbt en cherchant mon nom et mon domicile numérique postal attribué sur www.postapp.net le premier service d’opérateur postal en ligne.

04 novembre, 2008 14:32  
Blogger Francis a écrit...

Ben moi je ne peux même pas acceder au contenu dreamorange il me dit :
error(s) :
connect :You do not have access to this document.
connect :You do not have access to this document.

A priori même pour simplement lire il faut donc s'enregistrer.

07 novembre, 2008 18:29  
Blogger Jean Véronis a écrit...

Non, je crois que c'est juste un bug temporaire.

07 novembre, 2008 18:31  

Enregistrer un commentaire