Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

vendredi, septembre 09, 2005

Google: Cherchez l'erreur



Il se passe quelque chose chez Google. Comparez les photos :








Pendant longtemps, les nombres de résultats retournés par Google sur les requêtes individuelles ont continué à croître tranquillement, alors que la taille d'index annoncée sur la page d'accueil restait fixe ou à peu près (voir billet précédent). Cependant, il y a eu un bond énorme il y a deux jours. Le diagramme ci-dessous montre les nombres de résultats retournés par le même ensemble de requêtes le 10 août et aujourd'hui (comme pour Yahoo en mars, la correlation est si parfaite, qu'on ne peut s'empêcher de se poser des questions...):


Anglais



Français

Si mes calculs sont exacts, Google devrait très bientôt annoncer une multiplication par 2,7 de sa taille d'index, un chiffre proche de 21 milliards (ou bien peut-être ne vont-ils pas l'annoncer et continuer à vivre avec la contradiction -- j'ai plus ou moins renoncé à comprendre leur logique). Bien sûr cela n'a rien à voir avec le fait que Yahoo a annoncé récemment que son index atteignait 19.2 milliards de pages ;-)

Libellés :


9 Commentaires:

Anonymous HP a écrit...

de plus en plus comique ce Google :)

je fais parti des victimes inocentes du durcissement du "blaclistage" anti-spam qui a été abordé aujourd'hui (me semble) ; mais ce billet est si fendard, que je viens poster ici : MDR, XPLDR ...

Trop puissant !

09 septembre, 2005 16:36  
Blogger all a écrit...

M. Véronis si vous continuez à taper sur Google vous allez faire baisser mes actions, la plus belle affaire que j'ai faite depuis longtemps.

09 septembre, 2005 17:04  
Anonymous M. Brinbagnan a écrit...

Bonjour,

Depuis quelques temps, je lis ce blog, et j'enrage...
En effet, je suis complètement opposé a vos idées, et a -tout-ce que vous dites en général (sauf exception). J'ai essayé de commenter vos billets, mais a chaque fois, votre censure (apparamment mieux développée que celle de Yahoo! et Google) m'a empeché de m'exprimer ici...

J'espere donc que ce commentaire ne sera pas censuré...

Je voulais donc dire que Yahoo, a ce niveau, ne fait pas beaucoup mieux que Google (ne parlons pas de MSN Search, on dirait qu'il ne prend en compte cette option que pour les liens sponsorisés).
Tout ça pour vous dire que quand vous critiquez Google, comparez tout de même avec les autres moteurs.
Tout le monde n'est pas Googleophobe ;)

09 septembre, 2005 21:57  
Blogger Jean Véronis a écrit...

M. Brinbagnan> Je ne censure rien du tout (la preuve!). Je pense donc qu'il y a peut-être un problème technique soit de votre côté, soit de celui de Blogger (mais pour l'instant personne ne m'a rapporté de problème similaire).

Je ne suis pas Googlophobe, et si vous lisez tous mes billets, vous verrez que parfois je suis plutôt admiratif sur leurs réalisations (par exemple sur Google Print, Scholar, Suggest ou sur la "barre Google").

09 septembre, 2005 22:20  
Anonymous Quentin a écrit...

Je confirme que depuis une semaine tous les forums de webmasters sonne d'une même cloche : le nombre de pages recensés pour chaque site dans Google croît de façon exponentielle.
Cela est du pour une part au nouvel outil Google Sitemap, qui encourage chaque webmaster à mettre à disposition de Google, au sein d'un flux XML, la liste intégrale des pages de son site.
Des logiciels gratuits fleurissent sur le net pour générer ces flux.

12 septembre, 2005 14:44  
Anonymous Pilou a écrit...

Jean Véronis m'agace ! Du moins sa façon de privilégier l'anglais. Cherche-t-il à se faire recruter par quelque prestigieuse université US ?

A propos de pages, je ne sais toujours pas ce que c'est, UNE page (j'avais posé la question le 26 août, sur le billet [Yahoo: Pages manquantes? (4) ]).

En poursuivant mes test sur le fonctionnement des 2 moteurs (c'est surtout Google qui m'intrigue), je suis tombé sur un truc bizarre. Sur la requète fontaine + espeluque (fontaine n'est là que pour filtrer les sites de généalogie) Yahoo renvoie 16 réponses, Google 25. MAIS si Yahoo fournit des sites avec l'orthographe exacte (Espéluque, avec accent !), Google ne donne que ceux non-accentués (dont aix-en-provence.com ! si j'étais aixois, j'irais leur remonter les bretelles).
En modifiant la requète en fontaine + espéluque Google affiche 45 réponses, dont celles non-accentuées !!!
L'affichage d'une page sans l'accent (www.ruesdemaville.com/VILLES_30/page_ville_12408.htm) depuis le cache fournit le message suivant :
Les termes de recherche suivants ont été mis en valeur : fontaine
Ces termes apparaissent uniquement dans les liens pointant sur cette page : espéluque

La fonction link: ne fournit qu'un seul lien, dans la page de niveau supérieur, qui est le nom de la ville, Saint Bonnet du Gard ; ce que confirme Yahoo. D'où vient ce lien ? Mais peut-être qu'en anglais c'est plus explicite ;-}}

Une chose est certaine : pour tirer le meilleur de Google, il faut respecter l'orthographe.

13 septembre, 2005 15:48  
Blogger Jean Véronis a écrit...

Pilou> Je suis désolé de vous agacer... Mais je ne vois pas en quoi je "privilégie" l'anglais. Tous mes billets paraissent d'abord en français. Que voulez-vous, j'aurais préféré que ce soit le latin, mais c'est l'anglais qui est devenue la langue scientifique internationale. Je n'y peux rien.

Cherche-t-il à se faire recruter par quelque prestigieuse université US ? : J'ai déjà donné, et n'ai aucune envie d'y retourner. La bouffe est trop mauvaise.

En tous cas merci pour vos remarques. Je ne sais pas non plus ce qu'est une "page" Web. Ce terme recouvre bien des choses (et parfois des vides...).

13 septembre, 2005 17:38  
Blogger Marianne a écrit...

Jean on attend vos commentaires sur google blog search ! :-) (pas de rapport direct avec ce billet, enfin je crois)

14 septembre, 2005 14:02  
Blogger Jean Véronis a écrit...

Marianne> Bah, pour l'instant pour le peu que j'ai pu tester, il me paraît bien en dessous de Feedster, par exemple. Il retrouve 120 liens pour aixtal, alors que Feedster en trouve 416. Mais il faut sans doute que ça se mette en place. Je vais surveiller tranquillement et voir comment ça évolue...

14 septembre, 2005 14:08  

Enregistrer un commentaire