Google: Recettes cochonnes
Le site Regioneo s'est fait connaître lors de son lancement en organisant un concours cochon... La vidéo avait fait un énorme buzz, vous vous en souvenez peut-être :
Est-ce la raison pour laquelle Google voit ce site d'un sale oeil ? Avant-hier Regioneo a mis en ligne mille recettes pas du tout cochonnes, et je suis l'affaire de près, car Marc et Jean-Tristan, les sympathiques créateurs du site, m'ont gentiment demandé quelques conseils pour la sémantique et le référencement. C'est toujours assez intéressant de voir ce qui se passe dans les entrailles du grand dieu Godgle. Guetter le moindre de ses borborygmes est la seule façon que nous avons, nous pauvres mortels, pour essayer de comprendre, tant bien que mal, des algorithmes qui doivent faire partie des secrets les mieux gardés de la planète...
Le robot est passé aussitôt, et 24h plus tard on voit les premières recettes apparaître dans les résultats des recherches. Un mot-clé peu connu (mais que les référenceurs connaissent bien), site:, permet de restreindre les résultats d'une recherche à un site particulier. Ainsi, la requete :
permet de savoir ce que Google a ingurgité dans la nuit...
Deux résultats (et un petit troisième en résultat dont lui seul sait pourquoi il est "similaire"). C'est bien peu, mais c'est normal. J'ai toujours observé que les résultats apparaissent progressivement, même si l'intégralité des pages a été immédiatement crawlée. Il faut un temps pour qu'elles se propagent dans l'index.
Ce n'est donc pas ça qui m'a intrigué, et qui m'a incité à écrire ce billet. En faisant la même requête sans le SafeSearch (le filtre anti-cul, si vous préférez), c'est 98 pages que le grand Godgle connaît (et même 100 en comptant des résultats "similaires")...
J'avais vu souvent ce genre de bizarrerie. J'avais d'ailleurs publié sur ce blog une étude détaillée de la curieuse conception qu'avait Google du "Safe Searching". Je vous invite à la relire si vous l'avez zappée... En gros, j'y montrais que, ne sachant pas très bien traiter les langues autres que l'anglais, Google utilisait un marteau pilon pour écraser une noix, filtrant carrément 10% des pages (contre 3% pour l'anglais). Pas de souci, donc, nos bambins ne verront ni cochonnes ni chattes, mais à quel prix ?
Visiblement les algos moulinent, et les choses évoluent dans le temps pour un même site. Gageons (du moins je l'espère pour Regioneo !) que les pages finiront par apparaître. Du moins la plupart d'entre elles. Cela exaspère les concepteurs de sites et les référenceurs, qui voient les pages apparaître ou disparaître dans les résultats du moteur sans raison apparente, et surtout sans moyen d'action... Ils se tuent à farcir les pages des bons mots-clés, à essayer de pêcher des liens en eaux troubles, et pof, leurs efforts sont anéantis sur la page qui rapporte le plus -- et qui parlent de tout sauf de sexe.
Que faire ? Personne n'en sait rien (ne croyez pas ce qu'ils disent). Le référencement est moins que jamais une science exacte. Je dirais même que c'est tout juste de la cuisine !
Est-ce la raison pour laquelle Google voit ce site d'un sale oeil ? Avant-hier Regioneo a mis en ligne mille recettes pas du tout cochonnes, et je suis l'affaire de près, car Marc et Jean-Tristan, les sympathiques créateurs du site, m'ont gentiment demandé quelques conseils pour la sémantique et le référencement. C'est toujours assez intéressant de voir ce qui se passe dans les entrailles du grand dieu Godgle. Guetter le moindre de ses borborygmes est la seule façon que nous avons, nous pauvres mortels, pour essayer de comprendre, tant bien que mal, des algorithmes qui doivent faire partie des secrets les mieux gardés de la planète...
Le robot est passé aussitôt, et 24h plus tard on voit les premières recettes apparaître dans les résultats des recherches. Un mot-clé peu connu (mais que les référenceurs connaissent bien), site:, permet de restreindre les résultats d'une recherche à un site particulier. Ainsi, la requete :
permet de savoir ce que Google a ingurgité dans la nuit...
Deux résultats (et un petit troisième en résultat dont lui seul sait pourquoi il est "similaire"). C'est bien peu, mais c'est normal. J'ai toujours observé que les résultats apparaissent progressivement, même si l'intégralité des pages a été immédiatement crawlée. Il faut un temps pour qu'elles se propagent dans l'index.
Ce n'est donc pas ça qui m'a intrigué, et qui m'a incité à écrire ce billet. En faisant la même requête sans le SafeSearch (le filtre anti-cul, si vous préférez), c'est 98 pages que le grand Godgle connaît (et même 100 en comptant des résultats "similaires")...
J'avais vu souvent ce genre de bizarrerie. J'avais d'ailleurs publié sur ce blog une étude détaillée de la curieuse conception qu'avait Google du "Safe Searching". Je vous invite à la relire si vous l'avez zappée... En gros, j'y montrais que, ne sachant pas très bien traiter les langues autres que l'anglais, Google utilisait un marteau pilon pour écraser une noix, filtrant carrément 10% des pages (contre 3% pour l'anglais). Pas de souci, donc, nos bambins ne verront ni cochonnes ni chattes, mais à quel prix ?
Visiblement les algos moulinent, et les choses évoluent dans le temps pour un même site. Gageons (du moins je l'espère pour Regioneo !) que les pages finiront par apparaître. Du moins la plupart d'entre elles. Cela exaspère les concepteurs de sites et les référenceurs, qui voient les pages apparaître ou disparaître dans les résultats du moteur sans raison apparente, et surtout sans moyen d'action... Ils se tuent à farcir les pages des bons mots-clés, à essayer de pêcher des liens en eaux troubles, et pof, leurs efforts sont anéantis sur la page qui rapporte le plus -- et qui parlent de tout sauf de sexe.
Que faire ? Personne n'en sait rien (ne croyez pas ce qu'ils disent). Le référencement est moins que jamais une science exacte. Je dirais même que c'est tout juste de la cuisine !
18 Commentaires:
cochon qui s'en dédit!
Elles sont géniales les recettes de ce site! Enfin un site de cuisine où il n'y a pas de la pub partout, des popups, des écrans splash qu'on n'arrive pas à fermer...
Pauvre cochon! Alors ils l'ont mangé finalement?
Je crois que la gagnante a choisi le cochon, finalement (lien). Pauvre Albert...
Enfin la page dit qu'elle a gagné un "cochon entier". Elle l'a peut être sauvé en le prenant vivant ?
Attention quand même, Jean. Ce site souffre d'un grave défaut -- aux yeux de Google. Le fait est que toutes ses pages ont la même méta description, et que c'est l'un des principaux facteurs qui fait qu'une partie seulement des résultats sont affichés.
Oui, Tom, c'est une chose qu'il va falloir modifier !
Confrontés aux moteurs de recherche, nous nous affrontons aux belles boîtes noires si appréciées des behavioristes : nous connaissons les entrées et les sorties, nous n'avons qu'à deviner ce qui se joue à l'intérieur.
Je te rejoins, Jean, lorsque tu dis que personne ne sait ce que l'on peut faire.
C'est pour cela que je conseille à ceux qui montent des sites autour de moi de ne pas s'occuper du référencement. Le CMS, bien choisi, prend en charge tous les aspects de titre de page, de metatags, etc. Et les humains effectuent le travail d'alimentation régulière, de pose de liens internes et externes. Le tout suffit à avoir un site correctement indexé.
Je croyais que le safe Search était uniquement pour les images et non pas les page web !!
Kim> Si, si Depuis 2005 pour le français (et bien avant pour l'anglais).
Michaël> Il y a tout un business autour du référencement qui relève un peu du piège à gogo...
Titre quasi similaire et meta description similaire sur toutes les pages, il faut pas chercher plus loin, c'est là le problème
Marie> Cela expliquerait que les pages soient considérées comme porn ? Je vois mal la logique...
Le message "mentionnez cet article et vous apparaitrez ici" n'est plus si vrai. Dernier exemple en date, ce billet mentionné dans la Revue La pianiste et le Rainbow du 11.10.09 ... Le fait de choisir un article n'a pas pour but d'être pingué ; mais, lorsque c'est dit et - surtout - que ça fonctionnait depuis ma précédente adresse ...
ah, olivier, on dirait bien que ça buggue...
je demande aux techs de vérifier
Olivier> J'ai eu réponse des techs. Vous avez semble-t-il changé trois fois d'url. Wikio a du mal à suivre.
Ah oui, ce lien dans vos articles fonctionne avec Wikio ... Mais ce cher Wikio a bien su me suivre pour son classement : http://www.wikio.fr/blogs/top?search=bloguer+ou+ne+pas+bloguer - avec la bonne nouvelle url (sans les w) ... Peut-être, en effet, a-t-il plus de mal avec mes articles (onglet Actualité), mais ceci était vrai aussi à ma précédente adresse ; sauf avec le ping chez vous qui fonctionnait lorsque je mentionnais un de vos articles.
Enfin, changer d'adresse : on ne fait pas toujours ce qu'on veut : je suis parti du Monde contre ses nofollows. J'ai été contraint de quitter OVH qui changeait sa politique d'hébergement ...
Pas de problème, Olivier! Le mieux est de passer un petit mot à info@wikio.fr en cas de changement, comme ça on est sûrs que quelqu'un s'assurera que la transition se fait bien.
vivement que le web 3.0 arrive...
Enregistrer un commentaire