Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mercredi, octobre 19, 2005

Blogs: Ca bloque chez Blogger



Blogger est de plus en plus clairement montré du doigt comme pollueur N°1 de la blogosphère [voir Randy, Martin] Certains vont jusqu'à vouloir "tuer Blogger"... Il est vrai que la proportion de splogs sur Blogger est simplement hallucinante (voir ici), mais j'ai bien peur que le splog soit comme l'Hydre de Lerne, dont les têtes repoussent au fur et à mesure qu'on les coupe. Si on fermait Blooger, le splog réapparaîtrait ailleurs aussitôt.


Blogger (et sa maison mère Google, concernée avec BlogSearch) semblent décidés à prendre les choses en main. Il y a quelques jours, Blogger avait déjà ajouté un bouton "Flag" permettant de dénoncer les splogs (mesure bien dérisoire), mais surtout a commencé à mettre en place un système de "captchas" [en] (ces petites lettres tordues impossibles à recopier, mais qui sont censées décourager les robots), doublé d'algorithmes antisplogs. Blogger Buzz (le blog de Blogger) confirme (18 octobre) que dès qu'on crée un blog, Blogger le passe désormais dans ses filtres anti-splog.

Très bien, mais la détection des splogs est un exercice difficile, comme je l'ai montré il y a quelques jours. Les sploggeurs sont malins et leurs splogs ressemblent de plus en plus à de vrais billets, écrits par des humains... En tous cas suffisamment pour feinter de bêtes machines (on a là une réminiscence intéressante et inattendue du test de Turing dont il faudra peut-être que je parle un jour). Le risque, comme je l'ai montré, est de filtrer massivement de vrais blogs, mais qui ne satisfont pas à ce que les algorithmes imaginent être les caractéristiques statistiques des bons blogs.

J'en ai fait l'expérience hier. Dans sa précipitation pour faire la police chez lui-même avant que la blogosphère n'entre en insurrection, Blogger a manifestement serré les boulons un peu fort. J'ai essayé en vain, malgré de multiples tentatives de créer un blog -- ou plutôt, après m'être tordu les yeux et les doigts sur les captchas, j'ai réussi en en créer, mais il m'était alors impossible de créer des billets. Le premier (après passage au captcha) se créait correctement, mais ensuite, impossible d'en créer un deuxième. Blogger ne m'aimait plus; pourtant je suis enregistré depuis un an et j'ai plusieurs blogs qui ne leur posent pas souci à ma connaissance.

Peut-être que ce sont de petits problèmes de réglage. Attendons donc. Mais j'ai peur, étant donné la difficulté du problème, qu'il ne puisse être totalement résolu. Les bons bloggueurs vont certainement être pénalisés. A mon avis, on est à la veille de changements importants dans la blogosphère. Je me demande si l'espace de liberté et de créativité que nous avons connu jusqu'ici va subsister bien longtemps.

Post-Scriptum


20 oct - Blogger a pris conscience du problème et en parle sur son... Blog.

Libellés :


13 Commentaires:

Blogger all a écrit...

« We're sorry, but we were unable to complete your request »
J'ai eu ce bug hier sur un blog ouvert il ya 48h

Pas de captchas ce jour, plus de pb, mais aucune explication de blogger.

20 octobre, 2005 10:12  
Blogger all a écrit...

Suite ..
vous pouvez publier vos images chez blogger ("ajouter une image") je vois qu'elles sont toujours hébergées sur le serveur de l'université.

20 octobre, 2005 10:16  
Anonymous Miss Tics a écrit...

Oui, en effet, c'est bien inquiétant pour la suite. Mais enfin, en même temps, ces pollutions paraissaient fort prévisibles du fait de l'extrême facilité de référencement des blogs en général et de blogger en particulier...
Attendons de voir les nouveaux "patchs" ;)

20 octobre, 2005 11:14  
Blogger Jean Véronis a écrit...

All> vous pouvez publier vos images chez blogger -- Je sais, mais je ne veux pas mettre tous les oeufs dans le même panier... On ne sait jamais ;-)

20 octobre, 2005 11:29  
Blogger Jean Véronis a écrit...

Miss Tics> ces pollutions paraissaient fort prévisibles -- Oui, et Google a même joué avec le feu en "boostant" aussi fort les blogs de sa filiale Blogger dans le classement. J'en ai bénéficié, mais bon... ils ont fabriqué une véritable pompe à spam.

20 octobre, 2005 11:31  
Blogger Jérôme Charron a écrit...

Copie d'un commentaire que j'ai déjà laissé chez Miss Tics:

"Tim Bray, l'un des pères d'XML proposait récemment sur son blog d'utiliser des e-timbres pour lutter contre le spam de tout genre."

20 octobre, 2005 12:18  
Anonymous Spiritoo a écrit...

Jean, juste un petit commentaire pour signaler que, (peut être je suis à la traine mais je viens de le decouvrir), MSN a mis en place un peu le système de classement des sites en plusieurs dimensions dont je parlais sur ton billet sur les splogs...
Il y a maintenant 3 critères: fréquence de mise à jour, popularité et exactitude de correspondance. En jouant avec ces paramètres, il doit etre possible d'éviter des splogs.....

20 octobre, 2005 17:51  
Blogger Sébastien Bailly a écrit...

J'en viens à me demander si mon dernier blog passerait les barrières anti-splog...
Il est ici : http://bailly.blogs.com/blabla_du_web/

21 octobre, 2005 11:26  
Blogger Jean Véronis a écrit...

Sébastien> Assourdissant!

Mais TypePad est peut-être moins sous le feu des projecteurs, et en plus comme il faut payer (il me semble qu'il n'y a pas de version gratuite?), ça limite le splog. C'est finalement un peu le principe de l'e-timbre dont parlait Jérôme plus haut.

21 octobre, 2005 16:06  
Blogger Caroline Leboucq a écrit...

Moi, je voudrais parler d'autre chose, bien que j'aie aussi à subir les splog sur mon blog.
Peut-être que votre science pourra m'expliquer le pourquoi du comment de la chose, mais faites la petite expérience sur google: tapez "nicolas sarkozy" puis cliquez sur J'ai de la Chance. Drôle, n'est-ce pas. Mais comment se fait-ce ?

21 octobre, 2005 17:13  
Blogger VinZ a écrit...

Caroline> Sarkozy a été victime d'un "google bombing". Quelques internautes, énervés par le mailing qu'ils avaient reçu de Sarkozy, un peu comme du spam, ont décidé de se venger.

Google, pour faire son classement, utilise notamment les liens qui pointent vers chacune des pages, et le texte que contiennent ces liens. Si vous avez beaucoup de liens contenant le mot "voiture" qui pointent vers un site, Google se dit que le site en question doit traiter de voiture.

Les google-bombeurs ont détourné cela. L'idée, qui a été fortement relayée, transmise de blog en blog, était de créer des liens "Nicolas Sarkozy" pointant sur le site officiel d'Iznogoud, et des liens "Iznogoud" pointant sur la page de la bio de sarkozy sur le site du ministère de l'Intérieur...
L'algorithme de Google ne sachant évidemment pas détecter les blagues, il a indexé tous ces liens, et au bout de quelques jours, a présenté le site d'iznogoud parmi les premiers résulats pour "sarkozy" ou "nnicolas "sarkozy", et la bio de sarko parmi les premiers résultats pour "iznogoud"

21 octobre, 2005 17:38  
Blogger Jean Véronis a écrit...

Il y a un article dans Wikipedia (la version anglaise est largement plus détaillée).

21 octobre, 2005 18:05  
Blogger ¥€$ a écrit...

Pour en revenir au sujet de l'article, Blogger impose maintenant un captcha pour chaque article posté.

22 octobre, 2005 00:50  

Enregistrer un commentaire