Technologies du Langage: mars 2005

Référencement: Articles pas gratuits dans Google

La requête langage dans Google arrive souvent sur mon site. Il faut dire que "Technologies du langage" est désormais dans le premier écran de résultats. Il n'y a pas si longtemps il était à la 15è place (voir ici), ce qui, sur près de 5 milliards de pages n'était pas si mal. Maintenant il est à la dixième, ce qui change tout, car on sait que l'internaute moyen ne clique pas souvent pour aller voir la deuxième page de résultats... Au passage, notons qu'il n'y a plus que 3 330 000 résultats ; j'ai fait remarquer ce dégraissage récent des comptes chez Google (ici et ici). Comme c'est sur l'adresse IP 216.239.59.104, qui appartient au groupe de serveurs qui semblent être dans leur configuration finale (voir ici), c'est sans doute le nouveau résultat que va désormais afficher Google.

Ce matin j'ai vu arriver la requête le langage (sans guillemets, c'est important). Curieusement, "Technologies du langage" remonte à la quatrième place, ce qui est vraiment mieux, puisqu'on sait que l'internaute moyen (toujours lui !) clique de préférence sur les premiers résultats. C'est bizzare, car Google nous dit expressement : "le" étant un mot très courant, il a été ignoré lors de cette recherche.

C'est d'ailleurs confirmé dans la documentation de Google. Donc, ce n'est pas vrai. Google prend bien en compte les articles et autres mots de l'antidictionnaire (ou stoplist, pour parler franglais) dans le classement des résultats.

Encore plus étrange, si l'on utilise le signe plus (+le langage) pour forcer l'inclusion de le dans la requête, comme le suggère la documentation de Google, on obtient un résultat tout autre ! "Technologies du langage" n'est plus qu'à la 34è position... c'est-à-dire perdu pour l'internaute moyen. Cette requête est d'ailleurs (et c'est normal) différente de la requête "le langage" (avec les guillemets), qui place ce blog 43ème (snif).

Bref, comprenne qui pourra. Une fois de plus, Google ne fait pas ce qu'il dit, et, pire, ne dit pas ce qu'il fait. Je plains les référenceurs, qui ont décidément un bien dur métier (je l'avais déjà remarqué ici ou là).

3 Commentaires:

Anonyme a écrit...: Je vais me risquer à une explication...

Quand tu cherches "+le langage" (sans les guillemets), Google est censé chercher les documents qui contiennent les mots "le" et "langage". En ajoutant le + devant "le", tu obliges Google à ne pas ignorer l'article "le", comme il dit le faire quand tu cherches seulement "le langage" (sans les guillemets).

Par contre quand tu cherches "le langage" (sans les guillemets), Google n'ignore pas tout à fait le mot "le" comme il le dit. Je pense qu'il cherche les documents contenant un mot à gauche du mot "langage". C'est subtil... et avec un autre exemple c'est peut-être plus clair. Si tu cherches "technologies du langage" (sans les guillemets), Google dit qu'il ignore le mot "du". Mais en fait les pages qui contiennent une expression de trois mots commençant par "technologies" et finissant par "langage" seront avantagées.

En tout cas je suis d'accord avec toi, une fois de plus Google ne fait pas ce qu'il dit et ne dit pas ce qu'il fait...; 31 mars, 2005 11:35
Jean Véronis a écrit...: Pas sûr que ton hypothèse soit tout à fait la bonne, car on devrait obtenir la même chose, à ce moment-là, avec le langage (sans guillemets) et "* langage" (avec guillemets), du moins sur les DC où le "*" marche encore... Il n'y aurait pas de raison particulière non plus pour que langage le donne la même chose que le langage (toujours sans guillemets). Or, ça semble être le cas !

Bref, un mystère de plus, mais le problème est bien qu'on ne sait pas exactement ce qui se passe et que ça ne correspond pas à la doc. Si ça fait cogiter les experts, ça doit être la purée de pois totale pour l' "internaute moyen" ! Google (et les autres) seraient gagnants à mon avis à avoir plus de lisibilité et plus de transparence, mais ça ne semble pas être la direction qu'ils ont choisie.; 31 mars, 2005 17:41
Anonyme a écrit...: Bonjour,

Je comprends facilement les raisons commerciales de la tendance au secret de Google (vis-à-vis des concurrents, des acheteurs, des usagers). Il s'agit clairement là d'entraves à la concurrence qui s'expliquent facilement, même si on ne les approuve pas.

Mais je me demande s'il n'y a pas une autre raison, inhérente à l'activité de recherche d'informations dans un espace ouvert : donner ses recettes de recherche, c'est donner les moyens à ceux qui peuvent investir de se positionner de façon favorable dans les requêtes, et donc le marché de la publicité s'écroulerait pour le moteur. Il y aurait alors là une limite théorique au système : pour être le plus performant il lui faut la transparence, mais celle-ci le conduit à sa perte par brouillage. Ou alors peut-on penser qu'un équilibre différent pourrait se construire ?; 01 avril, 2005 10:17

	Matt.	Marc	Luc	Jean
observé	200	186	221	275
attendu	249,7	156,5	269,1	206,7
écart	-49,7	29,5	-48,1	68,3
écart relatif	-17%	+19%	-18%	+33%

Groupe	Data Center	the	chirac	chirac OR chirac
1	64.233.161.99	8000000000	3270000	1750000
2	64.233.189.104	3800000000	2150000	1970000
3	66.102.7.99	3800000000	1970000	1970000

Fréquence	Expression
372000	reporters sans frontières
113000	médecins sans frontières
5850	télévision sans frontières
2070	ingénieurs sans frontières
2060	pharmaciens sans frontières
1830	avocats sans frontières
1700	jeunes sans frontières
1540	monde sans frontières
1290	vétérinaires sans frontières
1230	films sans frontières
1130	amour sans frontières
843	aviation sans frontières
724	enfants sans frontières
692	éducation sans frontières
680	jeux sans frontières
677	europe sans frontières
634	pompiers sans frontières
586	patrimoine sans frontières
549	clowns sans frontières
546	traducteurs sans frontières
534	trek sans frontières
441	terre sans frontières
384	imaginaires sans frontières
354	douleurs sans frontières
315	sport sans frontières
289	homéopathes sans frontières
284	amis sans frontières
273	musique sans frontières
255	femmes sans frontières
219	juristes sans frontières
217	nouveau sans frontières
212	fraternité sans frontières
206	amitiés sans frontières
198	tréteaux sans frontières
196	sécurité sans frontières
187	amitié sans frontières
172	pyrénées sans frontières
170	éducateurs sans frontières
169	artistes sans frontières
169	marins sans frontières
168	espoir sans frontières
139	haïku sans frontières
132	dentistes sans frontières
128	handicap sans frontières
124	business sans frontières
111	noël sans frontières
104	alpes sans frontières
102	cheval sans frontières
99	ateliers sans frontières
94	vivre sans frontières
92	chrétiens sans frontières
91	experts comptables sans frontières
88	accueil sans frontières
78	regards sans frontières
76	lunettes sans frontières
75	autistes sans frontières
72	ESC sans frontières
71	architectes sans frontières
69	maths sans frontières
68	numérique sans frontières
66	fanfares sans frontières
66	terres sans frontières
61	vignes sans frontières
58	cabaret sans frontières
54	informatique sans frontières
53	manuels sans frontières
53	poètes sans frontières
52	imaginaire sans frontières
51	partage sans frontières
50	union sans frontières
48	électriciens sans frontières
48	psychologique sans frontières
45	connexion sans frontières
45	crédits sans frontières
45	gynécologie sans frontières
43	temps sans frontières
41	jardins sans frontières
40	guerres sans frontières
39	acupuncture sans frontières
39	alliances sans frontières
39	architecture sans frontières
37	échanges sans frontières
37	épargne sans frontières
33	multimédia sans frontières
32	voyages sans frontières
31	orphelins sans frontières
30	afrique sans frontières
29	biologie sans frontières
29	fête sans frontières
28	management sans frontières
28	restaurateurs sans frontières
26	femme sans frontières
25	informaticiens sans frontières
25	sciences sans frontières
24	cuisines sans frontières
24	gastronomie sans frontières
22	cavaliers sans frontières
21	ambulanciers sans frontières
21	ophtalmos sans frontières
20	gospel sans frontières
19	amérique sans frontières
18	rebelles sans frontières
17	études sans frontières
17	radiologie sans frontières
16	cerveaux sans frontières
16	normands sans frontières
16	secours sans frontières
15	danseurs sans frontières
15	traduction sans frontières
13	drouant sans frontières
13	empoisonneurs sans frontières
13	kayak sans frontières
13	randonnées sans frontières
12	pensée sans frontières
11	explorateurs sans frontières
11	opéra sans frontières
10	4x4 sans frontières
10	flammes sans frontières
10	génie urbain sans frontières
10	ministre sans frontières
10	policiers sans frontières
9	choeur sans frontières
9	université populaire sans frontières
8	vélo sans frontières
7	matériel médical sans frontières
7	naturopathes sans frontières
6	gagueurs sans frontières
6	image sans frontières
6	pirates sans frontières
6	siad sans frontières
5	ordinateurs sans frontières
5	skittles sans frontières
4	scouts sans frontières
3	2CV sans frontières
3	alliance sans frontières
3	aperopunk sans frontières
3	argenteuil sans frontières
3	météorologie sans frontières
2	dictateurs sans frontières
2	évangélisation sans frontières
2	femmes libres et sans frontières
1	femmes égalités sans frontières
1	surveillance sans frontières

Mot	Fréquence	Mot	Fréquence
gouvernance	661000	confinance	54
traitance	565000	roulance	50
boisance	3940	déferlance	47
armance	2300	rassemblance	41
flamboyance	2070	désistance	37
raisonnance	1750	foisonnance	36
glissance	830	apaisance	35
pétillance	672	repliance	34
battance	654	éloignance	34
croisance	621	acquittance	32
chatoyance	527	ondoyance	31
encombrance	389	larmoyance	30
rayonnance	292	éblouissance	29
pliance	279	débordance	28
parlance	231	payance	27
environnance	227	crissance	23
déchirance	157	commandance	23
verdoyance	79	craquance	22
scintillance	59	rendance	21
accompagnance	59	amusance	21

Cherchez sur ce blog

A propos de l'auteur

Billets récents

Archives

Outils

Ma startup

Mes livres

jeudi, mars 31, 2005

Référencement: Articles pas gratuits dans Google

3 Commentaires:

mercredi, mars 30, 2005

Langues: Clin d'oeil Klingon

2 Commentaires:

samedi, mars 26, 2005

Texte: Le nom du Père

7 Commentaires:

vendredi, mars 25, 2005

Google: Quel est le Data Center qui me répond ?

1 Commentaires:

Google: Un instantané sur la mise à jour

2 Commentaires:

Google: A snapshot of the update

1 Commentaires:

jeudi, mars 24, 2005

Google: Blogues ou bogues dans les News ?

5 Commentaires:

mercredi, mars 23, 2005

Google: 5 milliards de "the" sont partis en fumée

10 Commentaires:

Google: 5 billion "the" have disappeared overnight

0 Commentaires:

mardi, mars 22, 2005

Handicap: Naviguer sans vue

9 Commentaires:

Traduction: Phraselator pour Rambo

1 Commentaires:

lundi, mars 21, 2005

Texte: Jacques a dit

0 Commentaires:

samedi, mars 19, 2005

Texte: Une montagne de mails

0 Commentaires:

jeudi, mars 17, 2005

Lexique: Sans frontières

9 Commentaires:

Services: Lettré !

0 Commentaires:

mercredi, mars 16, 2005

Lexique: Glissance et pénétrance

11 Commentaires:

lundi, mars 14, 2005

Texte: Le flot de l'histoire

8 Commentaires:

dimanche, mars 13, 2005

Web: Google ajuste ses comptes

4 Commentaires: