Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

jeudi, avril 16, 2009

Services: Suggestions sur Pages Jaunes

La fonctionnalité d'autocomplétion est à la mode. Google l'avait lancée avec son module de suggestion (pour l'anglais) dès 2005 (j'en avais parlé ici et ici). Elle est apparue ensuite sur Yahoo, sur Orange, et Google l'a aussi adaptée au français avec pas mal de retard (voir ici).

Depuis quelques minutes, elle est aussi disponible chez Pages Jaunes :


Dans le cas de Pages Jaunes, ce n'est pas si simple. Il ne suffit pas de remonter n'importe quelle requête fréquente tapée par les utilisateurs. Pages Jaunes est fidèle à sa tradition de qualité, et vous pourrez constater que par exemple dans le cas de couples pluriel/singulier, un seul remonte (ex.: plombier mais pas plombiers). D'ailleurs on nous propose (à juste titre) un plombier, mais des pompiers, un hôtel mais des vêtements, etc.

Le traitement des erreurs orthographiques est également soigné. Si vous suivez ce blog depuis longtemps vous savez sans doute qu'un bonne partie de la population tape génycologue au lieu de gynécologue (voir ici). Eh bien, tapez gen- : Pages Jaunes vous propose les gendarmeries, mais aussi les gynécologues.


Bien joué !

13 Commentaires:

Blogger Louis Volant a écrit...

Quand on se dit que la fonctionnalité d'auto-complétion est disponible sur Yahoo, Orange et les Pages Jaune, et qu'elle ne l'est toujours pas chez MSN Live Search...

... On est en droit de se poser quelques questions.

16 avril, 2009 16:39  
Anonymous fromageplus a écrit...

Ah oui, j'ai une question :
Pourquoi les moteurs de recherche supposent-ils SYSTÉMATIQUEMENT que nous fassions des fautes d'orthographe ou de grammaire dans nos recherches ? C'est littéralement épuisant de devoir multiplier les requêtes entourées de guillemets dans tous les coins pour espérer trouver la bonne informationn, dépêtrée de la gangue de réponses approximatives, voire carrément hors-sujet que Google va chercher tout seul !
Y a-t-il un moyen de désactiver cette désagréable et agaçante initiative de Google ?

D'autre part, j'espère que les Pages Jaunes continueront d'intégrer ces délices linguistiques dont j'avais mention en 2006 :
http://fromageplus.hautetfort.com/archive/2006/10/23/les-pages-jaunes.html

16 avril, 2009 17:11  
Blogger Jean Véronis a écrit...

Louis> Je n'ai pas de réponse... MSN était un peu à la traîne, mais je sais qu'ils bossent dur dans les centres de recherche (et pas que sur la complétion).

16 avril, 2009 17:20  
Blogger Toutankharton a écrit...

google fonctionne quand meme mieux : pour 'gén' il ne propose pas gendarmerie (qui mettrais un é pour chercher gendarmerie) mais genealogie. pour 'gény' on a bien gynéco

16 avril, 2009 17:26  
Blogger Jean Véronis a écrit...

FromagePlus> Pages jaunes essaie de ne proposer que des suggetions bien orthographiés, justement. Merci pour le lien : tordant !

16 avril, 2009 20:41  
Blogger Jean Véronis a écrit...

Toutankharton> Oui, il faudrait que Pages jaunes prenne en compte les accents dans la saisie. Ca ne semble pas être une amélioration bien difficile. Je parie qu'elle arrivera bientôt.

16 avril, 2009 20:43  
Anonymous az a écrit...

FromagePlus> c'est pénible effectivement.. ce comportement de la correction "par défaut" sans passer par les suggestions est assez récent il me semble.
Jean Véronis s'en souviendra peut être mieux que moi, mais je crois que ça date d'un an en gros.

La seule solution que j'ai trouvé pour le moment (mis à part ne PAS utiliser Google), c'est de mettre des '+' devant tous les éléments de ma requete.

Maigre consolation, mais c'est quand même un caractère de moins que de mettre deux guillemets :)

A une époque, il était également possible de "lier" les keywords d'une requete en mettant un '.' entre les mots, plutot que des guillemets autour.
C'était notamment pratique pour des recherches type [intitle:index.of], plus rapide que [intitle:"index of"]

Cette fonctionnalité 'cachée' a également disparue. Maintenant une recherche [soleil.noir] n'est plus équivalente à ["soleil noir"]
et [+"soleil noir"] n'est plus équivalent à ["soleil noir"]

Sans compter le nombre de résultats qui ne veut plus rien dire.. alors qu'il fût un temps ou c'était un indicateur utile lors du travail de re-formulation d'une requête..

Bref, pour la précision, il faut oublier Google maintenant. Nous autres les "power searchers" représentons tellement peu de part de marché pour eux qu'on ne peut pas espérer voir le moteur évoluer dans ce qu'on estime être "le bon sens".
Et de toutes façons, les "power searchers" ne cliquent pas sur les pubs... ;)

Pour faire de la recherche de précision, il faut plutôt aller voir du coté de Yahoo, qui dispose encore d'opérateurs très puissants.
Beaucoup ne sont pas documentés, mais ils peuvent être retrouvés en fouillant un peu... Il suffit par exemple de se souvenir que Yahoo a racheté Inktomi, qui dispose de documentation plus poussée.

Exemple de description de ces opérateurs : http://www.searchlores.org/inktomi.html
Si vous savez "crafter" des belles requêtes, la boite à outil de Yahoo/Inktomi est nettement plus utile que celle de Google.

Ah, et un petit exercice sur les moteurs de recherche : quels sont les moteurs qui permettent de trouver tous les résultats d'une adresse IP donnée ? (un [site:] qui fonctionnerait sur l'IP et pas le nom de domaine)

17 avril, 2009 18:26  
Anonymous Neville a écrit...

Tant qu'aucun moteur ne propose "Maître Kanter" quand on cherche "Gendarmerie" ...

21 avril, 2009 22:24  
Anonymous martine s a écrit...

juste comme ça: j'avais tapé youpee avec trois eee à la fin et le correcteur m'a proposé youpine, ça m'a fait un choc

25 avril, 2009 09:20  
Blogger Jean Véronis a écrit...

Martine S> C'est toujours très dificile de filtrer tous les termes "tabous"... mais dans ce cas précis, ce que vous me dites m'étonne. Je n'ai pas pu reproduire ce comportement.

25 avril, 2009 12:40  
Anonymous martine s a écrit...

c'est arrivé en rédigeant un message blog sur mon blog, il y a une semaine ou deux. Vous voulez dire que cela n'arrive que quand c'est moi qui écris (argh la parano)ou que vous ne me croyez pas?
tiens je vais rééssayer....

25 avril, 2009 14:57  
Blogger Jean Véronis a écrit...

Martine S> Merci de m'avoir envoyé la copie d'écran par mail. Nous étions sur un malentendu. Je croyais que vous parliez du service de suggestions de Pages Jaunes.

En fat, cette suggestion du mot "youpine" se fait dans la correction orthographique de Blogger (qui est aussi la plateforme du présent blog). Blogger propose aussi "salope" si vous tapez "salipe" et ainsi de suite. Tous mots "tabous" que Microsoft a enlevé de son dictionnaire il y a quelques années pour éviter des soucis.

Je ne sais pas ce qu'il faut en penser... Sur Pages Jaunes ça aurait certes très ennuyeux, car la proposition d'une rubrique "youpine" serait une énorme maladresse. Heureusement que ce n'est pas la cas.

Sur le correcteur orthographique d'un blog, je ne sais pas. Je peux défendre la cause féminine (ce qui est mon cas) et parler du manifeste des 143 salopes... Ou dénoncer le fait que la Miss France 2006 ait été traitée de youpine (ce qui a hélas été le cas).

Faut-il enlever ces mots du dictionnaire ? J'ai un peu peur d'un scénario orwellien. Comme l'on sait, le mot "chien" ne mord pas. Il faut parfois écrire des mots pour dénoncer ce qu'ils sous-entendent...

25 avril, 2009 18:50  
Anonymous ms a écrit...

@jean sur le fond, no problem en ce qui me concerne. un correcteur orthographique ne peut pas faire mieux qu'un dictionnaire et youpin/youpine c'est dans le dictionnaire.

C'est juste que ça m'a littéralement sauté au nez ( mon sens de l'humour est nazebroc). ça surprend...

25 avril, 2009 19:42  

Enregistrer un commentaire