Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter

vendredi, juillet 31, 2009

Wikio: Informationen aus 116518 Blogs

Après la France et le Royaume-Uni, la blogosphère allemande a eu un droit à la visite de mes gentils algos et ça y est : la barre des 100 000 blogs y dépassée également sur Wikio.de. Je vous ai raconté les difficultés que posait l'anglais (comment séparer le Royaume-Uni des US par exemple). Les blogs allemands ne posaient pas ces problèmes (les blogs suisses et autrichiens sont marginaux et pour l'instant, faute de sites dédiés, Wikio les intègre au site allemand). En revanche, ils en posaient d'autres. En particulier le fait que les blogueurs allemands publient assez volontiers en deux langues, l'allemand et l'anglais, au sein du même blog, et même parfois au sein du même billet... Ca m'a obligé à retailler quelque peu mes algorithmes de détection des langues ! Beaucoup de spam et de porn aussi (et là, j'ai drôlement révisé mes notions d'allemand !).


Le résultat est assez intéressant. Non seulement en volume, mais aussi en qualité, puisque, au-delà de l'identification des sources, mes algos essaient de catégoriser les blogs du point de vue thématique. Wikio.de a ainsi pu sortir le mois dernier un nouveau classement Santé (Gesundheit) qui est très intéressant à comparer avec le classement français, si vous lisez un peu l'allemand. Dans quelques jours ce sera un classement des blogs de loisirs créatifs (Kreativ-blogs) qui sera publié (le lien précédent n'est pas encore actif : il le sera le 5 août), puis en septembre encore d'autres catégories, dont Linux, et peut-être encore d'autres.

Je me suis amusé à sortir une petite cartographie de la Wikiopole allemande, avec nos amis de RTGI-Linkfluence :


La comparaison avec la Wikiopole française est là aussi pleine d'enseignements :


La blogosphère française fait apparaître des "îlots" beaucoup plus marqués : le rouge c'est la high-tech, le vert la politique, l'orange les loisirs, le blanc, la littérature, etc. L'image est beaucoup plus diffuse en Allemagne, ce qui montre que les blogueurs ont beaucoup moins tendance à se regrouper en communautés relativement étanches. Cela confirme l'impression que l'on a en se baladant sur les blogs allemands : les blogs high-tech citent aussi les blogs politiques, etc. J'avais déjà mentionné le fait que les différents pays ont des habitudes de blogging assez différentes, par exemple en ce qui concerne le nombre de liens [ici]. Les deux sont peut-être liés : si on lie beaucoup, on lie (on lit ?) peut être des choses plus diverses. A analyser plus en détail...

En attendant, ne vous gâchez pas les vacances en attendant trop nerveusement le prochain classement (qui sortira le 5 août). Mais déjà un petit scoop : ce mois-ci c'est un nouveau classement Linux qui va sortir (le lien ne sera actif que le 5). Extrêmement intéressant, à mon avis. Comme je l'ai déjà dit plus d'une fois le côté "podium" m'intéresse peu : je vois dans ces classements surtout un outil de découverte, et un guide pour la lecture. Et j'ai fait de belles découvertes (pourtant je croyais bien connaître ce secteur...). J'espère que vous en ferez aussi. Vous pourrez les exporter en OPML dans votre lecteur favori.

En attendant, voici les mot-clés les plus fréquents dans cette nouvelle catégorie :

LinuxUbuntuHigh-techDroits et licencesInternetOSGraphismeOpen SourceLogiciels libresMozillaFirefoxDebianGoogleWindowsMandrivaLoi HadopiKdeEconomieLogicielsSQL

Ca a l'air conforme à l'univers Linux, non ?

Libellés : ,


9 Commentaires:

Blogger Epamin' a écrit...

Je crois que je me coucherai moins bête les soirs où je serai passée par ce blog...

(Ces "cartes" des blogosphères allemande et française ressemblent à de véritables œuvres d'art...)

31 juillet, 2009 18:18  
Blogger Jean Véronis a écrit...

C'est drôlement gentil, ça, Epamin' ! Si je peux vous aider à vous endormir... Mais j'ajouterais que la lecture d'autre blogs y contribue aussi (pas à s'endormir — à se sentir un peu moins près du singe), dont celle de la superbe &.

31 juillet, 2009 19:05  
Blogger Epamin' a écrit...

Merci pour le lien et pour le gentil compliment!

31 juillet, 2009 20:42  
Anonymous mapics a écrit...

Beau travail et plein de chose qui nous montre que d'un pays à l'autre et habitude change en matière d'internet. merci pour se billet.

03 août, 2009 01:29  
Anonymous vidi a écrit...

Très peu de littérature et de loisirs en Allemagne... En revanche, la politique est partout !
C'est pas mal du tout ces cartes blogographiques...!

03 août, 2009 16:49  
Anonymous Ferocias a écrit...

J'ai une petite question à poser sur le classement wikio d'août 2009.
Dans le Wikiopole, mon blog apparaît au 409 et dans le classement Wikio 1988e. Ca ne me semble pas cohérent /-: (et un peu étrange cette descente alors que j'ai reçu plus de liens que les mois précédents).




Mais mon ego survivra, c'est juste pour comprendre le fonctionnement.

05 août, 2009 20:22  
Blogger Jean Véronis a écrit...

Ferocias> Oui, c'est étrange... Je me demande s'il n'y a pas une nouille dans le potage. Je demande à Wikio de vérifier !

05 août, 2009 20:45  
Anonymous Guillaume R. a écrit...

Impressionnants et très parlants, ces deux cartes des "Wikiopoles". Je me posais juste deux questions : que représente le bleu ? Et - surtout - pourquoi la thématique 'Littérature' semble si peu présente dans la Wikiopole allemande ?

22 août, 2009 11:12  
Anonymous Cobab a écrit...

Un truc remarquable dans ces deux cartes, c'est qu'elles s'opposent selon une structure proche de l'opposition entre les répartitions de population : centre hyper-dense entouré de désert vs centres multiples moins hiérarchisés et peuplement diffus…

13 septembre, 2009 12:29  

Enregistrer un commentaire

lundi, juillet 27, 2009

Récré: Oulipotacheries

Bien susr, ma page Wikipedia bizarroyde n'estaict qu'vne blague de potache (vng "faque" comme l'on dict de nos iours), duë à mon collegue Gilles Esposito-Farese de l'Imstitut d'Astrophysicque de Paris, specialiste de grauitatiõ quanticque danz le ciuil & grand amateur d'Oulipo danz le priué. Ce quy est assez amusanct c'est qu'elle a trompé (vng instanct seulement, bien susr) des Wikipediens aggueris, quy onct commencé à chercher comment on auaict bien leur "hacquer le tamplate"... Remarquez, ie me seroys probablement faict auoyr moy aussi : on ne regarde praticquement plus la barre d'VRL (ce quy monctre que le hameçonnage a encore de beaulx iours deuanct luy !).


Son site Baragweb est vne pure merueille. Ne vous layssez pas tromper par les apparances : c'est blanc, ça n'a pas le louque standard 2.0 Wordpress-Ioomla-Spip (d'ailleurs quel repos pour les yeulx finalement que de ne pas auoyr ces bannieres, ouïdgets & machins quy clignotent de partout...), mays vous y trouuerez tout vng tas d'outils quy vous permettronct d'ecrire en orthographe dyslexicque, de iouer sanz fin auec la mestathese ou de traduyre vos pages danz des langues drosles & inconnues. A costé, le Pourrisseur de textes faict figure d'anticquycté !

Ma fausse page Wikipedia a esté obtenue à l'ayde de la mesthode S+7, inuenctee par Iean Lescure en l'an de grasce 1961, quy comsiste à remplacer chacque substantif (S) d'vng texte par le septieme substantif quy le suyct danz vng dictionnayre (S+7). Effet surrealyste garanti.

Ie suis susr que si vous allez susr Baragweb, votre iournee de trauail va estre foutue. En pus il faict chaud, on n'a pas vrayment enuire de trauailler... Mais grande rygolade & grande ioye vous en conceurez !

14 Commentaires:

Anonymous Cochonfucius a écrit...

J'ai testé ça sur ma page d'hommage aux frères Grimm.

(Suivre le lien "uariancte parodicque").

27 juillet, 2009 17:08  
Blogger Jean Véronis a écrit...

Excellent ! Ca vieillit les Grimm de deux siècles ;-)

27 juillet, 2009 18:48  
Anonymous ls01 a écrit...

Appliqué à l'actualité récente, cela donne des résultats pas piqués des hannetons... Merci Jean pour cette trouvaille!

27 juillet, 2009 18:53  
Blogger Jean Véronis a écrit...

Ah, j'adore ! "un nouveau biniou sera communiqué demain... "! c'est vieux comme le monde ces trucs surréalistes (en tout cas le mien, de monde) mais on ne s'en lasse pas.

27 juillet, 2009 19:16  
Blogger eleonore a écrit...

Vive Oulipo !

28 juillet, 2009 11:05  
Blogger Epamin' a écrit...

Excellent, absolument excellent !
Je découvre par hasard votre blog et j'apprécie beaucoup... tout!

Comme disent certains dans la "blogosphère", je plussoie ou je plussois aux propos d'Eléonore.

28 juillet, 2009 11:12  
Blogger Jean Véronis a écrit...

C'est gentil, merci !

28 juillet, 2009 11:39  
Blogger latsami a écrit...

Quel bel hommage d'avoir sa page wikipedia hackée de cette manière :)

Je viens tout juste de terminer mon Master Media Design à Rotterdam avec le projet Blind Carbon Copy (http://blindcarboncopy.cc) qui consiste à refléter/contourner les restrictions imposées par la propriété intellectuelle à travers des filtres textuels. L'un de ces filtres, le "thesaurus", remplace le mot le plus rare de chaque phrase (ou proposition) d'un texte par son synonyme le plus fréquent.

Je n'avais pas du tout pensé à piocher dans les archives oulipiennes pour créer d'autres filtres (ça devait sûrement être le contexte hors-France). Bien que j'ai dans la tête de réadapter mon filtre "plagiat", cherchant chaque phrase d'un texte dans GoogleBooks, reflétant la pensée de Raymond Federman dans son article "Imagination as Plagiarism". La réadaptation à laquelle je pense refléterait la notion oulipienne de "plagiat par anticipation" cherchant les phrases sur Google et non plus sur GoogleBooks.

En tous les cas, j'aimerais beaucoup avoir votre opinion de professionnel du langage (si vous en avez le temps bien sûr!)

29 juillet, 2009 10:25  
Blogger ok a écrit...

On a jamais envoyé des mecs sur la lune, combien de temps faudra t-il le répéter?

29 juillet, 2009 12:40  
Blogger Jean Véronis a écrit...

ok> Pas grave : même si on n'a fait qu'inventer la réalité virtuelle en 1969, c'est déjà pas mal (peut-être même encore plus fort!)

29 juillet, 2009 12:43  
Blogger François le niçois a écrit...

Je me permets de vous adresser un lien vers un blog littéraire que je me suis amusé à commenter selon la méthode S+7
http://lemploidutemps.blogspot.com/2009/07/la-poste.html

31 juillet, 2009 15:30  
Blogger Jean Véronis a écrit...

François> Excellent ! Il faudrait faire un générateur automatique de commentaires !

01 août, 2009 21:11  
Blogger Wanatoctoumi a écrit...

Je ne saurais trop approuver l'hommage que vous rendez à l'exceptionnel "gef" et à ses diaboliques outils (que je me refuse à utiliser, parce que je travaille en artisan!), ses magnifiques "pinacogrammes" et ses multiples compositions oulipiennes : du grand art !

En découvrant votre blog, ce soir, je me dis que je n'ai pas perdu ma soirée... et que je pourrais bien venir en "gaspiller" plein d'autres à l'avenir !
Très cordialement
Un Marseillais à un Aixois
Wana

08 septembre, 2009 00:40  
Blogger Le coucou a écrit...

Mtislav m'a conduit ici, et là-bas, à ce jouet qui aurait sans nul doute follement amusé Queneau, ou Le Lionnais… S+n, j'ai adoré! Merci à vous et à votre ami…

20 septembre, 2009 22:57  

Enregistrer un commentaire

mardi, juillet 21, 2009

Etrange: Quand Wikipedia déconne...

J'avoue que je surveille ma page Wikipedia de temps à autre. Pas trop par ego, mais plutôt parce que, comme beaucoup de monde sans doute, je suis vaguement inquiet des informations fausses qui pourraient s'y loger... Et comme maintenant le premier réflexe de tout nouveau contact est de vous chercher sur Google, Wikipedia, Facebook et autres bidules 2.0, autant que ce soit à peu près propre ! Ce n'est pas de la parano, juste une vague inquiétude, car jusqu'ici tout allait bien.

Mais voilà ce que je trouve ce matin en touillant mon café. Hé... !!!! Ca va pas non ? Que se passe-t-il chez Wikipedia ?




Je mène l'enquête illico, et je vous tiens informés dès que j'ai trouvé le coupable !


Lire la suite


Ici.

34 Commentaires:

Anonymous Art a écrit...

Un virus oulipien?
La cimaise ayant chaponné tout l'éternueur
Se tuba fort dépurative quand la bisaxée fut verdie
Pas un sexuée pétrographique morio de moufette ou de verrat
Elle alla crocher frange
Chez la Fraction sa volcanique
La processionant de lui primer
Quelque gramens pour succomber
Jusqu'à la salanque nucléaire...

21 juillet, 2009 09:36  
Anonymous Le Monolecte a écrit...

Je ne t'imaginais pas en petit rongeur roux, mais ils sont tellement mignons, que tu devrais laisser ;-)
Finalement, c'est très poétique, Wikipédia.

Question : tu as créé ta page ou quelqu'un s'en est chargé pour toi?

21 juillet, 2009 09:48  
Blogger Cba a écrit...

Arfff c'est bot man qui as encore frappé !

21 juillet, 2009 09:49  
Anonymous meriem a écrit...

J'aime bien le virus oulipien, comme explication, tiens!

21 juillet, 2009 09:58  
Blogger Gabrouze a écrit...

Après quelques recherches, Il semble que le coupable ai utilisé l'outil SP7 ou un similaire (http://jlpfractware.free.fr/outils.htm)

21 juillet, 2009 10:01  
Blogger florent1024 a écrit...

Cette page wikipédia présente désormais un aspect subjectif particulièrement touchant.

Ça n'est pas tout le monde qui a le droit d'avoir sa page wikipedia aussi personnalisée et stylisée !!

21 juillet, 2009 10:04  
Blogger Jean Véronis a écrit...

J'adore les Confitures de Bayrou (ou dé-Confitures ?) et les Mouilleurs de Sarkozy (je crois effectivement qui en a qui mouillent à l'UMP...).

21 juillet, 2009 10:13  
Anonymous Thomas a écrit...

Il me semble que le debilitron fournit des résultats assez semblable...
http://www.debilitron.com

Ca fait parfois du bien d'y mouliner quelques sites officiels ; les choses s'éclaircissent...

21 juillet, 2009 10:19  
Blogger TOMHTML a écrit...

Ça aurait pu être moi, mais pour une fois non ^^
Comme Thomas je pense que ça vient d'un site transformant le texte de manière plus ou moins aléatoire...

21 juillet, 2009 10:49  
Anonymous Jean-no a écrit...

Je l'ai signalé sur le bistro de Wikipédia.

21 juillet, 2009 10:50  
Blogger Jean Véronis a écrit...

Ecureuil peut-être, mais facétieux ;-)

21 juillet, 2009 10:55  
Anonymous Buzz a écrit...

on dirait un cadavre exquis... Un étudiant en colère ou un mauvais farceur (ou les deux...) ?

21 juillet, 2009 11:35  
Anonymous Anonyme a écrit...

Très jolie blague, je me suis faite avoir quelques minutes, recherchant où s'était introduit l'erreur. Bon par contre, Wikipédia® et son logo sont des marques déposées de la Wikimedia Foundation, Inc., organisation de bienfaisance régie par le paragraphe 501(c)(3) du code fiscal des États-Unis. Le logo est de plus protégé par la législation sur le droit d'auteur. Le reste ne pose pas de problème, le lien historique menant bien à la liste des auteurs originaux et la licence CC BY SA 3.0 est correctement indiquée.

Si vous pouviez juste masquer le logo et le titre Wikipédia, s'il vous plait ?

21 juillet, 2009 11:52  
Anonymous Jean-no a écrit...

Ah mais ça n'est pas sur Wikipédia surtout ! Hmmm... J'ai l'air malin maintenant :-)

21 juillet, 2009 11:52  
Anonymous Jean-no a écrit...

@Wikipédien Annonyme : l'humour est favorisé par la jurisprudence pour ces cas de droit des marques, même si certaines (RATP ou Danone par ex) ont déjà eu gain de cause dans des procès pour contrefaçon pour des sites humoristiques - enfin plus ou moins humoristiques car l'un était anti-ratp et l'autre appelait au boycott de Danone.

21 juillet, 2009 11:55  
Anonymous Maitre Cappello a écrit...

Anonyme, sans double n, espèce d'idiot, sapajou, Satrape, Scélérat, aérolithe, bachi-bouzoulk !

21 juillet, 2009 11:58  
Blogger Jean Véronis a écrit...

Anonyme: Sérieux ?

21 juillet, 2009 12:13  
Blogger Jean Véronis a écrit...

Capello> "Bouzouk", mille sabords !

21 juillet, 2009 12:15  
Anonymous Mael a écrit...

Conclusion à la lecture de l'article de Wikipédia : Jean Véronis est un grand poète ;-)

21 juillet, 2009 12:33  
Anonymous Jean-no a écrit...

Maître Cappello est bien eu, selon une loi bien connue de la communication sur Internet qui est qu'on fait presque toujours une faute dans les posts qui reprochent leurs fautes à d'autres.

Sinon, l'anonyme est sérieux, et pour se protéger, la fondation a déposé la marque et le logo (quand SFR utilise le logo de Wikipédia dans ses pubs, c'est à la suite d'un accord financier plus ou moins obscur pour les wikipédiens). D'ailleurs Wikipédia a déjà menacé d'attaquer (des copains en plus) pour contrefaçon de marque le site "Wikipédia Art". Il faut dire que la fondation a changé et ses avocats sont là comme ils pourraient être chez Pepsi, même si la communauté des wikipédiens ne soutient pas ce genre d'action (qui n'est pas terminée).

21 juillet, 2009 13:03  
Blogger Jean Véronis a écrit...

Jean-No> C'est le coup de l'arroseur arrosé (mais Maître Capello, contrairement à beaucoup de pynailleurs orthographysants a eu la grâce de pynailler avec humour !)

Quant à Wikipedia... eh bien ma foi, ça me désole qu'ils puissent se prendre autant au sérieux. Je conçois qu'ils veuillent protéger leur image et leur marque contre des usage pirates, commerciaux, etc., c'est bien légitime. Mais comme vous le faites très bien remarquer dans un précédent commentaire, l'humour (sans intention de nuire et sans prétention commerciale) est une autre chose (et est fort heureusement protégée par le droit français (et même américain).

Ca ne manquerait pas de piment que Wikipedia me fasse un procès en humour ! Je sens que ce serait le buzz du siècle...

M'enfin, pour prendre les choses au sérieux (bien qu'il ne faille pas), il vaudrait mieux avoir affaire à de vraies personnes plutôt qu'à de Gentils Anonymes...

21 juillet, 2009 13:20  
Anonymous Jean-no a écrit...

Le sérieux vient avec les histoires de gros sous, malheureusement... La fondation est fragile (quelques millions de dollars principalement investis en bande passante, le moindre vrai procès peut la laminer) mais la marque a une valeur : un des dix sites les plus visités ! Une fois que des tas de grosses boites vous prennent au sérieux, je suppose que vous vous y mettez aussi. J'ai peur à force d'un décalage entre les contributeurs et la fondation...

Le "chapitre" français de Wikipédia n'est pas trop porté sur les procès par contre. Il y a deux ans, un type a fait un procès parce que l'article qu'il avait écrit sur une langue qu'il avait inventée avait été effacée... Il a bien entendu perdu le procès mais l'association a décidé de ne pas lui imposer de payer les frais ainsi que la justice l'avait proposé. Donc l'association est capable de perdre de l'argent en gagnant des procès, donc pas d'inquiétude de ce côté là pour l'écureuil français :-)

21 juillet, 2009 13:32  
Blogger ebolavir a écrit...

http://sites.univ-provence.fr/veronis/blog/jv-wikipedia-20090721.html

Très joli. J'étais sur Wikipedia et j'ai mis quelques minutes pour trouver l'explication.

Pour le procès, pas trop d'inquiétude. L'article L713-3 du code de la propriété intellectuelle n'interdit l'invocation d'une marque par un autre que son propriétaire que s'il y a risque de confusion. C'est répété par Wikipedia sur chaque fichier logo http://fr.wikipedia.org/wiki/Fichier:TF1.svg
Mais peut-être est-ce le cas ici.

21 juillet, 2009 15:46  
Blogger Jean Véronis a écrit...

J'espère que personne ne confond le "fake" avec la vraie encyclopédie ! Encore que, quand on voit le degré de déculturation ambiant, on peut peut-être se poser la question...

21 juillet, 2009 16:27  
Blogger Raphael a écrit...

C'est moi, où l'algorithme consiste à simplement prendre le mot suivant (par ordre alphabétique) dans un corpus donné (en tenant compte de la nature du mot) ?
ou il y a des choses plus raffinées que je n'ai pas vu ?

21 juillet, 2009 17:21  
Anonymous TomD a écrit...

Comme indiqué il faut pour éviter tout risque de problème qu'il n'y ait pas de risque de confusion. L'humour n'est pas exclus de cela, et il faut clairement que la déformation humouristique ne porte pas à confusion (en gros on doit pouvoir distinguer un vrai d'un faux ;) )

21 juillet, 2009 19:38  
Anonymous Marocia a écrit...

Pour Jean-No :

http://lists.wikimedia.org/pipermail/foundation-l/2009-April/051505.html

Mieux vaut être complet dans ce qu'on apporte ;)

21 juillet, 2009 19:50  
Anonymous Jean-no a écrit...

@Marocia : Godwin dit ce qu'il veut... Les gens de Wikipediaart n'ont pas entendu les choses exactement pareil. Par contre il semble que la médiatisation de l'histoire ait fait réfléchir la fondation.

21 juillet, 2009 22:34  
Anonymous LNO a écrit...

Plus rien ne m'étonne sur Wikipedia...

22 juillet, 2009 04:29  
Anonymous Cochonfucius a écrit...

Dans le même genre, j'ai orné certaines de mes pages avec un script permettant de les débilitronner...

...suivre le lien "Attention au miroir déformant" en haut à droite, dans le rectangle jaune.

22 juillet, 2009 16:10  
Blogger ManuMeuh a écrit...

Rhooo ! Tout ça pour cranner devant tout le monde et faire chercher aux gens sa vraie page Wikipedia !

Monsieur Veronis, je ne vous félicite pas !


Meuh !!

23 juillet, 2009 14:21  
Anonymous pagesapages a écrit...

Très beau trèfle publié sur ce blog.
:-)

25 juillet, 2009 23:00  
Anonymous Jaun Rivero a écrit...

jejeje pour la prochaine fois essayez cette extension de la wikipedia ;)
http://wikitrust.soe.ucsc.edu/index.php/Main_Page

17 septembre, 2009 17:45  
Blogger Michelaise a écrit...

parce que vous êtes un écureuil... quel veinard tout de même !!!

11 novembre, 2009 14:36  

Enregistrer un commentaire