Des chiffres qui mentent
30/01/2010
C'est sans conteste Google qui a montré la voie : tapez "Hugo" sur le moteur de recherche, et ce dernier estime pas moins d'environ 7 480 000 résultats, pour le seul Web français ... mais ne vous en propose que 509.
Peu importe par ailleurs que le premier concerne Hugo l'escargot, site de coloriage pour les enfants, et que Victor n'arrive qu'en troisième place !
Pour Auchan, Google estime 3 260 000 résultats, même s'il n'en offre aujourd'hui que 380 : Carrefour se trouve mieux loti avec 7 530 000 résultats estimés et 595 fournis, mais on a droit au Carrefour des Arts, Carrefour des Possibles, au Carrefour du Développement, etc.
Bon, mais après tout, Google est gratuit, et on n'attend pas de lui une comptabilité exacte, mais des résultats pertinents - et là, il remplit plutôt bien son job !
Cela étant, j'ai déjà rencontré des spécialistes très sérieux, capables d'utiliser ces chiffres comme indicateur de visibilité des marques ...
Dans un domaine plutôt ludique, vous avez Howsociable.com qui calcule un score de visibilité des marques composite, agrégeant le score des pages Ning, des posts estimés par le blogsearch de Google, etc.
Auchan se voit gratifier d'un score global de 275, et 155 pour les Blogs : et en cliquant sur le lien correspondant, on doit normalement accéder à 167 431 mentions ! Miracle, je bascule vers une page Google qui estime 168 863 résultats (la différence, ça doit être la marge d'erreur) mais n'en montre qu'un petit millier : 20 par 20, personne n'ira jusqu'au bout, de toue façon.
Mais bon, on reste dans le gadget, alors ...
Quoique ...
Quoique, à multiplier les nombres fantaisistes et invérifiables, on banalise une culture, non pas de l'à peu près - ce qui demeurerait acceptable, sous certaines conditions -, mais du franchement n'importe quoi : on clame n'importe quoi, et de toutes façons, personne ne vérifiera. Personne ne peut vérifier.
Et peu à peu, on glisse du n'importe quoi ludique au n'importe quoi (prétendument) sérieux : on n'hésite pas à coller des chiffres fantaisistes et invérifiables là où le vulgum pecus s'attendrait à des choses un peu plus sérieuses.
Prenez le site de Trendy buzz, par exemple, qui annonce fièrement "745 264 sources indexées" : c'est vrai, ou c'est du pipeau ?
On n'est plus dans le ludique, ils ont des clients très sérieux : Nestlé, SFR, Publicis, etc., les logos s'alignent en bas de page.
A côté des sources indexées, s'affiche en direct le nombre de "retombées analysées" : et c'est spectaculaire, le compteur tourne en temps réel, c'est certainement un outil efficace ... qui reflète bien la production du Webd'aujourd'hui.
Quand je quitte le site, on en est à 51 316 379 retombées analysées ; quand j'y retourne le lendemain, nous voilà retombés à 51 315 782 : évanescence du Web ? Où sont passés les résultats analysés la veille ?
Je n'y comprends pas grand-chose, mais heureusement j'ai près de moi un copain informaticien qui rigole, affiche le code source de la page et me montre : l'ouverture de la page d'accueil déclenche une petite mécanique qui incrémente mes "51 315 782 retombées" de départ de nombres aléatoires - c'est le random de la copie d'écran ci-dessous !
Question : jusqu'où peut-on afficher des chiffres fantaisistes sans risque ? Faire des effets de manche, sans se soucier de ce que l'on présente ? C'est le niveau 1 de l'esbroufe ...
Et le niveau 2, c'est quoi ? Présenter des extrapolations tout aussi fantaisistes comme des réalités ? Sans bien entendu expliquer comme on y parvient, et quelle est la boite noire ...
Je me suis souvent demandé comment de joyeux bidouilleurs pouvaient dans leur coin, réussir à sortir des résultats instantanés, là où Google, avec sa puissance de feu, cale ...
Je crois que Google a ouvert la boite de Pandore ... et qu'ils sont nombreux, ceux qui ont mis le pied dans l'ouverture pour éviter qu'elle ne se referme !
PS : Trendy buzz a rédigé une réponse dans les commentaires, (je le signale pour être fair play) soulignant la somme de leur travail - dont acte -, sans nier non plus la présence d'un "compteur javascript". Je vous laisse juges de la nécessité de l'artifice.
3 commentaires
J'ai fait le test sur google.fr pour Hugo :
- j'obtiens environ 79 000 000 de résultats
- c'est bien Hugo l'escargot qui est en tête
- je peux naviguer jusqu'au résultat 823 :
http://www.google.fr/search?hl=fr&q=Hugo&start=820&sa=N
- mais le bouton "relancer la recherche en incluant les pages ignorées" me permet de naviguer jusqu'au 1000ème résultat :
http://www.google.fr/search?hl=fr&q=Hugo&start=990&sa=N&filter=0
TrendyBuzz veille et analyse en live l'actualité des entreprises, des marques, des individus, sélectionne les retombées web en fonction de leur influence et alerte intelligemment par email ou SMS. L'information est immédiatement disponible via une interface web 2.0 intuitive, dynamique et puissante capable de générer automatiquement des synthèses aux formats PDF et XLS.
Suite à notre conversation téléphonique de ce jour, je vous confirme les éléments suivants :
- La technologie TrendyBuzz a bien indexé plus de 50 000 000 publications émises par plus de 700 000 sources au cours des 31 derniers jours.
- Chaque nuit, nous supprimons les articles indexés il y a 32 jours (en revanche, nous archivons les données collectées pour nos clients). C'est la raison pour laquelle le chiffre ne croît pas de façon linéaire.
- Les nombres du compteur sont réels. Étant dans l'impossibilité de réaliser une requête sur la base de données toutes les secondes pour des raisons de "charge machine", nous avons mis en place un javascript qui incrémente le compteur de 4 messages / seconde (en réalité, aujourd'hui, les robots TrendyBuzz indexent, en moyenne, 14 messages / seconde).
Je me tiens à votre disposition pour toute information complémentaire et vous invite à tester librement notre technologie sur WASALive.com, le board des tendances internationales en temps réel.
Bonne journée,
Fabien
Sauf erreur de ma part, Google :
* estime statistiquement (sur échantillon ?) le nombre de pages qui contiennent un terme donné ; le résultat fluctue facilement du simple au double, selon mon humble expérience, pour un terme donné, d'un jour sur l'autre par exemple ;
* en sélectionne 1000 ;
* n'affiche ensuite, par défaut, que les pages différentes parmi les 1000 (Cf. commentaire de Julien).
L'estimation significative du nombre de pages contenant les termes de recherche, est donc bien celle donnée en haut de pages par google (7 530 000, c'est plus que 3 260 000), non le nombre de pages différentes (595, ce n'est pas plus que 380).
Les commentaires sont fermés.