Ce que vous ne savez pas sur les mesures d'audience sur Internet
Par Mathieu le samedi 14 décembre 2013, 15:38 - Informatique - Lien permanent
Les mesures d’audiences répondent à une problématique qui est ancienne. De tous temps, les créateurs de contenu ont cherché à savoir quelle était la valeur de ce qu’ils produisaient. Les artistes comptaient donc le nombre de personnes présentes à leur vernissage pour déterminer la cote de leurs créations, on mesurait les concerts publics à l’applaudimètre, et l’affluence d’un magasin au moment des soldes montrait l’impact de la marque sur son segment de marché.
De tous temps on a pu constater des failles au mécanisme de mesure d’audience : les invités qui viennent pour le buffet lors du vernissage, et non pas pour les œuvres, la faible précision de l’applaudimètre, etc.
Pourtant, ces statistiques sur l’audience des produits a petit à petit gagné la confiance des investisseurs, jusqu’à en devenir une référence qui ne mesurait plus simplement l’audience, mais aussi la pertinence. Un produit qui n’a pas une audience suffisante est jugé non pertinent, et est donc écarté du marché. Peu importe s’il est rentable ou non, puisqu’on vous a dit qu’il n’était pas pertinent. La sacro-sainte pertinence s’est alors couplée avec le concept de croissance, et la course à la mesure d’audience s’est engagée.
Mais les mesures d’audiences, comment ça marche ?
Approche passive/active
L’approche passive c’est les sondages : après l’exposition on va demander aux gens quelle a été leur œuvre préférée, s’ils ont apprécié la galerie, ou s’ils ont des suggestions à faire pour l’améliorer. Les inconvénients de l’approche passive, c’est d’abord le délai qui s’écoule entre l’événement et sa mesure, ensuite c’est l’impossibilité d’avoir un couvrement complet de la population considérée (on ne peut pas demander à tout le monde), et enfin c’est la forte subjectivité et le manque de précision des réponses.
L’approche active c’est la collecte à la source : on va mesurer directement la pertinence d’un événement, en utilisant des données issues de sources provenant de l’événement. Pour un magasin, cela peut consister à mesurer le temps passé par chaque personne dans le magasin, le panier moyen, le nombre d’articles différents au moment du passage en caisse, etc.
L’approche qui donne les meilleures données pour les mesures d’audiences c’est évidemment l’approche active. Non seulement elle fournie souvent des données chiffrées directement exploitables, mais elle a aussi la force de pouvoir couvrir une population plus large, et donc d’être plus fiable qu’une approche passive.
De plus, comme elle est bien souvent indolore, l’approche active a aussi l’avantage de ne pas gêner le client dans son “expérience d’achat”.
Dans la vraie vie, et sur Internet
La course aux mesures d’audiences ne va pas au même rythme dans le monde réel et sur Internet.
Dans le monde réel, l’approche active fera l’objet d’un consentement préalable à la fois de la CNIL et de vous-même (même implicitement). Quant à l’approche passive, vous êtes forcément au courant puisque c’est vous qui produisez les données en répondant aux questions.
Sur Internet, les choses sont différentes, et elles méritent d’abord de raconter un morceau d’histoire.
Au début, furent les fichiers logs
L’analyse d’audience, en informatique, vient du Reporting. Le Reporting c’est la surveillance des systèmes. En effet, aux débuts de l’informatique, lorsque les machines fonctionnaient personne ne se posait de questions, mais lorsqu’elles tombaient en panne, deux questions se posaient (et se posent toujours ) :- Pourquoi la machine est cassée ?
- Comment éviter que cela ne se reproduise ?
Pour répondre à ces questions, les logiciels se sont mis à produire des “traces”, ces traces ce sont les fichiers log. Les fichiers log, ce sont des fichiers texte contenant des informations techniques. En particulier, pour un serveur web, cela peut être l’adresse IP qui a initié la connexion, la page consultée, le navigateur de l’internaute, la taille de la requête, la méthode, etc.
L’analyse des fichiers logs permettait (et permet toujours) de savoir quand le logiciel a un problème, et bien souvent pourquoi.
Et puis un jour, quelqu’un a eu l’idée d’utiliser les fichiers logs pour avoir des statistiques sur la performance de son système (combien de temps il est en marche, combien de donnée ont été traitée, etc). C’est le tournant de l’histoire.
À partir de là une autre personne s’est dit que puisque dans les fichiers logs il y a la page consultée, la date, et un moyen relativement fiable de déterminer l’unicité d’un utilisateur (l’adresse IP), alors pourquoi ne pas réaliser les mêmes statistiques pour savoir quelles sont les pages qui sont le plus consultées ? Partant d’un bon sentiment, et souhaitant éviter de produire du contenu inutile, l’idée a plu à la fois au techniciens et aux commerciaux. Surtout aux commerciaux.
Vers la fin des années 90, la couverture ADSL du grand public a permis à Internet d’exploser en audience. Et les fichiers logs sont devenus insuffisants. En effet, comment savoir avec fiabilité le temps passé par l’utilisateur sur la page ? Comment gérer le cas des ordinateurs partagés (cybercafés, bibliothèques…) qui partagent la même IP ? Comment partager des données pour effectuer le suivi des utilisateurs sur plusieurs sites en même temps ?
Les navigateurs Web commençant à s’harmoniser en terme de technologie et de fonctionnalités (en particulier en terme de support du Javascript), c’est à ce moment là que les systèmes basé sur les cookies ont pu tirer leur épingle du jeu.
L’ère des cookies
Mais avant tout, quelques définitions :- Un navigateur web, c’est le logiciel qui vous permet “d’aller sur internet” : c’est celui que vous utilisez quand vous lisez ces lignes.
- Le Javascript est un langage de programmation sur le Web, il est exécuté après le chargement de la page par le navigateur, et permet donc une interaction riche avec l’utilisateur.
- Les cookies sont des fichiers de données au format texte. Ce sont des données que le navigateur stocke à la demande de programmes Javascript (ou autres), et qui sont réutilisées par la page que vous consultez ensuite.
Les avantages des cookies sont multiples par rapport aux fichiers log :
- Le cookie est manipulé à la fois par Javacript et par les langages plus lourds côté serveur, ce qui permet une portabilité de l’information contenu dans le cookie sur de nombreux langages et “univers” de programmation différents.
- Le cookie est persistant : il ne se réinitialise pas quand on change de page, et on peut donc stocker des données dans la durée, de manière fiable, et avec une relative confiance dans leur contenu.
- Le cookie peut être partagé ! En effet, on peut intégrer un cookie tiers dans une page, ce qui signifie que la donnée portée par un cookie peut appartenir à un autre site : le partage de données est possible !
Avec enthousiasme, les commerciaux et les techniciens ont commencé à intégrer des systèmes de suivi d’audience basés sur les cookies. Après tout, rien de très différent de ce qui existait déjà avec les fichiers logs, juste des statistiques.
Les statistiques ont pu gagner en pertinence et en volume de données. On pouvait alors savoir précisément d’où l’utilisateur venait, quelle était la page sur laquelle il quittait le site, quel était son chemin dans ses décisions d’achat. De simple statistiques de “hit” sur les pages se sont transformées petit à petit en suivi et traçage des comportements de l’internaute.
Et c’est là le problème. Il s’agit d’une analyse d’audience :
- Active
- Indolore
- Fortement invasive : TOUT ce que vous faites sur la page est susceptible d’être enregistré
- Persistante : le cookie est persistant
- Partagée : le cookie peut être partagé
- En temps réel : l’analyse peut se faire via un mécanisme de collecte en temps réel
Lorsque plusieurs sites se mettent à échanger les informations de suivi, cela constitue un véritable “réseau de suivi” qui surveille vos moindres gestes… Mais pour quoi faire, dans le fond ?
Et l’on exploita les données…
Au début les commerciaux ont demandé à collecter le plus de données possible, « en attendant de savoir comment on allait les utiliser », et ce n’est que très récemment, avec le Cloud Computing et les systèmes de Data Mining et Big Data que cela a commencé à prendre tout son sens.- Les systèmes Big Data, comme leur nom l’indique, sont ds systèmes capables de calculer des quantités astronomiques de données, de quoi pouvoir gérer l’immense volume de données collectés.
- Le Cloud Computing a permis de se défaire du surcoût lié à l’exploitation de machines assez puissantes pour traiter des Big Data : il suffit de louer des machines surpuissantes en salle serveur pour une heure ou deux, juste le temps qu’il faut.
- Enfin, le Data Mining, comme son nom l’indique, c’est une discipline qui vise l’extraction de données pertinentes à l’intérieur d’une immense masse de données. Juste ce dont on a besoin pour la suite.
N’oublions pas que le but principal des commerciaux, c’est de vendre. Pour les aider à vendre, ils trouvèrent les statistiques plaisantes. Ils pouvaient savoir quels étaient les produits qui marchaient le mieux, ils s’amusaient à « découper le marché en segments », pour pouvoir cibler tel ou tel profil de consommateur, mais ils manquaient de données. Ils n’avaient pas la possibilité de cerner un utilisateur dans leur segment dès l’entrée du magasin, ils ne pouvaient pas vérifier que le produit qu’ils avaient placé sur un segment était adapté avant la fin de la période commerciale. Ils étaient pratiquement aveugles, et se basaient en grande partie sur leur expérience personnelle.
Mais les données issues du suivi ont changé la donne. À présent, chaque achat, chaque mouvement, chaque action de l’utilisateur sur leur boutique en ligne pouvait être suivie, analysée, comprise pour en extraire le profil de l’utilisateur, ses centres d’intérêt, et ce qu’il était susceptible d’acheter. Mieux : lorsque l’utilisateur quittait la boutique puis revenait, on pouvait à présent lui proposer des produits qui lui plairont, en fonction de son parcours précédent dans le magasin. Ou comment avoir la proximité du commerçant de quartier, qui connaît tous ses clients, avec une boutique à plusieurs milliers d’utilisateurs.
La question n’était à présent plus de savoir quels étaient les produits qui marchaient, mais de savoir les produits qui allaient marcher.
Alors on a commencé à voir fleurir les publicités ciblées. Vous savez, cette publicité qui vous suit partout. Vous consultez sur une marque de chocolat dans votre magasin favori, puis vous quittez le magasin. Vous allez surfer sur Internet, et la publicité pour le chocolat que vous avez regardé apparaît sur le côté. Vous allez regarder une vidéo, et le chocolat revient dans les publicités de la vidéo. Vous consultez la météo du lendemain, et le chocolat vous nargue encore dans son coin, vous murmurant « tu n’as pas fini tout à l’heure, achète moi s’il te plaît ».
Et puis, forcément, au bout d’un moment, les utilisateurs sont devenus méfiants. Ils se sont mis à vider leurs cookies à la fermeture de leur navigateur. Ils se sont mis à activer des bloqueurs de publicités. Ils se sont mis à se défendre, et à demander un contrôle de leurs données. La CNIL a commencé à se réveiller et exiger une information des utilisateurs. Mais le commercial avait plus d’un tour dans son sac.
De l’invisible au consenti
Cela embêtait bien les commerciaux que les utilisateurs se mettent à bloquer leurs mécanismes de traçage. Mais à ce moment là est apparu un nouveau phénomène qui allait tout changer : les réseaux sociaux.On cite souvent Facebook en premier, mais les réseaux sociaux sont plus anciens que ça. Facebook est par contre le premier à avoir sans scrupules et aux yeux de tous commencé à exploiter les données que les internautes produisaient sur son réseau.
Le principe est simple :
- Vous vous inscrivez sur le réseau social, vous indiquez vos information personnelles. Ces informations ont une certaine valeur, mais assez faible dans le fond : il y a votre âge, votre catégorie professionnelle, votre sexe, qui sont des informations utiles.
- Vous commencez à réaliser des interactions avec d’autres utilisateurs du réseau, vous discutez avec certains et pas avec d’autres, vous créez des affinités.
- Vous cliquez de temps en temps sur une publicité ou sur un lien externe, seulement ceux qui vous intéressent.
- À partir de ce que vous avez cliqué, de ce que les gens avec qui vous avez interagit on cliqué, en fonction de ce qu’ils sont et de ce qu’ils font, le réseau peut vous proposer des contenus que vous trouverez pertinents, et que vous êtes susceptible d’acheter.
C’est très fort parce que :
- La dimension sociale d’un achat est mesurée : vous n’achetez pas seulement parce que vous êtes un consommateur, vous achetez au sein d’un groupe : connaître le groupe c’est connaître vos attentes.
- Vous y consentez passivement lors de votre entrée dans le réseau : vous cochez une petite case qui dit que votre activité peut être enregistrée, et c’est tout. Le réseau peut à présent exploiter son infrastructure pour proposer à la fois un service agréable à l’utilisateur (les interactions avec les gens), mais aussi un service commercial aux annonceurs (les interactions avec les produits).
Toujours plus proche de vous
On arrête pas le progrès. Après avoir acquis les segments temporels et sociaux, les commerciaux ont commencé à regarder avec intérêt le développement des smartphones. Ils ont même contribué de manière active à leur essor. Pourquoi ? Pour le segment de position.
Les smartphones sont à présent tous géo-localisables. Après tout, ce n’est qu’une donnée de plus à exploiter. En utilisant votre téléphone pour faire une recherche d’itinéraire, quoi de plus simple pour le site que de vous proposer les commerçants partenaires qui se trouvent sur votre chemin ? Vous avez des amis sur les réseaux sociaux, ils sont proches de vous, et vous vous rendez à un événement marketing ? Invitez les !
En intégrant un suivi des internautes jusqu’à un objet personnel, le plus intime de tous les objets, celui qu’on ne prête pas et qu’on garde toujours sur soi, les commerciaux ont à présent réussi à définitivement intégrer l’aspect individuel du ciblage de la publicité, la position géographique, et la dimension sociale.
Quelle est la morale ?
Finalement, qu’est-ce que tout cela nous apprend ?
Il faut brûler les commerciauxOn vit dans un monde de merde- Pourquoi je me laisse faire ?
J’ai souvent l’impression que les internautes ont arrêté de se battre après leur découverte des cookies. Pensant que c’était suffisant, et que le reste était lié par cette pièce maîtresse, comme une clef de voûte de la mesure d’audience.
C’est faux, comme nous venons de le voir. C’est d’autant plus faux à mesure qu’arrivent sur le marché les objets connectés, qui interagissent toujours plus avec les réseaux sociaux et les régies publicitaires.
Alors, comment faire changer les choses ? Exigez.
Exigez de pouvoir désactiver les fonctionnalités connectées, tout en continuant à utiliser votre matériel normalement. Exigez que les informations que vous fournissez soient correctement utilisées. Exigez de pouvoir utiliser un service même sans donner vos informations. Exigez d’avoir le contrôle de votre matériel et de vos logiciels. Refusez d’acheter un produit qui ne correspond pas à votre vision de la vie privée. Refusez d’installer une application qui accède à vos données si elle n’en a pas besoin pour faire ce que vous lui demandez.
Le jour où les consommateurs exigeront les produits qui leur donnent le contrôle, plutôt que des produits avilissants, les commerciaux changeront leur manière de les concevoir pour pouvoir continuer à les vendre.
Personnellement, chaque jour les internautes me désespèrent encore plus…