Mensonges et statistiques

Image par HikingArtist.com

“Il y a trois sortes de mensonges: les mensonges, les gros mensonges et les statistiques.” Mark Twain

“Les statistiques, c’est comme le bikini: ça donne des idées mais ça cache l’essentiel!” Coluche

Si vous pensez que les mots sont utiles pour mentir, vous vous foutez le doigt dans l’oeil jusqu’au coude. Rien ne vaut les chiffres. Chaque jour, on se fait blouser, abuser, arnaquer et manipuler par les chiffres. La raison est simple : c’est tellement plus facile de mentir avec un calcul orienté qu’avec une argumentation construite. Parfois maladroit et souvent malintentionné, voici les arnaques les plus courantes et comment les débusquer.

Que cela soit dans la presse, de la part du gouvernement ou lors d’une conférence professionnelle, les situations sont fréquentes et elles ont toutes un point commun : celui qui émet le chiffre veut faire passer un message.

Les arnaques les plus courantes

Le salaire moyen dans l’entreprise X est de 50 000 €

Vous avez peut être en tête l’annonce du salaire moyen chez Goldman Sachs qui disait “la banque prévoit de verser un salaire moyen de 770.000 dollars à ses 30.000 employés”. Qu’est-ce que ça veut vraiment dire ? Si je suis embauché demain chez GS, j’aurai moi aussi 770 000 dollars ? Non évidemment, c’est une technique journalistique pour dire “ou lala chez GS on palpe du dollar alors que c’est la crise”. Nul doute que la femme de ménage chez GS touche un salaire de… femme de ménage.

C’est donc l’utilisation d’une moyenne qui exprime cela alors qu’un calcul du salaire médian aurait été plus parlant et qu’une communication sur les quantiles aurait été honnête.

Dans le livre How to Lie with Statistics , voici un exemple plus parlant de cette arnaque :

  • 1 personne gagne 25 000 €
  • 1 personne gagne 7 600 €
  • 2 personnes gagnent 5 500 €
  • 1 personne gagne 3 458 € (la moyenne)
  • 3 personnes gagnent 3 500 €
  • 4 personnes gagnent 2 500 €
  • 1 personne gagne 2 100€ (la médiane)
  • 12 personnes gagnent 1 400 € (le mode)

Vous pouvez ainsi communiquer que le salaire moyen est de 3 458 € alors que la médiane se situe à 2 100 € et que le mode (la valeur dominante) est lui à 1 400 €.

Nos bénéfices vont aux salariés

Une seule entreprise peut communiquer selon ce qu’elle veut bien dire. Souhaite-t-elle montrer qu’elle est très sociale ou qu’elle est très rentable ? Tout dépend du public !

Vous avez terminé une bonne année et vous souhaitez distribuer les bénéfices entre les 3 propriétaires. Avec 90 salariés et leurs 99 000 € de salaires, vous avez une moyenne de 1 100 € par salarié. Les 3 propriétaires ont reçu 5 500 € chacun et il reste 21 000 € de bénéfices à distribuer. Comment faire ?

Cas 1 :

Salaire moyen des salariés : 1 100 €

Salaire moyen et bénéfices des propriétaires : 12 500 € (5500 + 7000)

Cas 2 :

Retirons 15 000 € des bénéfices réalisés et distribuons-les sous forme de prime aux propriétaires. Prenons soin alors d’inclure les salaires des propriétaires avec ceux des salariés.

Salaire moyen des salariés : 1 403 €

Bénéfices des propriétaires : 2 000 €

C’est mieux non ? Voilà une entreprise sociale 🙂

Les prix de l’immobilier dans la ville de Y ont progressé de 25 %

Une annonce de la sorte pose plusieurs questions : 25 % par rapport à quoi ? A quand ? Quel est l’échantillon ?

Il est très facile d’observer un saut de 25 % pour peu qu’un manoir à 5 millions d’euros se soit vendu dans la ville en question.

Les chiffres sont-ils corrigés de la saisonnalité ?

La progression se base-t-elle sur un chiffre précédemment calculé de la même manière ? Il est facile de fixer un point bas avec un calcul orienté en janvier et d’annoncer triomphalement une progression avec un autre calcul en juin.

Je me suis fait 10 000 € ce mois-ci

Le classique du commercial freelance. Il a fait un mois exceptionnel qu’il essaie de faire passer pour un mois comme les autres. De plus, il oublie de vous parler des 80 heures qu’il a fait pour obtenir cela ou des 4 000 € de frais qu’il doit déduire et des 2 500 € de cotisations sociales qu’il doit payer. Au final, il lui reste quand même 3 500 €. C’est bien mais ce n’est pas la même chose 😉

Là encore, il ne faut pas se laisser impressionner par des annonces de chiffres bruts si l’on a pas l’ensemble des éléments et le véritable contexte.

Le produit approuvé par 90 % des utilisateurs

A moins de vendre une merde immonde (pléonasme?), le produit sera approuvé de facto par l’immense majorité des utilisateurs, ceci si l’on considère que l’enquête est basée sur le nombre de réclamations. Que vaut l’enquête si elle est basée sur un sondage des clients ? Achèteriez-vous Apple, Renault ou Nike si vous n’étiez pas un peu convaincu de la qualité du produit ? Et si vous vous êtes planté, allez-vous le crier au premier venu ? Et si vous le faites, va-t-on prendre en compte votre avis ?

Bref facile. D’ailleurs, 99 % des lecteurs de cet article sont absolument d’accord avec ce que je viens de dire.

Les lecteurs de Y sont plus intelligents que la moyenne

Comment savoir si les lecteurs d’un site sont plus intelligents que les autres ? Simple, demandez-leur ! Prenez une revue un journal qui s’adresse logiquement aux cadres supérieurs qui réalise un sondage auprès de ses lecteurs, que sera le résultat ? (si cet exemple semble grossier, la réalité ne l’est pas moins!)

Les 7 outils classiques pour manipuler les chiffres

Omettre les données qui nous gène du calcul : le plus commode. Je veux montrer que j’ai atteint l’objectif de chiffre d’affaires que l’on m’a fixé. Je montre le chiffre d’affaires total et j’omets les dépenses supplémentaires à la normale qui ont été nécessaire pour l’atteindre. Celui qui ne vérifie que la formule de calcul n’y verra que du feu.

Choisir la formule qui nous avantage : moyenne, médiane, mode : le choix ne manque pas.

Changer de formule lorsque le vent tourne : une combinaison des points précédents. Le marché baisse ? Modifions la formule pour lisser les variations à la baisse (ne vous inquiétez pas, nous changerons la formule lorsque le marché repart à la hausse pour en amplifier le mouvement).

Changer de données lorsque le vent tourne : Si modifier la formule ne suffit pas, nous modifierons aussi l’échantillon. Nous trouverons un critère, peu importe lequel, pour exclure les données qui ne nous avantagent pas. Par exemple pour un calcul d’un indice à la consommation, je peux décider de sortir le coût du logement parce que je décide que le logement ne se consomme pas, ce que l’on appelle aussi “chercher la clé au pied du réverbère”.

Faites un sondage : c’est la rolls de la manipulation. Vous maitrisez la formule et les données. Le top ! Qu’est-ce a commandé le client déjà ?

Saisonnalité : les chiffres des ventes en matière d’immobilier ou ceux du tourisme sont soumis à ce que l’on appelle de la saisonnalité. Ainsi, des schémas récurrents se reproduisent chaque année et au lieu d’avoir un nombre régulier de vente chaque mois, nous avons plus de ventes au printemps et moins en hiver. Évident une fois que c’est dit, cela reste un formidable outil pour annoncer tantôt le chiffre brut et tantôt un chiffre corrigé de la saisonnalité.

Échelles : jouer avec les échelles des graphiques, c’est magique. Vous voulez montrer que les salaires dans la fonction publique sont maitrisés et que les dépenses sont stables ?

Prenez une échelle qui part de 0 et les dépenses mensuelles (en millions d’euros) sur 2 ans et vous aurez une petite courbe qui oscille légèrement.

Vous voulez montrer que les salaires progressent ou que les dépenses explosent ?

Prenez les dépenses mensuelles sur 10 ans et choisissez comme point de départ le premier montant identifié et vous aurez une courbe à la croissance impressionnante.

A lire pour creuser le sujet :