Par

Depuis le début de la « crise du coronavirus », un déluge de chiffres s’est abattu sur les bulletins d’information. Quoi de plus neutre, de plus objectif, de plus scientifique, de plus indiscutable ?

par le comité de rubrique Sciences

Voici quelques doutes, non seulement sur les mensonges explicites (les masques, les tests) ou par omission (les morts à la maison), mais aussi sur les biais, les interprétations, dus autant à la malveillance qu’au manque de culture en statistique, chez les journalistes et hommes politiques, dans la population. Des articles scientifiques, des revues et vidéos de vulgarisation ont mis en garde à ce sujet, les grands média n’en ont cure et le public est trompé.

Nombres bruts
On nous a fourni chaque jour des nombres d’infectés, d’hospitalisés, de réanimés, de morts. Sont-ils si fiables ? Pour les hospitalisés, les réanimés, les morts à l’hôpital, les recueils de données sont en principe bien tenus. Pour les morts en EHPAD, les chiffres ont été un temps cachés. Pour les morts à domicile, une estimation crédible exigerait des études statistiques plus poussées (notamment à partir de la surmortalité, mais comment s’assurer de la cause ?). Pour le nombre d’infectés (à symptômes ou non), les doutes sont bien plus grands. L’augmentation, tel jour, du nombre d’hospitalisés ou de morts ne signifie pas une progression de la pandémie, car les courbes sont décalées : les symptômes apparaissent après un délai chez les contaminés, la mort n’est pas immédiate, elle dépend aussi des lits et matériels disponibles, chiffres souvent oubliés.

Nombres absolus ou relatifs, classements
Mille morts au Liechtenstein ou mille morts en Chine ou en Inde, cela n’a pas le même sens. Les nombres absolus doivent être appréciés de façon relative, mais relative à quoi (à la population, à la superficie ?) et alors quelles leçons en tirer ? À propos du département 93, stigmatisé pour mauvais respect du confinement, l’évêque de Saint-Denis faisait remarquer dans Golias Hebdo, qu’il s’agit d’un des départements les plus petits et les plus peuplés. Est-il étonnant qu’avec une densité de 6 900 habitants au km², un record de pauvreté et moins de possibilités de télétravail qu’ailleurs, la contamination y soit plus forte ? Les nombres bruts, fournis indépendamment des classes sociales, ne sont-ils pas aussi trompeurs ?

« Les caprices encore mal connus du virus, la situation antérieure des hôpitaux,la variété du climat, l’état des relations internationales, divers hasards, jouent bien autant, mais dans quelles proportions ? »

Où sont les frontières les plus pertinentes pour un virus ? Est-ce par pays ? Certains d’entre eux vivent du commerce international, d’autres sont presque en autonomie, des frontières sont poreuses, d’autres bien marquées : peut-on comparer la frontière franco-belge et celle d’une île (comme Taïwan) ? À l’échelle de la France, les bons comptages sont-ils par région, par département, par agglomération ? Les chiffres totaux pour la région Auvergne-Rhône-Alpes sont peut-être commodes pour l’Agence régionale de santé, mais en quoi les situations de la métropole de Lyon, d’une banlieue de Genève ou d’un village du Cantal ont-elles quelque rapport ? Les classements par pays (n’ayant pas le même mode de comptage) ont-ils un sens ? On nous dit souvent : « Dans tel pays, il y a eu beaucoup moins de morts, ou d’infectés, donc ils ont mieux géré ». Les caprices encore mal connus du virus, la situation antérieure des hôpitaux, la variété du climat, l’état des relations internationales, divers hasards jouent bien autant, mais dans quelles proportions ?

Risque et dangerosité
La mesure d’un risque (de contamination, de décès) est toujours une construction, un choix, jamais un index purement « naturel ». Deux taux sont utilisés : le « taux de reproduction de base », c’est-à-dire le nombre moyen de personnes qu’on contamine, le « taux de létalité », ou nombre de morts par rapport au nombre de contaminés. Ils ne sont pas arbitraires, mais ont leurs limites, en particulier parce qu’ils sont globaux, alors que la situation sur le terrain témoigne d’une grande diversité.

« L’augmentation, tel jour, du nombre d’hospitalisés ou de morts ne signifie pas une progression de la pandémie, car les courbes sont décalées : les symptômes apparaissent après un délai chez les contaminés, la mort n’est pas immédiate, elle dépend aussi des lits et matériels disponibles, chiffres souvent oubliés. »

La dangerosité doit-elle être mesurée par le nombre de morts ou par le nombre d’années volées ? On s’est indigné à juste titre face au commentaire : « Ce n’est pas si grave, puisque les morts sont surtout des vieux. » On a fait valoir que chacun avait le droit à la vie et à la dignité. Certes, mais si l’on « mesure » la dangerosité, est-elle chiffrable de façon absolue ? La mort d’un jeune de 20 ans a-t-elle le même sens que celle d’une personne de 95 ans, déjà en souffrance ? En 1760, d’Alembert et Daniel Bernoulli ont eu une discussion profonde et animée sur cette question, à propos de « l’inoculation de la petite vérole » (ancêtre de la vaccination, comportant quelques risques et surtout beaucoup d’incommodités). Tous deux en étaient partisans. Bernoulli estimait qu’on pouvait mesurer mathématiquement son avantage, à partir d’un critère unique, celui de l’allongement de l’espérance de vie. D’Alembert en doutait et pensait difficile de comparer un faible risque immédiat et un avantage lointain, d’apprécier un risque individuel et une moyenne au niveau de l’État, etc. Le débat ne peut être tranché dans l’absolu, il a des aspects qualitatifs et doit prendre en compte la notion de point de vue.

Raisonnement statistique
Nous sommes face à des phénomènes à causes multiples, à causes communes et enchevêtrées, immédiates ou non, avec interactions et rétroactions, pas du tout comme en physique élémentaire où l’on peut faire varier un facteur « toutes choses égales d’ailleurs », c’est-à-dire en laissant les autres fixes. Les données sont incomplètes, les maladies non isolées. Les risques bénins ou graves du virus et des confinements ont aussi des effets sur les famines, les suicides, les pollutions, d’autres maladies, en plus et en moins. On a dit, à tort ou à raison (mais peu importe ici), qu’à Wuhan la baisse de la pollution due au confinement avait diminué le nombre de morts par maladie respiratoire six fois plus que le nombre de victimes du virus. Les féminicides, les dépressions ont-ils augmenté par ce même confinement ?
Les média ne donnent que des comparaisons de pourcentage, jamais de raisonnements plus fins, jugés trop difficiles pour le lecteur ou l’auditeur (voire pour le journaliste), d’où une confusion entre corrélation et causalité. Quand deux phénomènes ont l’air de « marcher ensemble », on a spontanément tendance à croire que l’un est la cause de l’autre ; l’insinuation peut être volontaire ou non. Or c’est rarement le cas, ils sont mêlés à bien d’autres, ils peuvent être la conséquence d’un même troisième, ou provenir de combinaisons plus compliquées. La statistique mathématique a fait des progrès gigantesques depuis un siècle et permet en général de trancher, mais lorsqu’elle est utilisée à bon escient.
Comprendre ou obéir ?
La plupart des gens n’ont reçu aucune formation en probabilités et statistiques, même ceux qui par ailleurs sont cultivés en droit, en lettres ou en histoire. Ils sont souvent pris de terreur panique ou d’admiration béate quand on leur prononce des mots comme « exponentielle » ou « variable aléatoire ». Interrogez votre entourage : « Sachant que vous avez une certaine probabilité p d’être contaminé quand vous rencontrez une autre personne ; si vous en rencontrez 10, 100, 1000, ce risque sera-t-il 10p, 100p, 1000p ? ». On répondra : « Oui, évidemment » ou « Je ne sais pas ». La réponse est non. Un calcul assez simple permet de donner ce risque, lorsque les rencontres sont indépendantes, mais, comme ici elles ne le sont pas, c’est bien plus compliqué.

« Il conviendrait plutôt d’exposer les débats en transparence et non de prétendre hautainement que “c’est trop compliqué pour le peuple”. »

Il est donc assez facile d’asséner des seuils, sans les justifier (les dominants savent en jouer). Et, en plus, ils sont souvent mal compris. Ainsi a-t-on dit que les personnes de plus de 70 ans étaient à risque, certains croient qu’à 69 ans 3/4, on est à peu près tranquille, mais qu’il faudra se méfier dans trois mois. Le dimanche 10 mai à 23 h 59 il était dangereux pour la santé publique de se promener à 1,001 km de chez soi ; le lundi 11 mai à 0 h 01, on pouvait aller sans risque pour personne à 100 km. Face à l’absurdité de ces sauts brusques, on nous rétorque en général : « Il faut des règles simples et les mêmes pour tout le monde. » Jusqu’au jour, où on a distingué les départements rouges et verts… D’ailleurs, les mêmes nous affirment qu’il faut garder le statut spécial de l’Alsace-Moselle, en matière de laïcité. L’objectif n’est-il pas aussi de nous apprendre à obéir ? Mais un ordre stupide sera-t-il bien suivi ?

Modèles épidémiologiques
L’épidémiologie étudie quantitativement la propagation des maladies (contagieuses ou non). Ses modèles ne prétendent pas être identiques à la réalité, ce ne sont que des simplifications permettant les calculs. On décide de négliger certains facteurs, jugés secondaires dans les cas étudiés, on suppose des hypothèses d’indépendance, on remplace des variables aléatoires par des moyennes. Ensuite, il faut ajuster les paramètres issus des observations ou expériences. Bien entendu, on peut tenter d’affiner les modèles, en y introduisant des modes de dépendance entre les facteurs, de la dispersion dans les variables. Les spécialistes sont conscients des limites de validité, les ordinateurs permettent des modèles plus sophistiqués. Ces scrupules sont passés sous silence.
Surtout dans le cas d’une maladie encore peu étudiée, ces précautions s’imposent. On constate ou entrevoit ici des différences importantes selon qu’il s’agit d’hommes ou de femmes, de jeunes ou de vieux, de la ville ou de la campagne, de fumeurs ou de non-fumeurs, peut-être selon les groupes sanguins. On ne sait pas bien si les enfants sont porteurs sains, contagieux ou non, si le virus est saisonnier, ni quelle est la durée de l’immunité. Les experts sont divisés ou prudents. Les « microbes » sont des êtres vivants et ont droit à leur fantaisie. On nous a asséné, sans retenue ni critique, qu’il fallait que 50-80 % de la population ait été infectée pour qu’on soit « tranquille », 50-80 % de quoi, de la France, du monde, d’une région, d’une ville ? Chacun sait qu’il y a mille maladies qui se sont évanouies (mais n’ont pas disparu) sans que tant de gens soient infectés. Là encore, on nous a souvent servi les chiffres qui arrangeaient sur le moment, quitte à nous en servir d’autres le 11 mai. Il conviendrait plutôt d’exposer les débats en transparence et non de prétendre hautainement que « c’est trop compliqué pour le peuple ».

« 100 millions pour les hôpitaux et 500 milliards pour les patrons ou pour les banques : qu’est-ce que de tels montants évoquent dans le peuple, lequel sait (mieux que les dirigeants) se repérer autour de 1 euro pour la baguette ? »

Chiffres « économiques »
Les chiffres, ce sont aussi ceux de l’économie, de la politique, de l’écologie. La « santé » de la France nous est présentée uniquement par les cours de la Bourse, le PIB et « la dette », sans que ces indicateurs soient mis en doute. Pourtant n’ont pas manqué les discours sur le « jour d’après », où tout devrait être repen­sé, mais il n’est pas reconnu explicitement que, selon le type de société qu’on souhaite, ce ne sont pas les mêmes. Là encore, certains chiffres sont choisis plutôt que d’autres et ils servent aussi à éblouir : 100 millions pour les hôpitaux et 500 milliards pour les patrons ou pour les banques : qu’est-ce que de tels montants évoquent dans le peuple, lequel sait (mieux que les dirigeants) se repérer autour de 1 euro pour la baguette ?

Cause commune n°18 • juillet/août 2020