Exemple d’analyse statistique simple des variations de la mortalité sur les routes pendant les périodes où l’on peut espérer une amnistie et celles où cet espoir n’existe pas ou n’a pas été signalé dans les médias.

Origine : Claude Got 10 février 2007.

 

Le graphique ci-dessus exprime l’évolution de la mortalité sur les routes pendant l’année qui précède l’élection présidentielle et l’année de cette élection. Les valeurs sont exprimées en plus ou en moins par rapport au mois équivalent de l’année précédente. Il s’agit des valeurs brutes, sans correction de la saisonnalité ni de l’effet météo.

Il illustre le bilan des gains et des pertes en vies humaines pour les périodes considérées. En se limitant aux quatre premiers mois de l’année de l’élection (seul janvier 2007 peut alors être pris en compte), nous constatons qu’il n’y a que trois mois qui ont permis de constater une légère amélioration (- 4 tués en janvier 2002, -2 en février 1994 et – 4 en avril 2002). Les 9 autres mois indiquent une dégradation avec un excédent de 773 tués, principalement produit par la très forte surmortalité du début 1988. Le bilan de ces périodes est donc un excédent de 762 tués. Ce constat est purement descriptif, il ne permet pas d’attribuer ces 762 tués à l’amnistie, avec un risque d’erreur calculé. Il permet par contre de constater visuellement que l’amélioration régulière de la sécurité routière, qui est une tendance forte depuis l’été 1973 se traduit bien par un grand nombre de « barres » au dessous de l’axe zéro marquant les progrès par rapport à l’année précédente, sauf pendant la période qui précède l’amnistie où ces barres sont au dessus de l’axe zéro, marquant une dégradation.

L’intérêt de ce graphique est de permettre d’observer non seulement la période limitée de quelques mois précédant l’amnistie « espérée et annoncée », mais la période plus longue dont le début correspond au premier article de presse largement diffusé annonçant l’amnistie et tentant de prévoir son étendue. Le début de cette période a varié en 1987, 1994 et 2001 (elle commence avant l’année de l’élection) et il n’y a pas eu un tel phénomène d’annonce en 2006, nous y reviendrons.

Les méthodes statistiques destinées à apprécier l’évolution d’une situation dans le temps sont très variées et il faut avoir à l’esprit leurs objectifs et leurs limites. Nous pouvons distinguer :

-         le décompte des améliorations et des dégradations observées pendant une période donnée. C’est la pratique la plus courante dans le domaine de la sécurité routière. L’observatoire national interministériel de la sécurité routière indique par exemple que 4703 personnes ont été tuées sur les routes en France métropolitaine en 2006, alors que le nombre était de 5318 en 2005. La conclusion qualitative est que les résultats ont été meilleurs en 2006, la conclusion quantitative est que la mortalité s’est réduite de 615 (
-11,6%). Cette réduction est la conséquence de la modification du système complexe qui détermine la mortalité sur les routes et de variations liées au hasard. Les résultats peuvent être données chaque mois, en décembre 2006 et en janvier 2007 le nombre de tués sur les routes a été supérieur à celui observé pendant les mois correspondants de l’année précédente. Cette présentation des faits est la plus courante dans le domaine de la sécurité routière. Quand on continue à diviser l’espace et le temps (niveau départemental, niveau quotidien) les valeurs sont plus faibles et les variations aléatoires ont une influence plus importante, interdisant toute interprétation des résultats. Les variations mensuelles de la mortalité au niveau d’un département ne permettent pas de conclure à une aggravation ou une amélioration significative de la situation.

-         La modélisation de la situation en tenant compte des facteurs qui la déterminent. Facilitée par le développement des ordinateurs et des méthodes mathématiques adaptées à ces procédures, c’est la méthode la plus ambitieuse et la plus riche en information car elle ne se contente pas de constater une variation, elle l’explique. La difficulté est le déficit de
données précises sur les facteurs à introduire dans le modèle. Dans un système complexe associant des usagers, des véhicules, une infrastructure, un système de contrôle et de sanctions, des variations météorologiques… il y a souvent des discordances entre les niveaux d’observation, à la fois dans le temps et dans l’espace. Si une situation météorologique particulière a existé pendant une période limitée (par exemple la neige dans le centre de la France dans le dernier tiers du mois de janvier 2007), il faudrait des niveaux d’observation très fin de la circulation (kilomètres parcourus, distribution des vitesses ou vitesse moyenne sur les différents réseaux) pour pouvoir construire un modèle complet. Il est cependant possible d’utiliser les connaissances acquises sur les effets de certaines variations (la météo par exemple) pour construire des modèles moins complexes sans maîtriser quantitativement tous les facteurs d’influence.

-         Les méthodes intermédiaires utilisent des fonctions mathématiques pour tenter d’interpréter des séries temporelles et distinguer ce qui peut être attribué à des variations aléatoires (le hasard) et ce qui indique l’intervention d’un fait nouveau (qui n’est pas indiqué par la méthode, elle ne fait que rechercher et mettre en évidence une influence « nouvelle » qui se traduit par une modification de la « tendance »). L’importance de l’évolution et l’identification d’un fait nouveau peuvent être suffisamment nettes pour qu’il soit inutile d’utiliser ces méthodes. Quand la politique de contrôle et de sanction a été redéfinie fin 2002 et que la mortalité sur les routes s’est effondrée de 30% d’un mois sur l’autre, la réduction se maintenant à ce niveau pendant les mois suivants, il est inutile de mettre en œuvre des techniques d’analyse pour attribuer le résultat observé à l’intervention des pouvoirs publics. Les véhicules et l’infrastructure n’avaient pas variées d’un mois sur l’autre, ni les conditions de circulation dans des proportions susceptibles d’expliquer l’évolution. Quand les facteurs d’influence ne sont pas aussi évidents, il faut procéder à des analyses des séries chronologiques de données avec des méthodes adaptées. Il s’agit d’un domaine particulier de l’analyse statistique qui a été notamment développé par les économistes, les météorologistes, les épidémiologistes ou d’autres spécialistes tentant de comprendre si des variations dans le temps d’un paramètre peuvent être considérées comme le fait du hasard ou doivent faire rechercher un facteur d’influence associé à la variation observée. Les méthodes sont souvent repérables par les non spécialistes dans les travaux publiés par des dénominations particulières (modèles ARIMA, méthodologie de Box-Jenkins). L’objectif est d’éliminer les effets de la saisonnalité et de stabiliser la variance des données à l’aide de transformations mathématiques. Le rapport de 2002 réalisé par plusieurs chercheurs de l’INRETS, du LAB, du SETRA, de l’InVS et de l’Université de Reims-Champagne (souvent cité mais peu lu !) est un bon exemple de l’utilisation de ces différentes méthodes et de leurs limites. Il ne concernait que les amnisties de 1988 et 1995 et il est dommage qu’une nouvelle étude de ce type n’ait pas porté sur l’amnistie de 2002 et surtout que les remarques des auteurs concernant le déficit de données utiles n’ait pas été pris en considération.

L’existence des méthodes complexes particulièrement utiles pour faire des prédictions et mieux comprendre un système et ses déterminants ne doit pas faire oublier que les méthodes les plus « rustiques » sont utilisables et permettent de conclure dans de nombreux cas. Les méthodes d’analyse les plus simples ne visent pas à quantifier la variation attribuable à un facteur d’influence, mais dans un premier temps à reconnaître le caractère significatif de la variation observée.

Une des difficultés de l’analyse consiste à définir la période pendant laquelle le facteur évalué a pu exercer un effet. Si un producteur de lessive fait une publicité pendant six mois pour ses produits et suit les ventes pendant cette période et après l’interruption des messages publicitaires, l’analyse des résultats va lui permettre de savoir s’il y a eu un accroissement significatif des ventes et des techniques plus élaborées vont estimer la fraction de cet accroissement attribuable à la publicité pendant la période concernée (et éventuellement après la fin ce cette dernière), affectée d’un risque d’erreur comme toute évaluation de nature probabiliste. La conclusion sera du type : « il y a eu un accroissement significatif des ventes pendant la période où cette publicité a été faite, elle a été de 20% ». La méthode permet d’indiquer l’intervalle de confiance de cette conclusion.

Dans le cas de l’anticipation possible de l’amnistie, nous écartons les effets possibles de la première élection présidentielle au suffrage universel (1965), personne ne pouvait prévoir qu’elle serait suivie d’une amnistie, il faut également écarter les élections de 1969 et 1974 qui n’étaient pas prévues (démission de de Gaulle et décès de Georges Pompidou) et celle de 1981, qui était à la date prévue, mais qui n’avait pas provoqué dans les mois précédant l’élection la publication d’articles « indiquant » cette perspective de pardon des fautes à venir (cela a été vérifié en reprenant les collections des deux principales revues automobiles de cette période). Nous retenons les quatre dernières élections avec pour les trois premières un repère de début d’intervention qui est précis. Il s’agit de la première publication dans la presse automobile spécialisée d’un article de plusieurs pages, annonçant l’amnistie à venir, expliquant dans le détail ce que l’on peut en attendre (avec parfois des erreurs de prévision majeures, cela a été le cas en 2001/2002) et comment s’y prendre pour jouer la montre et atteindre le moment où l’amnistie sera effective sans avoir payé ses arriérés de contraventions. Le repère de fin de la période peut être discuté ; le texte de la loi retient habituellement la date de prise de fonction du président élu, mais on peut se poser la question de la connaissance par les usagers de cette référence. Ils lisent à nouveau des commentaires sur la loi d’amnistie en juillet, voire en août, quand le Parlement adopte la loi. Il est intéressant de faire les comparaisons en prenant ces deux repères et en observant si les résultats obtenus sont identiques ou différents avec une fin de période en mai ou en juillet.

La situation est un peu différente pour l’élection de 2007 puisqu’il n’y a pas eu au cours des 10 premiers mois de 2006 d’articles identiques à ceux de 1987,1994 et 2001, susceptibles de rassurer les usagers sur les risques de sanctions liés à leurs écarts à la règle. Nous pouvons tout au plus retenir que parmi les deux candidats retenus comme les adversaires vraisemblables du second tour, l’un Nicolas Sarkozy a affirmé précocement son opposition à toute amnistie, alors que Ségolène Royal dont on attendait la décision en novembre 2006, après son investiture par son parti, ne s’est pas prononcée à la date qu’elle avait indiquée et a donné un « mauvais signal » le 12 novembre 2006 en laissant entendre qu’il fallait discuter les modalités du permis à points à la suite d’une question sur la sévérité alléguée des sanctions concernant les faibles excès de vitesse. L’espoir d’une réglementation moins sévère et d’une amnistie a pu alors renaître, renforcé par son refus de prendre position quand la question lui a été posée à nouveau explicitement (Auto-Plus du 9 janvier 2007 et Nouvelle République du centre ouest du 14 janvier).

Nous utiliserons la série chronologique mensuelle des tués sur les routes depuis l’été 1973 qui a marqué la première rupture dans l’évolution de l’accidentalité (port obligatoire de la ceinture et limitations de vitesse en juillet 1973), soit une période de 33 ans et 7 mois (403 mois). Les mois « d’espoir plausible de pardon » avec les repères indiqués ci-dessus sont au nombre de 30 si l’on retient mai comme la fin de la période (6 + 8 + 14 + 2) et de 36 si l’on retient juillet (bien entendu pour l’élection qui se prépare le repère provisoire de fin de période est janvier 2007 et seuls les mois de décembre et de janvier sont retenus dans le total, l’espoir étant apparu « crédible » en novembre 2006). Nous pouvons donc comparer les mois « hors espoir plausible et signalé d’une amnistie » aux mois avec cet espoir. Les premiers sont au nombre de 403 – 30 = 373 ou de 367  avec juillet comme date butoir.

Nous pouvons alors construire le tableau à deux lignes et deux colonnes suivant fondé sur la comparaison entre la mortalité routière d’un mois donné et celle du mois correspondant de l’année précédente :

 

Mois avec espoir d’amnistie

Mois sans espoir d’amnistie

total

Mortalité accrue

22

119

141

Mortalité réduite

8

254

262

total

30

373

403

Et en prenant comme référence de fin de période le mois de juillet inclus, soit six mois supplémentaires pour les amnisties de 1988, 1995 et 2002.

 

Mois avec espoir d’amnistie

Mois sans espoir d’amnistie

total

Mortalité accrue

26

115

141

Mortalité réduite

10

252

262

total

36

367

403

Ces tableaux
correspondent à une période d
e 33 ans et demi

qui a connu une diminution importante de la mortalité (de 17 000  à  5 000 tués)
cette diminution s’est faite irrégulièrement d’un mois sur l’autre, à la fois du fait du hasard (variations aléatoires) mais également du fait des multiples autres facteurs déterminant le système (circulation, effets de calendrier, effets de la météo, décisions politiques, crédibilité des contrôles et des sanctions, évolution de l’infrastructure, du port de la ceinture, des véhicules etc). Dans l’ensemble et pour la période hors espoir d’une amnistie, nous avons observé 252 mois de baisse de la mortalité par rapport au mois correspondant de l’année précédente et 115 mois de hausse de la mortalité (2.2 fois plus de mois de réduction que de mois de hausse), alors que pendant les périodes d’espoir d’amnistie, le rapport s’inversait avec 26 mois de mortalité accrue et 10 mois de réduction (2,6 fois plus de mois de hausse que de baisse). Autrement dit il y a plus de cinq fois plus de risque d’avoir une croissance de la mortalité dans les mois qui précèdent l’amnistie que dans les mois se situant en dehors de cette période.

Un test statistique simple peut être appliqué à ce tableau à deux lignes et deux colonnes pour évaluer le risque d’erreur auquel on s’expose en affirmant que
, pendant les périodes qui ont été définies
, le risque que les différences observées soient liées au hasard est inférieur à une certaine valeur, il s’agit du test du chi2. Il s’obtient par le calcul suivant :

Pour le premier tableau (les valeurs entre parenthèses sont les valeurs calculées si la proportion était inchangée sur l’ensemble de la période, soit 141 accroissements de la mortalité et 262 réductions ou stabilité (un seul mois était identique au mois de l’année précédente) :

 

Mois avec espoir d’amnistie

Mois sans espoir d’amnistie

total

Mortalité accrue

22 (10.50)

119 (130.50)

141

Mortalité réduite

8 (19.50)

254 (242.50)

262

total

30

373

403

La différence entre les valeurs observées et les valeurs calculées est de 11.5 pour chaque case.

chi2 =  (11.52 /10.5) + (11.52 /19.5) + (11.52 /130.50) + (11.52 /242.50) =  12.6 + 6.78 + 1.01 + 0.55 = 20.93

Cette valeur de 20.93 représente moins d’une chance sur mille de se tromper en affirmant que les différences de variations de la mortalité entre les groupes de mois retenus ne sont pas liées au hasard (l’étude de Régis Bourbonnais et de Thierry Granger portant sur l’amnistie de 1988 et celle de
1995 avec des méthodes d’analyse de séries chronologiques plus élaborées concluait avec un risque d’erreur inférieur à 4.5 pour 1000). Le résultat n’aurait pas été très différent en prenant comme référence de la période concernée 1980/2006 au lieu de 1973/2006, la proportion de mois de hausse et de mois de baisse de la mortalité ayant peu varié sur ces périodes longues.

 

Mois avec espoir d’amnistie

Mois sans espoir d’amnistie

total

Mortalité accrue

26 (12.60)

115 (128.40)

141

Mortalité réduite

10 (23.40)

252 (238.60)

262

total

36

367

403

chi2 = 14.25 + 7.67 + 1.4 + 0.75 = 24.07 ce qui accroît encore la signification de la différence observée.