Méthodologie du modèle d’estimation de la surmortalité

Mise à jour : 4 avril 2024

L’excès de mortalité, ou surmortalité, est défini comme la différence entre une mortalité attendue en l’absence de perturbation, et la mortalité observée. Dans le présent document sont décrits les aspects techniques et les options de paramètres qui ont été développés pour l’estimation de la mortalité attendue à partir des données hebdomadaires de mortalité publiées par l’Institut de la statistique du Québec (ISQ).

Modèles pour l’estimation de la mortalité attendue et ses composantes

Le programme développé à l’aide du logiciel statistique R utilise des modèles de régression inspirés de la méthode proposée par Serfling (1963). Un modèle reposant sur certains principes similaires est également proposé par Verbeeck et coll. (2021). Selon les options choisies, notre modèle permet d’exploiter un modèle linéaire généralisé (GLM, en anglais) ou un modèle additif généralisé (GAM, en anglais) avec une fonction de lien logarithmique. Ces modèles comportent trois composantes : une composante pour prendre en considération la tendance séculaire de mortalité; une composante pour modéliser la saisonnalité et une composante qui tient compte des changements démographiques. Afin de prendre en compte une possible surdispersion des données, une distribution quasi-Poisson est supposée. Les modèles sont ajustés aux données des décès hebdomadaires de façon indépendante pour chaque groupe d’âge, chaque sexe et chaque sous-région.

Approches paramétriques et semi-paramétriques

L’outil développé permet d’estimer la surmortalité de périodes historiques (ex. : saisons grippales ou canicules antérieures) ou de l’année courante (ex. : pandémie de COVID-19). À cette fin, nous proposons des options paramétriques et semi-paramétriques pour la modélisation de la tendance séculaire et de la saisonnalité.

Pour la composante de tendance séculaire, l’option paramétrique utilise des polynômes de degré un à cinq (au choix) modélisés sur une échelle logarithmique, alors que l’option semi-paramétrique utilise des p-splines cubiques.

Pour la composante de la saisonnalité, l’option paramétrique inclut une fonction sinusoïdale de base, qui permet une variation entre une et quatre variations à l’intérieur de chaque cycle, tandis que pour l’option semi-paramétrique, nous utilisons des p-splines cycliques.

Lorsque des options paramétriques sont utilisées, le modèle est ajusté en utilisant une approche GLM et lorsque des composantes semi-paramétriques sont incluses nous utilisons une approche GAM.

Traitement des données aberrantes

Pour définir la mortalité attendue, le modèle permet d’exclure des variations de mortalité exceptionnelles produites par des influences exogènes. C’est notamment le cas de la mortalité par influenza, des vagues de chaleur extrême ou d’autres évènements extraordinaires. Si cette option est retenue, ces observations sont alors considérées comme aberrantes et sont exclues pour la modélisation de la mortalité attendue.

Pour le cas de l’influenza, il est possible pour l’utilisateur de décider la quantité de semaines autour des pics saisonniers d’influenza qui doivent être exclues du modèle. De cette façon, il est possible d’estimer une mortalité attendue « en absence » de la mortalité produite directement ou indirectement par l’influenza, à la manière de l’approche retenue par le consortium de recherche EuroMoMo.

De plus, il est possible d’identifier les données aberrantes de façon automatique. Pour cette fin, l’estimation se fait en deux étapes. Premièrement, on identifie des semaines où la mortalité excède des intervalles de prévision, dont l’utilisateur peut décider le niveau d’incertitude (ex. : 95 %). Deuxièmement, on estime la mortalité attendue en excluant les données aberrantes qui ont été identifiées dans la première étape. De cette façon, on estimera une mortalité attendue « en absence » des phénomènes perturbateurs atypiques.

Définition des périodes de référence et de prévision

Afin d’offrir une flexibilité dans le choix des hypothèses, l’utilisateur peut définir la période de référence qui doit être prise en compte pour la modélisation de la mortalité attendue et la période pour laquelle la mortalité attendue doit être prédite.

Prise en compte de la population à risque

Pour l’estimation des variations hebdomadaires de population par âge et par sexe, nous avons interpolé des estimations de population au 1^er juillet entre les années 1971 et 2025. Cette interpolation est faite au moyen de splines naturelles cubiques. À partir de ces estimations, nous calculons l’exposition au risque (en personnes-années) en divisant la population en 52 semaines. Alternativement, l’utilisateur peut choisir de ne pas tenir compte des populations en remplaçant les données de population par des valeurs égales à 1, ce qui revient à modéliser directement les nombres de décès au lieu des taux de mortalité.

Logiciel

Toutes les estimations se font en utilisant le logiciel statistique R. Les modèles GLM se font à partir des fonctions glm() de base, alors que les modèles GAM se font à partir de la fonction gam() du paquet mgcv.

Options retenues pour la surmortalité liée à la pandémie de COVID-19

Fonction servant à la modélisation de la tendance séculaire : tendance log-linéaire (exponentielle) des taux de mortalité

Modélisation de la saisonnalité : option semi-paramétrique des p-splines cycliques

Période de référence pour la définition de la tendance séculaire : 2013-2019 (+ les trois premiers mois de 2020)

Période de prévision de la mortalité attendue : 1^er janvier 2020 au 31 décembre 2024

Nombre de semaines à exclure avant et après le pic saisonnier : 0

Niveau d’exclusion des données aberrantes (outliers) : 99 %

Niveau d’incertitude des intervalles de prévision : 95 %

Procédure de calage des décès attendus selon différentes dimensions

La modélisation est réalisée individuellement pour onze sous-groupes, soit six groupes d’âge (0-49 ans, 50-59 ans, 60-69 ans, 70-79 ans, 80-89 ans, 90 ans et plus), deux sexes et trois regroupements régionaux. Pour déterminer le total (sexes et groupes d’âge réunis), on agrège les décès attendus pour les hommes et les femmes (tous groupes d’âge réunis). Les modélisations distinctes de chaque groupe d’âge et de chaque région sont ajustées proportionnellement sur le total obtenu précédemment pour assurer la cohérence des résultats selon tous les croisements offerts (âge, sexe et région).

Révision de la méthode le 4 avril 2024

Le principal élément de la révision est l’intégration des nouveaux chiffres de population par âge et par sexe, diffusés le 21 février 2024 par Statistique Canada. Ceux-ci sont les premiers à être basés sur le Recensement de 2021 (et les phénomènes démographiques observés depuis), ce qui permet une meilleure prise en compte de la population exposée au risque de décéder, lors de la modélisation du nombre de décès attendus. Une nouvelle projection de population est également utilisée pour 2024 et 2025, avec comme point de départ la nouvelle estimation au 1^er juillet 2023.
Comme la forte immigration des dernières années a eu une incidence prononcée sur l’évolution de la population des 0-49 ans, la prise en compte des nouvelles données de population contribue à rehausser légèrement le nombre de décès attendus pour ce groupe d’âge. Autrement dit, la révision à la hausse de la population des 0-49 ans entraîne une révision à la hausse de leurs décès attendus, surtout en 2023, comme l’illustre la figure ci-dessous. Le même effet s’observe aussi sur les décès totaux, mais dans des proportions presque imperceptibles.
Une méthode de standardisation indirecte a été utilisée pour tenir compte de l’évolution de la structure par âge à l’intérieur des groupes d’âge. Par exemple, chez les 60-69 ans, la mortalité dans les premières années du groupe d’âge (60, 61 ans) est très différente de celle des dernières années (68, 69 ans). La standardisation permet une plus grande comparabilité de la mortalité entre les années, ce qui permet d’éviter les biais occasionnés par l’évolution de la structure par âge interne du groupe d’âge. Ce changement a un effet uniquement sur les estimations par groupe d’âge, notamment chez les 0-49 ans où il contribue à rehausser le nombre de décès attendus, en conjonction avec la prise en compte d’une estimation de population révisée à la hausse (point 2).
Précédemment, on excluait les données aberrantes au-delà d’un seuil de 95 %. Maintenant, on privilégie un seuil de 99 % pour éviter d’exclure trop de décès lors de la modélisation de la tendance séculaire.
Précédemment, le nombre total de décès attendus était obtenu en faisant la somme des six modélisations croisant trois grandes régions du Québec et les deux sexes. En raison de la non-disponibilité des nouvelles données démographiques régionales au moment de réviser le modèle, le nombre total est maintenant obtenu en faisant la somme des deux modélisations par sexe, soit les décès attendus pour les hommes et pour les femmes, tous groupes d’âge confondus.

Finalement, il est important de rappeler que l’approche privilégiée pour établir le nombre de décès « normalement attendus » repose toujours sur l’hypothèse d’une poursuite de la tendance prépandémique des taux de mortalité. Cette approche vise à estimer le nombre de décès qu’on aurait pu s’attendre à observer en l’absence de pandémie de COVID-19 afin de mesurer l’effet net de cette pandémie sur la mortalité.

Comparaison entre l'ancienne et la nouvelle estimation des décès attendus

Figures présentant les données pour les 0-49 ans et le total, de 2010 à 2023

Nombre de décès observés et attendus, par groupe d'âge et sexe, 2020-2023


		Année CDC

		2020	2021	2022	2023	2020-2023

Total	Décès observés	74 378	69 964	78 175	77 301	299 818
	Décès attendus (nouveaux)	69 290	70 266	71 823	74 216	285 595
	Décès attendus (anciens)	69 248	70 329	71 817	73 296	284 690
	Écart nouveaux/anciens (%)	0,1	-0,1	0,0	1,3	0,3

0-49 ans	Décès observés	3 130	3 165	3 284	3 360	12 939
	Décès attendus (nouveaux)	2 914	2 840	2 829	2 888	11 471
	Décès attendus (anciens)	2 893	2 796	2 750	2 701	11 140
	Écart nouveaux/anciens (%)	0,7	1,6	2,9	6,9	3,0

50-59 ans	Décès observés	4 097	3 742	3 823	3 617	15 279
	Décès attendus (nouveaux)	3 999	3 806	3 651	3 544	15 000
	Décès attendus (anciens)	4 003	3 831	3 690	3 541	15 065
	Écart nouveaux/anciens (%)	-0,1	-0,7	-1,1	0,1	-0,4

60-69 ans	Décès observés	10 181	9 922	10 649	10 365	41 117
	Décès attendus (nouveaux)	9 708	9 721	9 797	9 978	39 205
	Décès attendus (anciens)	9 616	9 575	9 570	9 531	38 293
	Écart nouveaux/anciens (%)	1,0	1,5	2,4	4,7	2,4

70-79 ans	Décès observés	16 947	16 954	18 804	18 724	71 429
	Décès attendus (nouveaux)	16 345	16 704	17 161	17 780	67 990
	Décès attendus (anciens)	16 190	16 470	16 790	17 067	66 517
	Écart nouveaux/anciens (%)	1,0	1,4	2,2	4,2	2,2

80-89 ans	Décès observés	23 313	21 392	24 103	23 876	92 684
	Décès attendus (nouveaux)	21 546	21 830	22 302	23 199	88 877
	Décès attendus (anciens)	21 694	22 170	22 884	23 806	90 554
	Écart nouveaux/anciens (%)	-0,7	-1,5	-2,5	-2,5	-1,9

90 ans et plus	Décès observés	16 710	14 789	17 512	17 359	66 370
	Décès attendus (nouveaux)	14 777	15 365	16 083	16 828	63 053
	Décès attendus (anciens)	14 852	15 486	16 132	16 650	63 120
	Écart nouveaux/anciens (%)	-0,5	-0,8	-0,3	1,1	-0,1

Hommes	Décès observés	36 912	35 470	39 360	38 536	150 278
	Décès attendus (nouveaux)	34 426	34 922	35 737	37 058	142 142
	Décès attendus (anciens)	34 422	34 977	35 749	36 508	141 656
	Écart nouveaux/anciens (%)	0,0	-0,2	0,0	1,5	0,3

Femmes	Décès observés	37 466	34 494	38 815	38 765	149 540
	Décès attendus (nouveaux)	34 864	35 344	36 086	37 159	143 453
	Décès attendus (anciens)	34 827	35 351	36 067	36 788	143 033
	Écart nouveaux/anciens (%)	0,1	0,0	0,1	1,0	0,3

Note
Somme des 52 semaines CDC de chaque année (sans la semaine 53 de 2020 pour permettre la comparaison entre années).

Source
Institut de la statistique du Québec.

Auteurs

Frédéric Fleury-Payeur (démographe expert [M. Sc.] à l’ISQ), en collaboration avec Alexandre Paquette (démographe [M. Sc.] à l’ISQ) et Enrique Acosta (démographe [Ph. D.] et chercheur au Max Planck Institute et au Centre d’Estudis Demogràfics [CED]).

Bibliographie

NEPOMUCENO, Marília R., et autres (2022). “Sensitivity Analysis of Excess Mortality due to the COVID-19 Pandemic”, Population and Development Review, [En ligne], juin, n^o 48, p. 279-302. doi : 10.1111/padr.12475

SERFLING, Robert E. (1963). “Methods for current statistical analysis of excess pneumonia-influenza deaths”, Public Health Reports, [En ligne], juin, n^o 78, p. 494–506. [www.ncbi.nlm.nih.gov/pmc/articles/PMC1915276/pdf/pubhealthreporig00078-0040.pdf]

VERBEECK, J., et autres (2021). “A linear mixed model to estimate COVID-19-induced excess mortality”, Biometrics, n^o 00, p. 1-9. doi : 10.1111/biom.13578