Retour au document

    Méthodologie du modèle d’estimation de la surmortalité

    Mise à jour : 2 novembre 2023

    L’excès de mortalité, ou surmortalité est défini comme la différence entre une mortalité de base, soit celle attendue en l’absence de perturbation, et la mortalité observée. Dans le présent document sont décrits les aspects techniques et les options de paramètres qui ont été développés pour l’estimation de la mortalité attendue à partir des données hebdomadaires de mortalité publiées par l’Institut de la statistique du Québec (ISQ).

    Modèles pour l’estimation de la mortalité attendue et ses composantes

    Le programme développé à l’aide du logiciel statistique R utilise des modèles de régression inspirés de la méthode proposée par Serfling (1963). Un modèle reposant sur certains principes similaires est également proposé par Verbeeck et coll. (2021). Selon les options choisies, notre modèle permet d’exploiter un modèle linéaire généralisé (GLM, en anglais) ou un modèle additif généralisé (GAM, en anglais) avec une fonction de lien logarithmique. Ces modèles comportent trois composantes : une composante pour prendre en considération la tendance séculaire de mortalité; une composante pour modéliser la saisonnalité et une composante qui tient compte des changements démographiques. Afin de prendre en compte une possible surdispersion des données, une distribution quasi-Poisson est supposée. Les modèles sont ajustés aux données des décès hebdomadaires de façon indépendante pour chaque groupe d’âge, chaque sexe et chaque sous-région.

    Approches paramétriques et semi-paramétriques

    L’outil développé permet d’estimer la surmortalité de périodes historiques (ex. : saisons grippales ou canicules antérieures) ou de l’année courante (ex. : pandémie de COVID-19). À cette fin, nous proposons des options paramétriques et semi-paramétriques pour la modélisation de la tendance séculaire et de la saisonnalité.

    Pour la composante de tendance séculaire, l’option paramétrique utilise des polynômes de degré un à cinq (au choix) modélisés sur une échelle logarithmique, alors que l’option semi-paramétrique utilise des p-splines cubiques.

    Pour la composante de la saisonnalité, l’option paramétrique inclut une fonction sinusoïdale de base, qui permet une variation entre une et quatre variations à l’intérieur de chaque cycle, tandis que pour l’option semi-paramétrique, nous utilisons des p-splines cycliques.

    Lorsque des approches paramétriques sont utilisées, le modèle est ajusté en utilisant une approche GLM et lorsque des composantes semi-paramétriques sont incluses nous utilisons une approche GAM.

    Traitement des données aberrantes

    Pour définir la mortalité attendue, le modèle permet d’exclure des variations de mortalité exceptionnelles produites par des influences exogènes. C’est notamment le cas de la mortalité par influenza, des vagues de chaleur extrême ou d’autres évènements extraordinaires. Si cette option est retenue, ces observations sont alors considérées comme aberrantes et sont exclues pour la modélisation de la mortalité attendue.

    Pour le cas de l’influenza, il est possible pour l’utilisateur de décider la quantité de semaines autour des pics saisonniers d’influenza qui doivent être exclues du modèle. De cette façon, il est possible d’estimer une mortalité attendue « en absence » de la mortalité produite directement ou indirectement par l’influenza, à la manière de l’approche retenue par le consortium de recherche EuroMoMo.

    De plus, il est possible d’identifier les données aberrantes de façon automatique. Pour cette fin, l’estimation se fait en deux étapes. Premièrement, on identifie des semaines où la mortalité excède des intervalles de prévision, dont l’utilisateur peut décider le niveau d’incertitude (ex. : 95 %). Deuxièmement, on estime la mortalité attendue en excluant les données aberrantes qui ont été identifiées dans la première étape. De cette façon, on estimera une mortalité attendue « en absence » des phénomènes perturbateurs atypiques.

    Définition des périodes d’ajustement et de prévision

    Afin d’offrir une flexibilité dans le choix des hypothèses, l’utilisateur peut définir la période qui doit être prise en compte pour l’ajustement de la mortalité attendue et la période pour laquelle la mortalité attendue doit être prédite.

    Prise en compte de la population à risque

    Pour l’estimation des variations hebdomadaires de population par âge et par sexe, nous avons interpolé des estimations de population au 1er juillet entre les années 2012 et 2023. Cette interpolation est faite au moyen de splines naturelles cubiques. À partir de ces estimations, nous calculons l’exposition au risque (en personnes-années) en divisant la population en 52 semaines. Alternativement, l’utilisateur peut choisir de ne pas tenir compte des populations en remplaçant les données de population par des valeurs égales à 1, ce qui revient à modéliser directement les nombres de décès au lieu des taux de mortalité.

    Logiciel

    Toutes les estimations se font en utilisant le logiciel statistique R. Les modèles GLM se font à partir des fonctions glm() de base, alors que les modèles GAM se font à partir de la fonction gam() du paquet mgcv.

     

    Options retenues pour la surmortalité liée à la pandémie de COVID‑19

    Tendances séculaires : option paramétrique avec polynôme de degré 1 (équivalente à une tendance log-linéaire, ou exponentielle)

    Saisonnalité : option semi-paramétrique des p-splines cycliques

    Période de référence pour l’ajustement de base : 2013-2019 (+ les deux premiers mois de 2020)

    Période de prévision de la mortalité attendue : 1er janvier 2013 au 31 décembre 2023

    Nombre de semaines à exclure avant et après le pic saisonnier : 0

    Niveau d’exclusion des données aberrantes (outliers) : 95 %

    Niveau d’incertitude des intervalles de prévision : 95 %

    Procédure de calage des résultats des différentes dimensions

    Le nombre de décès attendus est d’abord estimé en stratifiant la modélisation du total Québec par sexe et selon trois sous-régions à l’aide d’une modélisation SexeRégion basée sur les taux de mortalité (selon la population estimée jusqu’en 2022 et projetée en 2023 et 2024). L’agrégat de ces six régions forme la modélisation de référence pour le total du Québec. Une autre modélisation GrÂge (stratifiée selon 6 groupes d’âge : 0-49 ans, 50-59 ans, 60-69 ans, 70-79 ans, 80-89 ans et 90 ans et plus) est ensuite réalisée dans une modélisation distincte. Les résultats qui en découlent sont finalement calés (ajustement sur marge) à ceux du total Québec obtenu par la modélisation SexeRégion pour assurer la cohérence des résultats selon tous les croisements offerts (âge, sexe et région).

    Révision de la méthode le 2 mars 2023

    Jusqu’à la diffusion du 2 février 2023, le modèle reposait sur la tendance 2010-2019. À partir du 2 mars 2023, la tendance 2013-2019 est utilisée afin de mieux capter la légère inflexion à la hausse des décès à la fin de cette décennie et de s’arrimer davantage à la longueur des périodes de référence généralement utilisées ailleurs. Le modèle initial reposait également sur une modélisation SexeRégion basée uniquement sur l’analyse des nombres de décès, alors que le modèle révisé est basé sur des taux de mortalité, comme l’approche déjà utilisée pour la modélisation GrÂge. Ce changement permet de tenir compte du changement de tendance dans l’évolution de la population régionale, ce qui a pour effet de réviser légèrement à la hausse la surmortalité de la région « Montréal-Laval » en 2021 et 2022 et de réviser légèrement à la baisse la surmortalité des deux autres régions. Lors de la diffusion du 2 mars 2023, les données définitives de 2020 ont également été intégrées au modèle.

    Auteurs
    Enrique Acosta (docteur en démographie, chercheur au Max Planck Institute et au Centre d'Estudis Demogràfics [CED]) et Frédéric Fleury-Payeur (démographe expert [M. Sc.] à l’ISQ), en collaboration avec Alexandre Paquette (démographe [M. Sc.] à l’ISQ).

    Bibliographie
    NEPOMUCENO, Marília R., et autres (2022). “Sensitivity Analysis of Excess Mortality due to the COVID-19 Pandemic”, Population and Development Review, [En ligne], juin, no 48, p. 279-302. doi : https://onlinelibrary.wiley.com/doi/10.1111/padr.12475

    SERFLING, Robert E. (1963). “Methods for current statistical analysis of excess pneumonia-influenza deaths”, Public Health Reports, [En ligne], juin, no 78, p. 494–506. [www.ncbi.nlm.nih.gov/pmc/articles/PMC1915276/pdf/pubhealthreporig00078-0040.pdf]

    VERBEECK, J., et autres (2021). “A linear mixed model to estimate COVID-19-induced excess mortality”, Biometrics, no 00, p. 1-9. doi : https://doi.org/10.1111/biom.13578

    Évaluation de page
    L'information sur cette page vous a-t-elle été utile?