Surdiagnostic dans le programme de dépistage organisé du cancer du sein basé sur la population estimé par un modèle multiétat non homogène: une étude de cohorte utilisant des données individuelles avec un suivi à long terme

Nous avons utilisé un modèle multiétat non homogène pour estimer la fréquence du surdiagnostic à partir du nombre attendu de BC non progressives parmi les cas de cancer détectés par dépistage dans le programme de dépistage organisé en population avec mammographie chez les femmes de 50 à 69 ans dans le comté de Stockholm, en Suède. Nous avons constaté que seulement 0,43% des cas invasifs détectés par dépistage étaient surdiagnostiqués. La fréquence du surdiagnostic dans le cycle prévalent était trois fois plus élevée que celle des cycles suivants. Nous avons montré que le modèle non homogène correspondait mieux aux données que le modèle homogène.

Les estimations publiées de la fréquence du surdiagnostic ont varié en raison du type de programme de dépistage, de la conception de l’étude, du choix du groupe témoin, de la méthode d’estimation et de l’ajustement en fonction du délai d’exécution (le temps pendant lequel le dépistage fait avancer le diagnostic par rapport à l’absence de dépistage). Le surdiagnostic basé sur des données suédoises a été estimé dans quatre ECR et deux études observationnelles.

Estimation du surdiagnostic sur la base des ECR suédois

Dans l’essai de Stockholm, deux cycles de dépistage ont été effectués pour 40 318 femmes âgées de 40 à 64 ans, et 20 000 témoins ont également été invités à un cycle de dépistage à la fin de l’essai. Deux estimations du surdiagnostic ont été faites sur la base de l’essai de Stockholm. Gotzsche a constaté un surdiagnostic de 49% en comparant le risque relatif de tous les BC au cours de la période de dépistage. Cependant, ne pas séparer l’incidence croissante due à une détection plus précoce du cancer (ce qu’on appelle le problème du délai d’exécution) entraîne une surestimation du surdiagnostic. Moss a constaté que les taux d’incidence invasive (0,81 contre 0,85 pour 1000 années-personnes dans les groupes dépistés et dans les groupes témoins) et tous les taux d’incidence cumulatifs de la Colombie-Britannique (0,88 contre 0,91 pour 1000 années-personnes dans les groupes dépistés et les groupes témoins) étaient similaires entre deux bras sur un suivi de 15 ans. Il convient de noter qu’étant donné que le groupe témoin a également été invité à un seul écran, ce qui pourrait entraîner un surdiagnostic dans le groupe témoin, le surdiagnostic a probablement été sous-estimé dans cette approche. Nos conclusions sur la fréquence du surdiagnostic lors des cycles de dépistage ultérieurs du programme de dépistage organisé étaient conformes à la conclusion de Moss dans l’essai de Stockholm qui n’a montré aucune preuve de surdiagnostic à la suite de dépistages incidents.

Des résultats similaires ont été trouvés dans l’essai de deux comtés et l’essai de Göteborg; -0,02 et -0,03 pour 1000 incidences cumulatives excessives absolues de tous les BCs ont été trouvés dans le groupe examiné dans les deux essais, respectivement. Duffy et coll. appliqué un modèle homogène à quatre états pour quantifier le surdiagnostic. La fréquence du surdiagnostic dans les cycles prévalent et les deux cycles suivants était de 3,1 % / 4,2 % et de 0,3 %/ 0,3 %, respectivement, dans les essais sur deux comtés/Göteborg. Ces estimations sont conformes à nos estimations et confirment un faible niveau de surdiagnostic. En utilisant les données de suivi sur 29 ans d’un comté de l’essai sur deux comtés, Yen et al. a confirmé en outre que le dépistage n’a pas entraîné d’incidence excessive de BC dans le groupe examiné (rapport de risque de 1,00) où 100 000 dépistages supplémentaires ont été effectués par rapport au groupe témoin. Aucune preuve de surdiagnostic pour la BC invasive ou in situ n’a été trouvée.

L’estimation du surdiagnostic basée sur l’essai Malmö I a été considérée comme fiable en raison de la conception de l’écran d’arrêt (les femmes du groupe témoin n’ont jamais été invitées au dépistage) et d’un temps de suivi adéquat. Zackrisson et coll. estimation de la fréquence du surdiagnostic à 10% pour tous les BC et à 7% pour les BC invasives chez les femmes de 55 à 69 ans à affectation aléatoire en comparant le taux d’incidence entre les groupes invités et les groupes témoins à 15 ans de suivi, après la fin de l’essai. Le groupe britannique de la Colombie-Britannique a recalculé le surdiagnostic estimé en comparant les nombres excédentaires avec différents dénominateurs, tels que le nombre de cancers diagnostiqués sur toute la période de suivi dans le groupe témoin / groupe invité ou le nombre de cancers / cancers détectés au dépistage diagnostiqués au cours de la période de dépistage dans le groupe invité. Les estimations variaient de 11 % à 29 %. Bien que les ECR puissent être une bonne occasion de quantifier le surdiagnostic, la généralisation du programme de dépistage organisé actuel demeure douteuse.

Estimation du surdiagnostic basée sur les programmes de dépistage organisés

Zahl et al. a utilisé l’incidence spécifique à l’âge de la BC invasive entre 1971 et 2000 pour quantifier l’incidence croissante après l’introduction du dépistage mammographique en Suède. Ils ont estimé que la fréquence du surdiagnostic chez les femmes de 50 à 69 ans était de 45%; cependant, le délai d’exécution n’a pas été correctement ajusté et l’augmentation de l’incidence au fil du temps n’a pas été prise en compte. Jonsson et coll. a également appliqué l’approche du taux d’incidence pour quantifier le surdiagnostic dans 11 pays sur 20 après la mise en œuvre du dépistage organisé. L’incidence du dépistage préalable (15 ans avant le début du dépistage) a été utilisée pour calculer l’incidence prévue en l’absence de dépistage pendant la période de dépistage jusqu’à l’an 2000. Dans la phase stable, les taux de surdiagnostic ont été estimés à 54 % et 21 % pour les groupes d’âge de 50 à 59 ans et de 60 à 69 ans, respectivement, après ajustement du délai d’exécution. Il convient de noter que l’incidence accrue pourrait résulter d’un effet de dépistage répandu chez les nouveaux arrivants, de changements potentiels dans les facteurs de risque conduisant à des tendances changeantes, etc. par conséquent, elle ne devrait pas être entièrement attribuée au surdiagnostic. Cependant, les données du programme de dépistage organisé dans le comté de Stockholm n’ont pas été incluses dans cette étude et le choix de la période de pré-dépistage pourrait avoir influencé l’estimation du surdiagnostic. Par conséquent, il était difficile de comparer avec nos résultats.

Estimation du temps de séjour moyen

Nos estimations des TSM pour les femmes âgées de 40 à 49 ans, de 50 à 59 ans et de 60 à 69 ans (2,60, 2,16 et 3,52 ans) étaient inférieures aux TSM précédemment rapportées dans l’essai sur deux comtés (2,44, 3,70 et 4,17 ans). Il y a plusieurs raisons à la plus courte MSTS dans notre étude. Premièrement, le temps de séjour dans notre modèle représente le temps de séjour dans le BCs progressif. Les BCs non progressifs ayant un temps de séjour infini ont été séparés. Deuxièmement, il a été démontré qu’il existe une association entre le traitement hormonal substitutif (THS), le risque BC et le temps de séjour. En Suède, l’utilisation du THS a augmenté à partir de 1990 et a diminué après 2002 et la majorité de l’utilisation du THS s’est faite dans le groupe d’âge des 50-59 ans. L’utilisation du THS augmente le risque de carcinome lobulaire invasif, qui a un temps de séjour plus court que le carcinome canalaire. Cela pourrait expliquer pourquoi nous avons obtenu des estimations plus faibles de la TVM chez les femmes de 50 à 59 ans. Une autre explication peut être que Duffy et coll. utilisé l’âge par affectation aléatoire pour classer la population en groupes d’âge, quel que soit son âge à la fin de l’étude, et le MST a été estimé séparément pour ces groupes. Par exemple, les femmes de 50 à 59 ans assignées au hasard avaient entre 57 et 66 ans à la fin de l’essai et étaient donc en moyenne de 3 à 4 ans de plus pendant la période d’étude. L’estimation de la TVM plus longue dans le groupe d’âge 50-59 trouvée par Duffy et al. peut être partiellement attribuable au TMS plus long observé entre 60 et 69 ans. En revanche, dans notre modèle, une femme pourrait contribuer à la probabilité d’estimation de la TVM dans différents intervalles d’âge à mesure qu’elle se déplace dans les groupes d’âge.

Préoccupations concernant les cancers in situ

L’incidence du carcinome canalaire du cancer in situ a considérablement augmenté depuis l’introduction du programme de dépistage organisé. Cette augmentation a été considérée comme un marqueur de surdiagnostic. Une analyse de sensibilité a été réalisée en combinant le BCs in situ et invasif dans le même état pour estimer le surdiagnostic (fichiers supplémentaires 1 et 2). 51,6 cas non progressifs de C.-B. ont été détectés parmi 9631 cas in situ et invasifs de C.-B., ce qui correspond à un surdiagnostic de 0,54 % (fichier supplémentaire 3). Bien que le surdiagnostic ait été légèrement plus élevé, la fréquence du surdiagnostic était encore faible. Des résultats similaires ont été démontrés par le modèle à six états chez les femmes de 40 à 49 ans, suggérant que la majorité des cancers in situ détectés par dépistage se seraient présentés cliniquement en l’absence de dépistage.

Points forts et limites

Notre estimation du surdiagnostic basée sur un modèle non homogène et des données de dépistage à grande échelle présente plusieurs points forts. Premièrement, à notre connaissance, il s’agit de la première étude utilisant des antécédents de dépistage individuels pour quantifier la fréquence du surdiagnostic dans le cadre du programme de dépistage organisé de Stockholm. Les données agrégées utilisées dans la plupart des études ne peuvent pas refléter l’exposition réelle au dépistage. Dans le cadre du programme de dépistage de Stockholm, les antécédents de dépistage individuels ont été collectés dès le début, vérifiés par la qualité et régulièrement stockés dans le registre. La date et le statut de la participation, les résultats mammographiques, les évaluations de suivi et les résultats du cancer ont été enregistrés de manière prospective. Deuxièmement, la population non examinée (nombre prévu de BC en l’absence de dépistage) a été obtenue à partir de la modélisation de l’histoire naturelle qui fournit les mêmes caractéristiques (risques) entre la population non examinée et la population examinée. Le biais, qui résulte du choix des groupes témoins, pourrait ainsi être évité. Troisièmement, l’incidence et le temps de séjour spécifiques à l’âge ont été pris en compte dans notre modèle. Des taux de transition constants par morceaux ont été utilisés dans le modèle non homogène et ajustaient mieux les données que le modèle homogène traditionnel à taux constants.

Certaines limites peuvent avoir influencé nos estimations du surdiagnostic. Premièrement, le mode de détection des cas de BC pourrait être mal classé. Par exemple, les femmes nées en 1920-1941 pourraient avoir été invitées à au moins une ronde de dépistage dans le cadre de l’essai de Stockholm. Les SSD peuvent être mal classés en tant que PSDS. Lidbrink et coll. a constaté que, lors du dépistage organisé à Stockholm, la taille de la tumeur dans les unités de dépistage effectuant un dépistage répandu était similaire à celle de l’unité où l’essai a été mené. Une mammographie effectuée en dehors du programme de dépistage organisé pourrait également biaiser nos résultats. Le taux de participation dans les comtés les plus densément peuplés de Suède, y compris le comté de Stockholm, a été plus faible que dans d’autres comtés de Suède, ce qui pourrait être dû à un accès plus élevé à la mammographie privée, en particulier pendant les premières années du programme. Les cas de cancer diagnostiqués dans le secteur privé peuvent être mal classés comme NPs dans le programme de dépistage organisé. Le risque de passer au CP pourrait être surestimé, ce qui entraînerait une sous-estimation du surdiagnostic.

Deuxièmement, le surdiagnostic résultant de la détection de cancers progressifs chez les femmes décédées avant que le cancer ne devienne symptomatique n’a pas été pris en compte dans notre étude. Une extension possible du modèle consiste à considérer la mort comme un état séparé. En outre, à Stockholm, les taux de mortalité toutes causes confondues chez les femmes de 50 à 59 ans et de 60 à 69 ans de 1989 à 2014 étaient de 3,2 et 7,98 pour 1000 femmes-années. Ainsi, au cours d’un séjour de 2,16 ans, on pourrait s’attendre à 6,91 décès pour mille femmes dans ces cas de poitrine détectés par dépistage progressif à l’âge de 50 à 59 ans. En d’autres termes, une estimation raisonnable du surdiagnostic dû au décès serait d’environ 0,69 % pour les femmes de 50 à 59 ans. L’estimation correspondante pour les femmes de 60 à 69 ans serait de 2,8% compte tenu d’un séjour de 3,52 ans. La valeur réelle sera inférieure après avoir pris en compte la différence entre le délai d’exécution et le temps de séjour.

Troisièmement, les hypothèses faites dans la modélisation de l’histoire naturelle doivent être prises en compte. Nous avons supposé que la sensibilité du test était constante dans le temps, l’âge et le type de BC. Faute de données, l’effet de l’amélioration des outils de dépistage, comme la mammographie numérique, n’a pas pu être pris en compte. De plus, on a supposé que les cas de faux négatifs avaient été détectés lors de la prochaine ronde de dépistage afin de simplifier la fonction de vraisemblance. Cela pourrait légèrement surestimer la sensibilité du test. De plus, notre modèle non homogène nécessite un certain temps d’initiation où l’état réel est connu ou peut être modélisé. Nous avons restreint le modèle de sorte que le risque de BC était nul avant l’âge de 40 ans. Une analyse de sensibilité a été effectuée pour vérifier cette hypothèse du modèle. Les résultats étaient similaires lorsque le temps d’initiation était supposé être de 35 ou 45 ans (non illustré). Le taux d’incidence moyen du registre du cancer de Stockholm pour les années 1989-2004 a été utilisé pour approximer le taux de transition de la BC libre à la PCDP progressive dans le groupe d’âge 40-49. Le taux d’incidence préclinique sous-jacent pourrait être plus élevé que le taux d’incidence clinique puisque l’incidence augmente avec l’âge. Cela pourrait affecter d’autres estimations de paramètres, en particulier la TVM chez les femmes de 40 à 49 ans, si le taux ne représente pas l’incidence de fond.

Quatrièmement, un IC plus robuste de l’estimation du surdiagnostic pourrait être calculé par la méthode d’amorçage. Cependant, étant donné que les antécédents individuels de dépistage de plus de 400 000 femmes ont été utilisés pour l’estimation, la procédure d’estimation a pris beaucoup de temps.

Un autre problème important est que la fonction de vraisemblance peut être plate et entraîner un problème d’identifiabilité. Même si notre modèle correspondait bien aux données, nous ne pouvons exclure une spécification erronée du modèle. La véritable progression de la Colombie-Britannique aurait pu être simplifiée à l’excès dans notre modèle à quatre états. En raison de données insuffisantes ou incomplètes (censurées), il peut être difficile d’obtenir les estimations correctes. Pour estimer avec succès d’autres paramètres et quantifier davantage le surdiagnostic, notre modèle s’appuie sur les informations provenant de cancers cliniquement détectés, y compris les IC et les NPs (qui étaient les cas les plus informatifs de l’ensemble de données car le temps de transition exact vers la CP est connu). Plus tôt, nous avons montré qu’une certaine proportion (5-10%) d’un groupe non examiné, comme les personnes n’ayant jamais assisté, peut stabiliser le modèle. Par conséquent, l’inspection de la fonction de vraisemblance semble nécessaire. Nous avons vérifié les conditions de Karush–Kuhn–Tucker pour nous assurer que l’algorithme d’optimisation convergeait bien.

Nos résultats fournissent les informations suivantes pour de futures recherches. Premièrement, il serait utile d’évaluer les effets de la période sur le risque de la C.-B., le temps de séjour et la sensibilité pour étudier comment l’exposition au THS et à la mammographie numérique ont influencé la fréquence du surdiagnostic. Deuxièmement, une comparaison plus poussée des estimations du surdiagnostic basées sur d’autres méthodes d’évaluation, comme la méthode de l’incidence cumulative, dans le même ensemble de données doit être effectuée pour fournir des preuves plus solides aux décideurs afin de confirmer davantage les résultats.

La fréquence du surdiagnostic dans le programme de dépistage organisé dépend de la proportion latente de cas non progressifs en Colombie-Britannique, mais aussi du programme de dépistage, où un taux de participation plus élevé ou une sensibilité améliorée due à de meilleurs instruments de dépistage entraînera une fréquence plus élevée de surdiagnostic. L’équilibre entre les avantages et les inconvénients du dépistage doit être pris en compte et un suivi régulier de la réduction de la mortalité et du surdiagnostic sera donc nécessaire.

KGSAU