overdiagnose i det befolkningsbaserede organiserede brystkræftscreeningsprogram estimeret ved en ikke-homogen multistatsmodel: en kohortestudie ved hjælp af individuelle data med langvarig opfølgning

Vi brugte en ikke-homogen multistatsmodel til at estimere hyppigheden af overdiagnose ud fra det forventede antal ikke-progressive BCs blandt de screen-detekterede kræfttilfælde i det befolkningsbaserede organiserede screeningsprogram med mammografi hos kvinder 50-69 i Stockholm County, Sverige. Vi fandt ud af, at kun 0,43% af de skærmopdagede invasive tilfælde var overdiagnosticeret. Hyppigheden af overdiagnose i den fremherskende runde var tre gange højere end i de efterfølgende runder. Vi viste, at den ikke-homogene model passede dataene bedre end den homogene model.

offentliggjorte estimater af hyppigheden af overdiagnose har varieret på grund af typen af screeningsprogram, studiedesign, valg af kontrolgruppe, estimeringsmetode og justering for leveringstid (det tidspunkt, hvor screening fremmer diagnosen sammenlignet med fravær af screening) . Overdiagnose baseret på svenske data er estimeret i fire RCT ‘ er og to observationsstudier.

estimering af overdiagnose baseret på den svenske RCT ‘ er

i Stockholm-forsøget blev der udført to screeningsrunder for 40.318 kvinder i alderen 40 Til 64 år, og 20.000 kontroller blev også inviteret til en screeningsrunde i slutningen af forsøget. To skøn over overdiagnose blev foretaget på baggrund af Stockholm-forsøget. 49% overdiagnose ved at sammenligne den relative risiko for alle BCs i screeningsperioden . Manglende adskillelse af den stigende forekomst på grund af tidligere påvisning af kræft (det såkaldte ledetidsproblem) resulterer imidlertid i overvurdering af overdiagnose. Moss fandt, at de invasive (0,81 versus 0,85 pr .1000 personår i de screenede og i kontrolgrupperne) og alle BC kumulative incidensrater (0,88 versus 0,91 pr. 1000 personår i de screenede og kontrolgrupperne) var ens mellem to arme over 15 års opfølgning. Det skal bemærkes, at fordi kontrolgruppen også blev inviteret til en enkelt skærm, hvilket kan føre til en vis overdiagnose i kontrolgruppen, blev overdiagnose sandsynligvis undervurderet i denne tilgang. Vores fund af hyppigheden af overdiagnose i de efterfølgende screeningsrunder i det organiserede screeningsprogram var i overensstemmelse med Moss ‘ fund i Stockholm-forsøget, der ikke viste tegn på overdiagnose som følge af hændelsesskærme .

lignende resultater blev fundet i to-Amtsforsøget og Gøteborg-forsøget; -0.02 og -0.03 pr .1000 absolutte overskydende kumulative forekomster af alle BCs blev fundet i den screenede gruppe i henholdsvis de to forsøg. Duffy et al. anvendt en homogen fire-tilstandsmodel for at kvantificere overdiagnosen . Hyppigheden af overdiagnose i de fremherskende og de to efterfølgende runder var henholdsvis 3,1%/4,2% og 0,3%/0,3% i de to Amts-/Gøteborg-forsøg. Disse estimater er i tråd med vores estimater og bekræfter et lavt niveau af overdiagnose. Brug af 29-årige opfølgningsdata fra et amt i retssagen med to amter, Yen et al. yderligere bekræftet, at screening ikke førte til overskydende forekomst af BC i den screenede gruppe (risikoforhold 1,00), hvor der blev udført 100.000 yderligere skærme sammenlignet med kontrolgruppen. Der blev ikke fundet tegn på overdiagnose for invasiv eller in situ BC .

estimatet for overdiagnose baseret på malm Karrus i-forsøget er blevet betragtet som pålideligt på grund af stop-screen-designet (kvinder i kontrolgruppen blev aldrig inviteret til screening) og en passende opfølgningstid . Et al. estimeret hyppigheden af overdiagnose til 10% for alle BCs og 7% for invasiv BCs hos kvinder 55 Til 69 ved tilfældig tildeling ved at sammenligne forekomsten mellem de inviterede og kontrolgrupper ved 15 års opfølgning efter afslutningen af forsøget . Det Forenede Kongeriges BC-panel genberegnede den estimerede overdiagnose ved at sammenligne det overskydende antal med forskellige nævnere, såsom antallet af kræftformer, der er diagnosticeret i hele opfølgningsperioden i kontrolgruppen/den inviterede gruppe, eller antallet af kræftformer/skærmdetekterede kræftformer, der er diagnosticeret i screeningsperioden i den inviterede gruppe . Estimaterne varierede fra 11% til 29%. Selvom RCT ‘ er kan give en god mulighed for at kvantificere overdiagnose, forbliver generaliserbarheden for det nuværende organiserede screeningsprogram tvivlsom.

estimering af overdiagnose baseret på de organiserede screeningsprogrammer

brugte den aldersspecifikke forekomst af invasiv BC i løbet af 1971-2000 til at kvantificere den stigende forekomst efter introduktion af mammografisk screening i Sverige . De vurderede, at hyppigheden af overdiagnose hos kvinder 50-69 år var 45%; ledetiden blev imidlertid ikke korrekt justeret for, og stigningen i forekomsten over tid blev ikke overvejet. Jonsson et al. anvendt også incidensfrekvensmetoden til at kvantificere overdiagnose i 11 ud af 20 lande efter implementering af organiseret screening . Præscreeningsincidensen (15 år før screeningens start) blev brugt til at beregne den forventede incidens i fravær af screening i screeningsperioden indtil år 2000. I den stabile fase blev overdiagnosehastighederne estimeret til henholdsvis 54% og 21% for aldersgrupperne 50-59 og 60-69 efter justering af leveringstid. Det skal bemærkes, at den øgede forekomst kan skyldes en udbredt screeningseffekt blandt nyankomne, potentielle ændringer i risikofaktorer, der fører til skiftende tendenser osv . Imidlertid, dataene fra det organiserede screeningsprogram i Stockholm County var ikke inkluderet i denne undersøgelse, og valget af præ-screeningsperiode kunne have påvirket estimeringen af overdiagnose . Derfor var det svært at sammenligne med vores resultater.

estimering af gennemsnitlig opholdstid

vores estimater af MSTs for kvinder i alderen 40-49, 50-59 og 60-69 (2,60, 2,16 Og 3,52 år) var lavere end tidligere rapporterede MSTs i to-Amtsforsøg (2,44, 3,70 og 4,17 år) . Der er flere grunde til de kortere MSTs i vores undersøgelse. For det første repræsenterer opholdstiden i vores model opholdstiden i den progressive BCs. De ikke-progressive BCs, der havde uendelig opholdstid, blev adskilt. For det andet har det vist sig, at der er en sammenhæng mellem hormonerstatningsterapi (HRT), BC-risiko og opholdstid . I Sverige steg brugen af HRT fra 1990 og faldt efter 2002, og størstedelen af brugen af HRT var i aldersgruppen 50-59 år . HRT-brug øger risikoen for invasivt lobulært karcinom, som har en kortere opholdstid end duktalt karcinom . Dette kan forklare, hvorfor vi fik lavere skøn over MST hos kvinder 50-59 år. En anden forklaring kan være, at Duffy et al. brugt alder ved tilfældig tildeling til at klassificere befolkningen i aldersgrupper uanset hvor gamle de var i slutningen af undersøgelsen, og MST blev estimeret separat for disse grupper. For eksempel var kvinder 50-59 ved tilfældig opgave 57-66 år gamle ved afslutningen af forsøget og var således i gennemsnit 3-4 år ældre i undersøgelsesperioden. Estimatet af længere MST i aldersgruppen 50-59 fundet af Duffy et al. kan delvis tilskrives den længere MST observeret i alderen 60-69 år. I modsætning, i vores model, en kvinde kan bidrage til sandsynligheden for estimering af MST i forskellige aldersintervaller, når de bevæger sig gennem aldersgrupperne.

bekymringer om in situ kræftformer

forekomsten af duktalt carcinom in situ kræft er steget markant siden introduktionen af det organiserede screeningsprogram . Denne stigning er blevet betragtet som en markør for overdiagnose . En følsomhedsanalyse blev udført ved at kombinere in situ og invasiv BCs i samme tilstand for at estimere overdiagnose (yderligere filer 1 og 2). Der blev fundet 51,6 ikke-progressive fundne BC-tilfælde blandt 9631 in situ-og invasive BC-tilfælde, svarende til 0,54% overdiagnose (yderligere fil 3). Selvom der blev fundet lidt højere overdiagnose, var hyppigheden af overdiagnose stadig lav. Lignende fund blev demonstreret af seks-tilstandsmodellen hos kvinder 40-49, hvilket antyder, at størstedelen af screen-detekterede in situ-kræftformer ville have præsenteret klinisk i fravær af screening .

styrker og begrænsninger

vores skøn over overdiagnose baseret på en ikke-homogen model og store screeningsdata har flere styrker. Først, efter vores bedste viden, dette er den første undersøgelse, der bruger individuelle screeningshistorier til at kvantificere hyppigheden af overdiagnose i det organiserede screeningsprogram i Stockholm. Aggregerede data anvendt i de fleste undersøgelser kan ikke afspejle den faktiske eksponering af screening. I Stockholm-screeningsprogrammet blev individuelle screeningshistorier indsamlet fra starten, kvalitetskontrolleret og regelmæssigt gemt i registret. Dato for og status for deltagelse, mammografiske resultater, opfølgningsvurderinger, og kræftresultater blev prospektivt registreret . For det andet blev den afskruede befolkning (forventet antal BCs i fravær af screening) opnået fra Naturhistorisk modellering, der giver de samme egenskaber (risici) mellem den afskruede befolkning og den screenede befolkning. Bias, som skyldes valget af kontrolgrupper, kunne således forhindres. For det tredje blev aldersspecifik forekomst og opholdstid taget i betragtning i vores model. Stykkevis konstante overgangshastigheder blev brugt i den ikke-homogene model og monterede dataene bedre end den traditionelle homogene model med konstante hastigheder.

der er nogle begrænsninger, som kan have påvirket vores estimater af overdiagnose. For det første kan detektionstilstanden for BC-tilfælde være forkert klassificeret. For eksempel kunne kvinder født i 1920-1941 have været inviteret til mindst en screeningsrunde i Stockholm-retssagen. SSD ‘erne kan være forkert klassificeret som PSD’ er. Lidbrink et al. fandt, at i den organiserede screening i Stockholm var tumorstørrelsen i screeningsenhederne, der udførte udbredt screening, den samme som i den enhed, hvor forsøget blev udført . Mammografi udført uden for det organiserede screeningsprogram kan også påvirke vores resultater. Deltagelsesgraden i de tættere befolkede amter i Sverige, inklusive Stockholm County, har været lavere end i andre amter i Sverige, hvilket kan skyldes højere adgang til privat mammografi, især i de første år af programmet . De kræfttilfælde, der er diagnosticeret i den private sektor, kan blive klassificeret som NPs i det organiserede screeningsprogram. Risikoen for at udvikle sig til CP kan overvurderes, hvilket fører til en undervurdering af overdiagnose.

for det andet blev overdiagnose som følge af påvisning af progressive kræftformer hos kvinder, der døde, før kræften blev symptomatisk, ikke talt i vores undersøgelse. En mulig udvidelse af modellen er at betragte døden som en separat stat . Desuden var dødeligheden af alle årsager i Stockholm hos kvinder 50-59 og 60-69 fra år 1989 til 2014 3,2 og 7,98 pr .1000 kvindeår. I løbet af en 2,16-årig opholdstid kan der således forventes 6,91 dødsfald pr.tusind kvinder i de progressive skærmopdagede brysttilfælde i alderen 50-59 år. Med andre ord ville et rimeligt skøn over overdiagnose på grund af død være cirka 0, 69% for kvinder 50-59. Det tilsvarende skøn for kvinderne 60-69 ville være 2,8% givet en 3,52-årig opholdstid. Den sande værdi vil være lavere efter at have overvejet forskellen mellem leveringstid og opholdstid.

for det tredje bør antagelserne i modellering af naturhistorien overvejes. Vi antog, at testfølsomheden var konstant over tid, alder, og type BC. På grund af manglende data var effekten af forbedring af screeningsværktøjer, som digital mammografi, ikke mulig at tage højde for. Derudover blev falsk-negative tilfælde antaget at blive påvist i den næste screeningsrunde for at forenkle sandsynlighedsfunktionen. Det kan lidt overvurdere testfølsomheden. Desuden kræver vores ikke-homogene model en vis initieringstid, hvor den sande tilstand enten er kendt eller kan modelleres . Vi begrænsede modellen, så risikoen for BC var nul før 40 år. En følsomhedsanalyse blev udført for at kontrollere denne modelantagelse. Resultaterne var ens, når initieringstiden blev antaget at være 35 eller 45 år (ikke vist). Den gennemsnitlige incidensrate fra Stockholms kræftregister for årene 1989-2004 blev brugt til at tilnærme overgangsgraden fra fri for BC til progressiv PCDP i aldersgruppen 40-49 år. Den underliggende prækliniske incidensrate kan være højere end den kliniske incidensrate, da incidensen stiger med alderen. Dette kan påvirke andre estimater af parametre, især MST hos kvinder 40-49, hvis frekvensen ikke repræsenterer baggrundsforekomsten.

for det fjerde kunne et mere robust CI for estimatet af overdiagnose beregnes ved hjælp af bootstrapping-metoden. Da den individuelle screeningshistorie for over 400.000 kvinder blev brugt til estimering, var estimeringsproceduren imidlertid meget tidskrævende.

et andet vigtigt spørgsmål er, at sandsynlighedsfunktionen kan være flad og føre til et identifikationsproblem. Selvom vores model monterede dataene godt, kan vi ikke udelukke en forkert specifikation af modellen. Den ægte progression af BC kunne have været forenklet i vores fire-statsmodel. På grund af utilstrækkelige eller ufuldstændige (censurerede) data kan det være svært at få de korrekte skøn. For at kunne estimere andre parametre og yderligere kvantificere overdiagnosen er vores model afhængig af oplysningerne fra klinisk detekterede kræftformer, herunder ICs og NPs (som var de mest informative tilfælde i datasættet, fordi den nøjagtige overgangstid til CP er kendt). Tidligere viste vi, at en vis andel (5-10%) af en ikke-skruet gruppe, som aldrig-deltagere, kan stabilisere modellen . Derfor synes inspektionen af sandsynlighedsfunktionen at være nødvendig. Vi har kontrolleret karush–Kuhn-Tucker-betingelserne for at sikre, at optimeringsalgoritmen faktisk konvergerede.

vores resultater giver følgende indsigt til fremtidig forskning. Først, det ville være værdifuldt at vurdere periodeeffekterne på BC-risikoen, opholdstid, og følsomhed for at undersøge, hvordan eksponering for HRT og digital mammografi har påvirket hyppigheden af overdiagnose. Sekund, yderligere sammenligning af overdiagnosestimaterne baseret på andre evalueringsmetoder, som den kumulative incidensmetode, i det samme datasæt skal udføres for at give mere solid dokumentation for beslutningstagere for yderligere at bekræfte resultaterne .

hyppigheden af overdiagnose i det organiserede screeningsprogram afhænger af den latente andel af ikke-progressive BC-tilfælde, men også af screeningsprogrammet, hvor en højere deltagelsesrate eller forbedret følsomhed på grund af bedre screeningsinstrumenter vil føre til højere frekvens af overdiagnose. Balancen mellem fordel og skade ved screening bør overvejes, og det er derfor nødvendigt regelmæssigt at overvåge dødelighedsreduktion og overdiagnose .

KGSAU