Vi använde en icke-homogen multistatsmodell för att uppskatta frekvensen av överdiagnos från det förväntade antalet icke-progressiva BCs bland de screen-upptäckta cancerfallen i det befolkningsbaserade organiserade screeningprogrammet med mammografi hos kvinnor 50-69 i Stockholms län, Sverige. Vi fann att endast 0.43% av de skärmdetekterade invasiva fallen var överdiagnostiserade. Frekvensen av överdiagnos i den vanliga rundan var tre gånger högre än i de efterföljande omgångarna. Vi visade att den icke-homogena modellen passade data bättre än den homogena modellen.
publicerade uppskattningar av frekvensen av överdiagnos har varierat på grund av typ av screeningprogram, studiedesign, val av kontrollgrupp, uppskattningsmetod och justering för ledtid (den tid då screening avancerar diagnosen jämfört med frånvaro av screening) . Överdiagnos baserad på svenska data har uppskattats i fyra RCT och två observationsstudier.
uppskattning av överdiagnos baserat på svenska RCTs
i Stockholmsprovet utfördes två screeningrundor för 40 318 kvinnor 40 till 64 år och 20 000 kontroller inbjöds också till en screeningrunda i slutet av studien. Två uppskattningar av överdiagnos gjordes på grundval av Stockholmsprovet. Gotzsche fann 49% överdiagnos genom att jämföra den relativa risken för alla BCs under screeningperioden . Att misslyckas med att separera den ökande förekomsten på grund av tidigare upptäckt av cancer (det så kallade ledtidsproblemet) resulterar emellertid i överskattning av överdiagnos. Moss fann att de invasiva (0,81 mot 0,85 per 1000 personår i de screenade och i kontrollgrupperna) och alla BC-kumulativa incidensnivåer (0,88 mot 0,91 per 1000 personår i de screenade och kontrollgrupperna) var likartade mellan två armar under 15 års uppföljning . Det bör noteras att eftersom kontrollgruppen också var inbjuden till en enda skärm, vilket kan leda till viss överdiagnos i kontrollgruppen, underskattades överdiagnos troligen i detta tillvägagångssätt. Våra resultat av frekvensen av överdiagnos i de efterföljande screeningrundorna i det organiserade screeningprogrammet överensstämde med Moss fynd i Stockholmsprovet som inte visade några bevis på överdiagnos till följd av incidentskärmar .
liknande resultat hittades i två läns-och Göteborgsförsöket; -0,02 och -0,03 per 1000 absolut överskott av kumulativ incidens av alla BCs hittades i den screenade gruppen i de två försöken . Duffy et al. tillämpade en homogen fyrstatsmodell för att kvantifiera överdiagnosen . Frekvensen av överdiagnos i de vanliga och de två efterföljande omgångarna var 3,1%/4,2% respektive 0,3%/0,3% i två läns- / Göteborgsstudierna. Dessa uppskattningar är i linje med våra uppskattningar och bekräftar en låg nivå av överdiagnos. Med hjälp av 29-års uppföljningsdata från ett län i rättegången i två län, Yen et al. vidare bekräftade att screening inte ledde till överdriven förekomst av BC i den screenade gruppen (riskkvot 1,00) där 100 000 ytterligare skärmar utfördes jämfört med kontrollgruppen. Inga tecken på överdiagnos för invasiv eller in situ BC hittades .
uppskattningen för överdiagnos baserad på Malm Bisexual i-försöket har ansetts vara tillförlitlig på grund av stoppskärmdesignen (kvinnor i kontrollgruppen blev aldrig inbjudna till screening) och en adekvat uppföljningstid . Zackrisson et al. uppskattade frekvensen av överdiagnos vid 10% för alla BCs och 7% för invasiv BCs hos kvinnor 55 till 69 vid slumpmässig tilldelning genom att jämföra incidensen mellan de inbjudna och kontrollgrupperna vid 15 års uppföljning, efter slutet av försöket . Förenade kungarikets BC-panel beräknade om den uppskattade överdiagnosen genom att jämföra överskottet med olika nämnare, såsom antalet cancerformer som diagnostiserats under hela uppföljningsperioden i kontrollgruppen/inbjuden grupp eller antalet cancer/skärmdetekterade cancerformer som diagnostiserats under screeningperioden i den inbjudna gruppen . Uppskattningarna varierade från 11% till 29%. Även om RCT kan ge ett bra tillfälle att kvantifiera överdiagnos, är generaliserbarheten för det nuvarande organiserade screeningprogrammet tvivelaktigt.
uppskattning av överdiagnos baserat på de organiserade screeningprogrammen
Zahl et al. använde den åldersspecifika incidensen av invasiv BC under 1971-2000 för att kvantifiera den ökande incidensen efter införandet av mammografisk screening i Sverige . De uppskattade att frekvensen av överdiagnos hos kvinnor 50-69 år var 45%; dock var ledtiden inte korrekt justerad för och ökningen av förekomsten över tiden beaktades inte. Jonsson et al. tillämpade också incidensgraden för att kvantifiera överdiagnos i 11 av 20 länder efter genomförande av organiserad screening . Pre-screeningincidensen (15 år före screeningstart) användes för att beräkna den förväntade förekomsten i frånvaro av screening under screeningperioden fram till år 2000. I den stabila fasen uppskattades överdiagnoshastigheterna till 54% och 21% för åldersgrupperna 50-59 respektive 60-69 efter justering av ledtid. Det bör noteras att den ökade incidensen kan bero på en utbredd screeningeffekt bland nykomlingar, potentiella förändringar i riskfaktorer som leder till förändrade trender och så vidare; därför bör det inte helt hänföras till överdiagnos . Uppgifterna från det organiserade screeningprogrammet i Stockholms län inkluderades dock inte i denna studie och valet av pre-screeningperiod kan ha påverkat uppskattningen av överdiagnos . Därför var det svårt att jämföra med våra resultat.
uppskattning av genomsnittlig vistelsetid
våra uppskattningar av MST för kvinnor i åldrarna 40-49, 50-59 och 60-69 (2,60, 2,16 och 3,52 år) var lägre än tidigare rapporterade mst i två läns försök (2,44, 3,70 och 4,17 år). Det finns flera orsaker till de kortare MSTs i vår studie. För det första representerar vistelsetiden i vår modell vistelsetiden i den progressiva BCs. De icke-progressiva BCs som har oändlig vistelsetid separerades. För det andra har det visat sig att det finns en koppling mellan hormonersättningsterapi (HRT), BC-risk och vistelsetid . I Sverige ökade användningen av HRT från och med 1990 och minskade efter 2002 och majoriteten av HRT-användningen var i åldersgruppen 50-59 år . HRT-användning ökar risken för invasivt lobulärt karcinom, som har en kortare vistelsetid än duktalt karcinom . Detta kan förklara varför vi fick lägre uppskattningar av MST hos kvinnor 50-59 år gamla. En annan förklaring kan vara att Duffy et al. används ålder slumpmässigt för att klassificera befolkningen i åldersgrupper oavsett hur gammal de var i slutet av studien och MST uppskattades separat för dessa grupper. Till exempel var kvinnor 50-59 vid slumpmässigt uppdrag 57-66 år i slutet av försöket och var därmed i genomsnitt 3-4 år äldre under studieperioden. Uppskattningen av längre MST i 50-59 åldersgrupp hittades av Duffy et al. kan delvis hänföras till den längre MST som observerats vid åldrarna 60-69. I kontrast, i vår modell, en kvinna kan bidra till sannolikheten för uppskattning av MST i olika åldersintervall när de rör sig genom åldersgrupperna.
oro för in situ-cancer
förekomsten av duktalt karcinom in situ-cancer har ökat avsevärt sedan introduktionen av det organiserade screeningprogrammet . Denna ökning har ansetts vara en markör för överdiagnos . En känslighetsanalys utfördes genom att kombinera in situ och invasiv BCs i samma tillstånd för att uppskatta överdiagnos (ytterligare filer 1 och 2). Det fanns 51,6 icke-progressiva upptäckta BC-fall som hittades bland 9631 in situ och invasiva BC-fall, motsvarande 0,54% överdiagnos (ytterligare fil 3). Även om något högre överdiagnos hittades var frekvensen av överdiagnos fortfarande låg. Liknande fynd demonstrerades av sexstatsmodellen hos kvinnor 40-49, vilket tyder på att majoriteten av skärmdetekterade in situ-cancer skulle ha presenterat kliniskt i frånvaro av screening .
styrkor och begränsningar
vår uppskattning av överdiagnos baserad på en icke-homogen modell och storskalig screeningdata har flera styrkor. Först, så vitt vi vet, är detta den första studien som använder individuella screeninghistorier för att kvantifiera frekvensen av överdiagnos i det Stockholmsorganiserade screeningprogrammet. Aggregerade data som används i de flesta studier kan inte återspegla den faktiska exponeringen av screening. I Stockholms screeningprogram samlades individuella screeninghistorier från början, kvalitetskontrollerades och lagrades regelbundet i registret. Datum för och status för deltagande, mammografiska resultat, uppföljningsbedömningar, och cancerresultat registrerades prospektivt . För det andra erhölls den oskärmade befolkningen (förväntat antal BCs i frånvaro av screening) från naturhistorisk modellering som ger samma egenskaper (risker) mellan den oskärmade befolkningen och den screenade befolkningen. Bias, som härrör från valet av kontrollgrupper, kan således förhindras. För det tredje beaktades åldersspecifik förekomst och vistelsetid i vår modell. Bitvis konstanta övergångshastigheter användes i den icke-homogena modellen och monterade data bättre än den traditionella homogena modellen med konstanta hastigheter.
det finns vissa begränsningar som kan ha påverkat våra uppskattningar av överdiagnos. För det första kan detekteringsläget för BC-fall klassificeras fel. Till exempel kan kvinnor födda 1920-1941 ha blivit inbjudna till minst en screeningrunda i Stockholmsprovet. SSD: erna kan klassificeras fel som PSD: er. Lidbrink et al. fann att i den organiserade screeningen i Stockholm var tumörstorleken i screeningsenheterna som utförde utbredd screening liknande den i den enhet där försöket genomfördes . Mammografi som utförs utanför det organiserade screeningprogrammet kan också förspänna våra resultat. Deltagandet i de mer tätbefolkade länen i Sverige, inklusive Stockholms län, har varit lägre än i andra län i Sverige, vilket kan bero på högre tillgång till privat mammografi, särskilt under programmets första år . De cancerfall som diagnostiserats i den privata sektorn kan felklassificeras som NPs i det organiserade screeningprogrammet. Risken att gå vidare till CP kan överskattas, vilket leder till en underskattning av överdiagnos.
För det andra räknades inte överdiagnos till följd av detektering av progressiva cancerformer hos kvinnor som dog innan cancern blev symptomatisk i vår studie. En möjlig förlängning av modellen är att betrakta döden som ett separat tillstånd . Dessutom, i Stockholm, var dödligheten för alla orsaker hos kvinnor 50-59 och 60-69 från år 1989 till 2014 3,2 och 7,98 per 1000 kvinnoår . Således, under en 2.16-årig vistelsetid, kan 6.91 dödsfall per tusen kvinnor förväntas i de progressiva skärmupptäckta bröstfallen i åldrarna 50-59. Med andra ord skulle en rimlig uppskattning av överdiagnos på grund av döden vara cirka 0, 69% för kvinnor 50-59. Motsvarande uppskattning för kvinnorna 60-69 skulle vara 2,8% med tanke på en 3,52-årig vistelsetid. Det verkliga värdet blir lägre efter att ha beaktat skillnaden mellan ledtid och vistelsetid.
För det tredje bör antagandena i modellering av naturhistoria beaktas. Vi antog att testkänsligheten var konstant över tiden, ålder, och typ av BC. På grund av brist på data var effekten av förbättring av screeningverktyg, som digital mammografi, inte möjlig att ta hänsyn till. Dessutom antogs falskt negativa fall upptäckas i nästa screeningrunda för förenkling av sannolikhetsfunktionen. Det kan lätt överskatta testkänsligheten. Dessutom kräver vår icke-homogena modell en viss Initieringstid där det sanna tillståndet antingen är känt eller kan modelleras . Vi begränsade modellen så att risken för BC var noll före 40 års ålder. En känslighetsanalys utfördes för att kontrollera detta modellantagande. Resultaten var likartade när initieringstiden antogs vara 35 eller 45 år (ej visad). Den genomsnittliga incidensen från Stockholms cancerregister för åren 1989-2004 användes för att approximera övergångsgraden från fritt från BC till progressiv PCDP i åldersgruppen 40-49. Den underliggande prekliniska incidensen kan vara högre än den kliniska incidensen eftersom incidensen ökar med åldern. Detta kan påverka andra uppskattningar av parametrar, särskilt MST hos kvinnor 40-49, om frekvensen inte representerar bakgrundsincidensen.
fjärde, en mer robust CI av uppskattningen av överdiagnos kunde beräknas genom bootstrapping-metoden. Eftersom den individuella screeninghistoriken för över 400 000 kvinnor användes för uppskattning var uppskattningsförfarandet mycket tidskrävande.
en annan viktig fråga är att sannolikhetsfunktionen kan vara platt och leda till ett identifierbarhetsproblem. Även om vår modell passade data väl, kan vi inte utesluta en felspecifikation av modellen. Den äkta utvecklingen av BC kunde ha förenklats i vår fyrstatsmodell. På grund av otillräckliga eller ofullständiga (censurerade) data kan det vara svårt att få rätt uppskattningar. För att framgångsrikt uppskatta andra parametrar och för att ytterligare kvantifiera överdiagnosen bygger vår modell på informationen från kliniskt upptäckta cancerformer, inklusive ICs och NPs (som var de mest informativa fallen i datasetet eftersom den exakta övergångstiden till CP är känd). Tidigare visade vi att en viss andel (5-10%) av en oskärmad grupp, som never-attenders, kan stabilisera modellen . Därför verkar kontrollen av sannolikhetsfunktionen vara nödvändig. Vi har kontrollerat Karush-Kuhn-Tucker-förhållandena för att se till att optimeringsalgoritmen verkligen konvergerades.
våra resultat ger följande insikter för framtida forskning. För det första skulle det vara värdefullt att bedöma periodeffekterna på BC-risken, vistelsetid och känslighet för att undersöka hur exponering för HRT och digital mammografi har påverkat frekvensen av överdiagnos. För det andra måste ytterligare jämförelse av överdiagnostiserade uppskattningar baserade på andra utvärderingsmetoder, som den kumulativa incidensmetoden, i samma dataset utföras för att ge mer solida bevis för beslutsfattare för att ytterligare bekräfta resultaten .
frekvensen av överdiagnos i det organiserade screeningprogrammet beror på den latenta andelen icke-progressiva BC-fall men också på screeningprogrammet, där en högre deltagande eller förbättrad känslighet på grund av bättre screeninginstrument kommer att leda till högre frekvens av överdiagnos. Balansen mellan nytta och skada av screening bör övervägas och därmed regelbundet övervakning av mortalitetsreduktion och överdiagnos kommer att vara nödvändig .