Abbiamo utilizzato un modello multi-stato non omogeneo per stimare la frequenza di sovradiagnosi dal numero atteso di BCs non progressivi tra i casi di cancro rilevati dallo schermo nel programma di screening organizzato basato sulla popolazione con mammografia nelle donne 50-69 nella contea di Stoccolma, in Svezia. Abbiamo scoperto che solo lo 0,43% dei casi invasivi rilevati dallo schermo erano sovradiagnosi. La frequenza di sovradiagnosi nel round prevalente era tre volte superiore a quella nei round successivi. Abbiamo dimostrato che il modello non omogeneo adattava i dati meglio del modello omogeneo.
Le stime pubblicate della frequenza della sovradiagnosi sono variate a causa del tipo di programma di screening, della progettazione dello studio, della scelta del gruppo di controllo, del metodo di stima e della regolazione per il tempo di consegna (il tempo in cui lo screening avanza la diagnosi rispetto all’assenza di screening) . La sovradiagnosi basata su dati svedesi è stata stimata in quattro RCT e due studi osservazionali.
Stima della sovradiagnosi basata sugli RCT svedesi
Nello studio di Stoccolma, sono stati eseguiti due cicli di screening per 40.318 donne di età compresa tra 40 e 64 anni e 20.000 controlli sono stati invitati a un ciclo di screening alla fine dello studio. Due stime di sovradiagnosi sono state fatte sulla base dello studio di Stoccolma. Gotzsche ha trovato una sovradiagnosi del 49% confrontando il rischio relativo di tutti i BCs nel periodo di screening . Tuttavia, non riuscendo a separare l’incidenza crescente a causa della diagnosi precoce del cancro (il cosiddetto problema del lead-time) provoca una sovrastima della sovradiagnosi. Moss ha scoperto che l’invasivo (0,81 contro 0,85 per 1000 anni-persona nei gruppi controllati e nei gruppi di controllo) e tutti i tassi di incidenza cumulativa BC (0,88 contro 0,91 per 1000 anni-persona nei gruppi controllati e nei gruppi di controllo) erano simili tra due bracci nel follow-up di 15 anni . Va notato che, poiché anche il gruppo di controllo è stato invitato a un singolo schermo, il che potrebbe portare a qualche sovradiagnosi nel gruppo di controllo, la sovradiagnosi probabilmente è stata sottovalutata in questo approccio. I nostri risultati sulla frequenza di sovradiagnosi nei successivi turni di screening del programma di screening organizzato erano coerenti con la scoperta di Moss nel processo di Stoccolma che non mostrava alcuna prova di sovradiagnosi a seguito di schermi incidenti .
Risultati simili sono stati trovati nel trial a due contee e nel trial di Göteborg; -0.02 e -0.03 per 1000 incidenze cumulative in eccesso assoluto di tutti i BCS sono stati trovati nel gruppo sottoposto a screening nei due trial, rispettivamente . Duffy et al. applicato un modello omogeneo a quattro stati per quantificare la sovradiagnosi . La frequenza di sovradiagnosi nel prevalente e nei due cicli successivi era 3.1%/4.2% e 0.3%/0.3%, rispettivamente, negli studi a due contea / Gothenburg. Queste stime sono in linea con le nostre stime e confermano un basso livello di sovradiagnosi. Utilizzando i dati di follow-up di 29 anni da una contea del processo a due contea, Yen et al. inoltre ha confermato che lo screening non ha portato ad un’incidenza eccessiva di BC nel gruppo sottoposto a screening (rapporto di rischio 1,00) in cui sono stati eseguiti 100.000 schermi aggiuntivi rispetto al gruppo di controllo. Non è stata trovata alcuna prova di sovradiagnosi per BC invasiva o in situ .
La stima per la sovradiagnosi basata sullo studio Malmö I è stata considerata affidabile a causa del design dello stop-screen (le donne nel gruppo di controllo non sono mai state invitate allo screening) e di un adeguato tempo di follow-up . Zackrisson et al. stimato la frequenza di sovradiagnosi al 10% per tutti i BCs e al 7% per i BCS invasivi nelle donne da 55 a 69 in assegnazione casuale confrontando il tasso di incidenza tra i gruppi invitati e di controllo a 15 anni di follow-up, dopo la fine dello studio . Il gruppo BC del Regno Unito ha ricalcolato la stima della sovradiagnosi confrontando i numeri in eccesso con denominatori diversi, come il numero di tumori diagnosticati durante l’intero periodo di follow-up nel gruppo di controllo/gruppo invitato o il numero di tumori/tumori rilevati dallo schermo diagnosticati durante il periodo di screening nel gruppo invitato . Le stime variavano dall ‘ 11% al 29%. Sebbene gli RCT possano fornire una buona opportunità per quantificare la sovradiagnosi, la generalizzabilità per l’attuale programma di screening organizzato rimane dubbia.
Stima della sovradiagnosi basata sui programmi di screening organizzati
Zahl et al. utilizzato l’incidenza specifica per età di BC invasiva durante 1971-2000 per quantificare l’incidenza crescente dopo l’introduzione dello screening mammografico in Svezia . Hanno stimato che la frequenza di sovradiagnosi nelle donne di 50-69 anni era del 45%; tuttavia, il tempo di consegna non è stato adeguato correttamente e l’aumento dell’incidenza nel tempo non è stato considerato. Jonsson et al. applicato anche l’approccio del tasso di incidenza per quantificare la sovradiagnosi in 11 paesi su 20 dopo aver implementato lo screening organizzato . L’incidenza pre-screening (15 anni prima dell’inizio dello screening) è stata utilizzata per calcolare l’incidenza attesa in assenza di screening durante il periodo di screening fino all’anno 2000. Nella fase stabile, i tassi di sovradiagnosi sono stati stimati al 54% e al 21% per i gruppi di età 50-59 e 60-69, rispettivamente, dopo l’aggiustamento del lead-time. Va notato che l’aumento dell’incidenza potrebbe derivare da un effetto di screening prevalente tra i nuovi arrivati, potenziali cambiamenti nei fattori di rischio che portano a tendenze mutevoli e così via; pertanto, non dovrebbe essere attribuito interamente alla sovradiagnosi . Tuttavia, i dati del programma di screening organizzato nella contea di Stoccolma non sono stati inclusi in questo studio e la scelta del periodo di pre-screening potrebbe aver influenzato la stima della sovradiagnosi . Pertanto, è stato difficile confrontare con i nostri risultati.
Stima del tempo medio di soggiorno
Le nostre stime del MSTs per le donne di età compresa tra 40-49, 50-59 e 60-69 (2.60, 2.16 e 3.52 anni) erano inferiori a quelle precedentemente riportate MSTs nello studio a due contee (2.44, 3.70 e 4.17 anni) . Ci sono diverse ragioni per i MST più brevi nel nostro studio. In primo luogo, il tempo di soggiorno nel nostro modello rappresenta il tempo di soggiorno nel BCS progressivo. I BCS non progressivi che hanno un tempo di soggiorno infinito sono stati separati. In secondo luogo, è stato dimostrato che esiste un’associazione tra terapia ormonale sostitutiva (HRT), rischio BC e tempo di soggiorno . In Svezia, l’uso di HRT è aumentato a partire dal 1990 e diminuito dopo il 2002 e la maggior parte dell’uso di HRT è stata nella fascia di età 50-59 . L’uso di HRT aumenta il rischio di carcinoma lobulare invasivo, che ha un tempo di soggiorno più breve rispetto al carcinoma duttale . Questo potrebbe spiegare perché abbiamo ottenuto stime più basse di MST nelle donne di 50-59 anni. Un’altra spiegazione può essere che Duffy et al. utilizzato l’età a assegnazione casuale per classificare la popolazione in gruppi di età indipendentemente dall’età alla fine dello studio e il MST è stato stimato separatamente per questi gruppi. Ad esempio, le donne 50-59 in caso di assegnazione casuale avevano 57-66 anni alla fine dello studio e quindi avevano una media di 3-4 anni in più durante il periodo di studio. La stima di MST più lungo nel gruppo di età 50-59 trovato da Duffy et al. può essere parzialmente attribuibile al MST più lungo osservato in età 60-69. Al contrario, nel nostro modello, una donna potrebbe contribuire alla probabilità di stima della MST in diversi intervalli di età mentre si muovono attraverso i gruppi di età.
Preoccupazioni per i tumori in situ
L’incidenza del carcinoma duttale in situ è aumentata significativamente dall’introduzione del programma di screening organizzato . Questo aumento è stato considerato un marker di sovradiagnosi . Un’analisi di sensibilità è stata eseguita combinando il BCS in situ e invasivo nello stesso stato per stimare la sovradiagnosi (file aggiuntivi 1 e 2). Ci sono stati 51,6 casi di BC rilevati non progressivi trovati tra 9631 casi di BC in situ e invasivi, corrispondenti allo 0,54% di sovradiagnosi (file aggiuntivo 3). Sebbene sia stata riscontrata una sovradiagnosi leggermente superiore, la frequenza di sovradiagnosi era ancora bassa. Risultati simili sono stati dimostrati dal modello a sei stati nelle donne 40-49, suggerendo che la maggior parte dei tumori in situ rilevati dallo schermo si sarebbe presentata clinicamente in assenza di screening .
Punti di forza e limitazioni
La nostra stima di sovradiagnosi basata su un modello non omogeneo e su dati di screening su larga scala ha diversi punti di forza. In primo luogo, per quanto ne sappiamo, questo è il primo studio che utilizza storie di screening individuali per quantificare la frequenza di sovradiagnosi nel programma di screening organizzato a Stoccolma. I dati aggregati utilizzati nella maggior parte degli studi non possono riflettere l’esposizione effettiva dello screening. Nel programma di screening di Stoccolma, le storie di screening individuali sono state raccolte fin dall’inizio, controllate dalla qualità e regolarmente archiviate nel registro. La data e lo stato di partecipazione, i risultati mammografici, le valutazioni di follow-up e gli esiti del cancro sono stati registrati in modo prospettico . In secondo luogo, la popolazione non schermata (numero previsto di BCS in assenza di screening) è stata ottenuta dalla modellazione della storia naturale che fornisce le stesse caratteristiche (rischi) tra la popolazione non schermata e la popolazione schermata. Il pregiudizio, che deriva dalla scelta dei gruppi di controllo, potrebbe quindi essere prevenuto. In terzo luogo, l’incidenza specifica dell’età e il tempo di soggiorno sono stati presi in considerazione nel nostro modello. I tassi di transizione costanti a tratti sono stati utilizzati nel modello non omogeneo e hanno adattato i dati meglio del modello omogeneo tradizionale con tassi costanti.
Ci sono alcune limitazioni che possono aver influenzato le nostre stime di sovradiagnosi. Innanzitutto, la modalità di rilevamento dei casi BC potrebbe essere erroneamente classificata. Ad esempio, le donne nate nel 1920-1941 potrebbero essere state invitate ad almeno un turno di screening nel processo di Stoccolma. Gli SSD potrebbero essere classificati erroneamente come PSD. Lidbrink et al. ha scoperto che, nello screening organizzato a Stoccolma, la dimensione del tumore nelle unità di screening che eseguivano lo screening prevalente era simile a quella dell’unità in cui è stato condotto lo studio . La mammografia eseguita al di fuori del programma di screening organizzato potrebbe anche influenzare i nostri risultati. Il tasso di partecipazione nelle contee più densamente popolate della Svezia, inclusa la contea di Stoccolma, è stato inferiore rispetto ad altre contee della Svezia, il che potrebbe essere dovuto a un maggiore accesso alla mammografia privata, in particolare durante i primi anni del programma . I casi di cancro diagnosticati nel settore privato potrebbero essere classificati erroneamente come NPS nel programma di screening organizzato. Il rischio di progredire verso la CP potrebbe essere sopravvalutato, portando a una sottostima della sovradiagnosi.
In secondo luogo, la sovradiagnosi derivante dalla rilevazione di tumori progressivi nelle donne che sono morte prima che il cancro diventasse sintomatico non è stata contata nel nostro studio. Una possibile estensione del modello è considerare la morte come uno stato separato . Inoltre, a Stoccolma, i tassi di mortalità per tutte le cause nelle donne 50-59 e 60-69 dall’anno 1989 al 2014 erano 3,2 e 7,98 per 1000 donne-anni . Pertanto, durante un soggiorno di 2,16 anni, si potrebbero prevedere 6,91 morti per mille donne in quei casi di seno progressivi rilevati dallo schermo all’età di 50-59 anni. In altre parole, una stima ragionevole di sovradiagnosi dovuta alla morte sarebbe di circa lo 0,69% per le donne 50-59. La stima corrispondente per le donne 60-69 sarebbe 2.8% dato un tempo di soggiorno di 3.52 anni. Il valore reale sarà più basso dopo aver considerato la differenza tra il tempo di consegna e il tempo di soggiorno.
In terzo luogo, le ipotesi fatte nella modellazione della storia naturale dovrebbero essere considerate. Abbiamo assunto la sensibilità del test per essere costante nel tempo, età, e il tipo di BC. A causa della mancanza di dati, l’effetto del miglioramento degli strumenti di screening, come la mammografia digitale, non è stato possibile prendere in considerazione. Inoltre, si presumeva che i casi falsi negativi fossero rilevati nel prossimo ciclo di screening per semplificare la funzione di verosimiglianza. Potrebbe sopravvalutare leggermente la sensibilità del test. Inoltre, il nostro modello non omogeneo richiede un certo tempo di iniziazione in cui il vero stato è noto o può essere modellato . Abbiamo limitato il modello in modo che il rischio di BC fosse zero prima dell’età di 40 anni. È stata eseguita un’analisi di sensibilità per verificare questa ipotesi del modello. I risultati sono stati simili quando si è ipotizzato che il tempo di inizio fosse di 35 o 45 anni (non mostrato). Il tasso medio di incidenza dal registro del cancro di Stoccolma per gli anni 1989-2004 è stato utilizzato per approssimare il tasso di transizione da libero da BC a PCDP progressivo nella fascia di età 40-49. Il tasso di incidenza preclinica sottostante potrebbe essere superiore al tasso di incidenza clinica poiché l’incidenza aumenta con l’età. Ciò potrebbe influenzare altre stime dei parametri, in particolare la MST nelle donne 40-49, se il tasso non rappresenta l’incidenza di fondo.
In quarto luogo, un CI più robusto della stima della sovradiagnosi potrebbe essere calcolato attraverso il metodo di bootstrap. Tuttavia, poiché la storia di screening individuale per oltre 400.000 donne è stata utilizzata per la stima, la procedura di stima è stata molto lunga.
Un altro problema importante è che la funzione di verosimiglianza potrebbe essere piatta e portare a un problema di identificabilità. Anche se il nostro modello misura bene i dati, non possiamo escludere un errore di specificazione del modello. La vera progressione di BC avrebbe potuto essere semplificata nel nostro modello a quattro stati. A causa di dati insufficienti o incompleti (censurati), potrebbe essere difficile ottenere le stime corrette. Per stimare con successo altri parametri e per quantificare ulteriormente la sovradiagnosi, il nostro modello si basa sulle informazioni dei tumori rilevati clinicamente, inclusi ICs e NPs (che erano i casi più informativi nel set di dati perché è noto il tempo di transizione esatto al CP). In precedenza, abbiamo dimostrato che una certa proporzione (5-10%) di un gruppo non schermato, come i non frequentanti, può stabilizzare il modello . Pertanto, l’ispezione della funzione di verosimiglianza sembra essere necessaria. Abbiamo controllato le condizioni di Karush–Kuhn–Tucker per assicurarci che l’algoritmo di ottimizzazione sia effettivamente convergente.
I nostri risultati forniscono le seguenti informazioni per la ricerca futura. In primo luogo, sarebbe utile valutare gli effetti del periodo sul rischio BC, il tempo di soggiorno e la sensibilità per indagare in che modo l’esposizione alla terapia ormonale sostitutiva e alla mammografia digitale hanno influenzato la frequenza della sovradiagnosi. In secondo luogo, un ulteriore confronto delle stime di sovradiagnosi basate su altri metodi di valutazione, come il metodo dell’incidenza cumulativa, nello stesso set di dati deve essere effettuato per fornire prove più solide ai responsabili politici per confermare ulteriormente i risultati .
La frequenza della sovradiagnosi nel programma di screening organizzato dipende dalla percentuale latente di casi BC non progressivi, ma anche dal programma di screening, dove un tasso di partecipazione più elevato o una migliore sensibilità dovuta a migliori strumenti di screening porteranno a una maggiore frequenza di sovradiagnosi. L’equilibrio tra benefici e danni dello screening dovrebbe essere considerato e quindi sarà necessario monitorare regolarmente la riduzione della mortalità e la sovradiagnosi .