Sobrediagnóstico en el programa de exámenes de detección del cáncer de mama organizado basado en la población estimado por un modelo multiestatal no homogéneo: en un estudio de cohortes en el que se utilizaron datos individuales con seguimiento a largo plazo

, utilizamos un modelo multiestatal no homogéneo para estimar la frecuencia de sobrediagnóstico a partir del número esperado de SC no progresivos entre los casos de cáncer detectados mediante exámenes de detección en el programa de exámenes de detección organizados basados en la población con mamografía en mujeres de 50 a 69 años en el condado de Estocolmo, Suecia. Encontramos que solo el 0,43% de los casos invasivos detectados por exámenes de detección fueron sobrediagnosticados. La frecuencia de sobrediagnóstico en la ronda prevalente fue tres veces mayor que en las rondas posteriores. Demostramos que el modelo no homogéneo se ajustaba mejor a los datos que el modelo homogéneo.

Las estimaciones publicadas de la frecuencia de sobrediagnóstico han variado debido al tipo de programa de exámenes de detección, el diseño del estudio, la elección del grupo de control, el método de estimación y el ajuste por el tiempo de espera (el tiempo en que los exámenes de detección avanzan el diagnóstico en comparación con la ausencia de exámenes de detección) . El sobrediagnóstico basado en datos suecos se ha estimado en cuatro ECA y dos estudios observacionales.

Estimación del sobrediagnóstico con base en los ECA suecos

En el ensayo de Estocolmo, se realizaron dos rondas de detección para 40.318 mujeres de 40 a 64 años de edad, y también se invitó a 20.000 controles a una ronda de detección al final del ensayo. Se hicieron dos estimaciones de sobrediagnóstico sobre la base del ensayo de Estocolmo. Gotzsche encontró un sobrediagnóstico del 49% al comparar el riesgo relativo de todos los SC en el período de detección . Sin embargo, no separar la creciente incidencia debido a la detección temprana del cáncer (el llamado problema del tiempo de espera) resulta en una sobreestimación del sobrediagnóstico. Moss encontró que las tasas de incidencia acumulada de CB invasiva (0,81 versus 0,85 por 1.000 años-persona en los grupos de exámenes de detección y control) y todas las tasas de incidencia acumulada de CB (0,88 versus 0,91 por 1.000 años-persona en los grupos de exámenes de detección y control) fueron similares entre dos grupos durante 15 años de seguimiento . Cabe señalar que debido a que el grupo de control también fue invitado a una sola prueba de detección, lo que podría llevar a algún sobrediagnóstico en el grupo de control, el sobrediagnóstico probablemente se subestimó en este enfoque. Nuestros hallazgos de la frecuencia de sobrediagnóstico en las rondas de exámenes de detección posteriores del programa organizado de exámenes de detección fueron consistentes con el hallazgo de Moss en el ensayo de Estocolmo, que no mostró evidencia de sobrediagnóstico como resultado de exámenes de detección incidentes .

Se encontraron resultados similares en el ensayo de Dos condados y en el ensayo de Gotemburgo; se encontraron -0,02 y -0,03 por 1.000 incidencias acumulativas en exceso absoluto de todos los SC en el grupo de exámenes de detección en los dos ensayos, respectivamente . Duffy et al. se aplicó un modelo homogéneo de cuatro estados para cuantificar el sobrediagnóstico . La frecuencia de sobrediagnóstico en la prevalente y en las dos rondas posteriores fue de 3,1%/4,2% y 0,3%/0,3%, respectivamente, en los ensayos de Dos condados/Gotemburgo. Estas estimaciones están en línea con nuestras estimaciones y confirman un bajo nivel de sobrediagnóstico. Utilizando datos de seguimiento de 29 años de un condado del ensayo de dos condados, Yen et al. confirmó además que la revisión no conducir a exceso de incidencia de la AC en la cámara de grupo (relación de riesgo 1.00) donde 100,000 pantallas adicionales se realizaron en comparación con el grupo control. No se encontró evidencia de sobrediagnóstico de CB invasiva o in situ .

La estimación de sobrediagnóstico basada en el ensayo Malmö I se ha considerado fiable debido al diseño de la pantalla de parada (las mujeres del grupo de control nunca fueron invitadas a la detección) y a un tiempo de seguimiento adecuado . Zackrisson et al. se calculó la frecuencia de sobrediagnóstico en 10% para todos los SC y 7% para los SC invasivos en mujeres de 55 a 69 años en asignación aleatoria mediante la comparación de la tasa de incidencia entre los grupos invitados y de control a los 15 años de seguimiento, después del final del ensayo . El panel de Columbia Británica del Reino Unido recalculó el sobrediagnóstico estimado comparando los números excesivos con diferentes denominadores, como el número de cánceres diagnosticados durante todo el período de seguimiento en el grupo de control/grupo invitado o el número de cánceres/cánceres detectados por exámenes de detección diagnosticados en el período de exámenes de detección en el grupo invitado . Las estimaciones oscilaron entre el 11% y el 29%. Aunque los ECA pueden proporcionar una buena oportunidad para cuantificar el sobrediagnóstico, la generalización del programa de detección organizado actual sigue siendo dudosa.

Estimación del sobrediagnóstico con base en los programas de cribado organizados

Zahl et al. se utilizó la incidencia específica por edad de la CB invasiva durante 1971-2000 para cuantificar la incidencia creciente después de la introducción de exámenes de detección mamográficos en Suecia . Estimaron que la frecuencia de sobrediagnóstico en mujeres de 50 a 69 años fue del 45%; sin embargo, el tiempo de espera no se ajustó adecuadamente y no se consideró el aumento de la incidencia a lo largo del tiempo. Jonsson et al. también se aplicó el enfoque de la tasa de incidencia para cuantificar el sobrediagnóstico en 11 de 20 países después de la implementación de la detección organizada . Se utilizó la incidencia previa a la detección (15 años antes del inicio de la detección) para calcular la incidencia esperada en ausencia de detección durante el período de detección hasta el año 2000. En la fase estable, las tasas de sobrediagnóstico se estimaron en 54% y 21% para los grupos de edad de 50-59 y 60-69 años, respectivamente, después del ajuste del tiempo de espera. Cabe señalar que el aumento de la incidencia puede deberse a un efecto prevalente de los exámenes de detección entre los recién llegados, a posibles cambios en los factores de riesgo que conducen a cambios en las tendencias, etc.; por lo tanto, no debe atribuirse enteramente al sobrediagnóstico . Sin embargo, los datos del programa organizado de exámenes de detección en el condado de Estocolmo no se incluyeron en este estudio y la elección del período de exámenes previos podría haber influido en la estimación del sobrediagnóstico . Por lo tanto, fue difícil comparar con nuestros hallazgos.

Estimación del tiempo medio de estancia

Nuestras estimaciones de los TM para mujeres de 40 a 49 años, 50 a 59 años y 60 a 69 años (2,60, 2,16 y 3,52 años) fueron inferiores a los TM notificados anteriormente en el ensayo de dos condados (2,44, 3,70 y 4,17 años) . Hay varias razones para que el MST sea más corto en nuestro estudio. En primer lugar, el tiempo de estadía en nuestro modelo representa el tiempo de estadía en el SC progresivo. Los SC no progresivos que tenían un tiempo de estadía infinito se separaron. En segundo lugar, se ha demostrado que existe una asociación entre la terapia de reemplazo hormonal (THS), el riesgo de CB y el tiempo de estadía . En Suecia, el uso de la TRH aumentó a partir de 1990 y disminuyó después de 2002, y la mayor parte del uso de la TRH se produjo en el grupo de edad de 50 a 59 años . El uso de THS aumenta el riesgo de carcinoma lobular invasivo, que tiene un tiempo de permanencia más corto que el carcinoma ductal . Esto podría explicar por qué obtuvimos estimaciones más bajas de MST en mujeres de 50 a 59 años de edad. Otra explicación puede ser que Duffy et al. se utilizó la edad en la asignación aleatoria para clasificar a la población en grupos de edad, independientemente de la edad que tuvieran al final del estudio, y la TSM se estimó por separado para estos grupos. Por ejemplo, las mujeres de 50 a 59 años en la asignación aleatoria tenían entre 57 y 66 años de edad al final del ensayo y, por lo tanto, eran un promedio de 3 a 4 años mayores durante el período del estudio. La estimación de la TSM más larga en el grupo de edad de 50 a 59 años encontrada por Duffy et al. puede ser parcialmente atribuible a la mayor duración de la MST observada a las edades de 60 a 69 años. Por el contrario, en nuestro modelo, una mujer puede contribuir a la probabilidad de estimación de la TSM en diferentes intervalos de edad a medida que avanza a través de los grupos de edad.

Preocupaciones sobre los cánceres in situ

La incidencia de carcinoma ductal el cáncer in situ ha aumentado significativamente desde la introducción del programa organizado de exámenes de detección . Este aumento se ha considerado un marcador de sobrediagnóstico . Se realizó un análisis de sensibilidad combinando el SC in situ y el SC invasivo en el mismo estado para estimar el sobrediagnóstico (archivos adicionales 1 y 2). Se encontraron 51,6 casos de CB no progresiva detectada entre 9.631 casos de CB in situ e invasivos, lo que corresponde a un sobrediagnóstico del 0,54% (archivo adicional 3). Aunque se encontró un sobrediagnóstico ligeramente mayor, la frecuencia de sobrediagnóstico aún era baja. El modelo de seis estados demostró hallazgos similares en mujeres de 40 a 49 años, lo que indica que la mayoría de los cánceres in situ detectados mediante exámenes de detección se habrían presentado clínicamente en ausencia de exámenes de detección .

Fortalezas y limitaciones

Nuestra estimación de sobrediagnóstico basada en un modelo no homogéneo y datos de cribado a gran escala tiene varias fortalezas. En primer lugar, hasta donde sabemos, este es el primer estudio que utiliza historiales de detección individuales para cuantificar la frecuencia de sobrediagnóstico en el programa de detección organizado de Estocolmo. Los datos agregados utilizados en la mayoría de los estudios no pueden reflejar la exposición real de los exámenes de detección. En el programa de exámenes de detección de Estocolmo, se recopilaron historiales de exámenes individuales desde el principio, se verificó la calidad y se almacenaron regularmente en el registro. Se registraron prospectivamente la fecha y el estado de participación, los resultados mamográficos, las evaluaciones de seguimiento y los desenlaces del cáncer . Segundo, la inéditas de la población (número esperado de BCs en la falta de detección) se obtuvo a partir de la historia natural de modelado que ofrece las mismas características (riesgos) entre el inéditas de la población y proyectado de la población. Por lo tanto, se podría prevenir el sesgo, que resulta de la elección de los grupos de control. En tercer lugar, en nuestro modelo se tuvieron en cuenta la incidencia específica por edad y el tiempo de estancia. En el modelo no homogéneo se utilizaron tasas de transición constantes por partes y se ajustaron los datos mejor que en el modelo homogéneo tradicional con tasas constantes.

Hay algunas limitaciones que pueden haber influido en nuestras estimaciones de sobrediagnóstico. En primer lugar, el modo de detección de los casos de CB podría estar mal clasificado. Por ejemplo, las mujeres nacidas entre 1920 y 1941 podrían haber sido invitadas a por lo menos una ronda de exámenes en el ensayo de Estocolmo. Es posible que los SSD se clasifiquen erróneamente como PSD. Lidbrink et al. se encontró que, en los exámenes de detección organizados en Estocolmo, el tamaño del tumor en las unidades de exámenes de detección que realizaban exámenes de detección prevalentes era similar al de la unidad donde se llevó a cabo el ensayo . La mamografía realizada fuera del programa de detección organizado también podría sesgar nuestros resultados. La tasa de participación en los condados más densamente poblados de Suecia, incluido el condado de Estocolmo, ha sido más baja que en otros condados de Suecia, lo que podría deberse a un mayor acceso a la mamografía privada, en particular durante los primeros años del programa . Los casos de cáncer diagnosticados en el sector privado pueden clasificarse erróneamente como NPs en el programa de detección organizado. El riesgo de progresión a la PC puede estar sobreestimado, lo que lleva a una subestimación del sobrediagnóstico.

En segundo lugar, el sobrediagnóstico resultante de la detección de cánceres progresivos en mujeres que murieron antes de que el cáncer se tornara sintomático no se contó en nuestro estudio. Una posible extensión del modelo es considerar la muerte como un estado separado . Además, en Estocolmo, las tasas de mortalidad por todas las causas en mujeres de 50 a 59 años y de 60 a 69 años entre 1989 y 2014 fueron de 3,2 y 7,98 por cada 1.000 mujeres-año . Por lo tanto, durante un período de estadía de 2,16 años, se podrían esperar 6,91 muertes por cada mil mujeres en esos casos de mama detectados por exámenes de detección progresivos a las edades de 50 a 59 años. En otras palabras, una estimación razonable de sobrediagnóstico debido a la muerte sería de aproximadamente 0,69% para las mujeres de 50 a 59 años. La estimación correspondiente para las mujeres de 60 a 69 años sería del 2,8%, dado un período de estancia de 3,52 años. El valor real será menor después de considerar la diferencia entre el tiempo de entrega y el tiempo de estadía.

En tercer lugar, se deben considerar las suposiciones hechas en el modelado de la historia natural. Asumimos que la sensibilidad de la prueba era constante con el tiempo, la edad y el tipo de CB. Debido a la falta de datos, no fue posible tener en cuenta el efecto de la mejora de los instrumentos de detección, como la mamografía digital. Además, se supuso que los casos falsos negativos se detectaron en la siguiente ronda de selección para simplificar la función de probabilidad. Podría sobreestimar ligeramente la sensibilidad de la prueba. Además, nuestro modelo no homogéneo requiere un cierto tiempo de iniciación en el que se conoce o se puede modelar el estado verdadero . Restringimos el modelo para que el riesgo de CB fuera cero antes de los 40 años. Se realizó un análisis de sensibilidad para verificar este supuesto del modelo. Los resultados fueron similares cuando se asumió que el tiempo de inicio era de 35 o 45 años (no se mostró). Se utilizó la tasa de incidencia promedio del registro de cáncer de Estocolmo para los años 1989-2004 para aproximar la tasa de transición de libre de CB a PCDP progresivo en el grupo de edad de 40 a 49 años. La tasa de incidencia preclínica subyacente puede ser mayor que la tasa de incidencia clínica, ya que la incidencia aumenta con la edad. Esto podría afectar a otras estimaciones de parámetros, especialmente la TSM en mujeres de 40 a 49 años, si la tasa no representa la incidencia de fondo.

En cuarto lugar, un IC más robusto de la estimación de sobrediagnóstico podría calcularse a través del método de arranque. Sin embargo, dado que para la estimación se utilizó el historial individual de exámenes de detección de más de 400.000 mujeres, el procedimiento de estimación llevó mucho tiempo.

Otro problema importante es que la función de verosimilitud puede ser plana y provocar un problema de identificabilidad. Incluso si nuestro modelo se ajustaba bien a los datos, no podemos excluir una especificación errónea del modelo. La progresión genuina de BC podría haber sido simplificada en exceso en nuestro modelo de cuatro estados. Debido a que los datos (censurados) son insuficientes o incompletos, puede ser difícil obtener las estimaciones correctas. Para estimar con éxito otros parámetros y cuantificar aún más el sobrediagnóstico, nuestro modelo se basa en la información de cánceres detectados clínicamente, incluidos los CI y los NPs (que fueron los casos más informativos en el conjunto de datos porque se conoce el tiempo exacto de transición a la PC). Anteriormente, demostramos que una cierta proporción (5-10%) de un grupo sin examen, como los que nunca asistieron, puede estabilizar el modelo . Por lo tanto, la inspección de la función de verosimilitud parece necesaria. Hemos comprobado las condiciones de Karush-Kuhn-Tucker para asegurarnos de que el algoritmo de optimización efectivamente convergiera.

Nuestros hallazgos proporcionan las siguientes ideas para futuras investigaciones. En primer lugar, sería valioso evaluar los efectos del período en el riesgo de CB, el tiempo de estadía y la sensibilidad para investigar cómo la exposición a la THS y la mamografía digital han influido en la frecuencia del sobrediagnóstico. En segundo lugar, es necesario realizar una comparación adicional de las estimaciones de sobrediagnóstico basadas en otros métodos de evaluación, como el método de incidencia acumulada, en el mismo conjunto de datos para proporcionar pruebas más sólidas para que los responsables de la formulación de políticas confirmen aún más los hallazgos .

La frecuencia de sobrediagnóstico en el programa de cribado organizado depende de la proporción latente de casos de CB no progresivos, pero también del programa de cribado, en el que una tasa de participación más alta o una sensibilidad mejorada debido a mejores instrumentos de cribado conducirán a una mayor frecuencia de sobrediagnóstico. Se debe considerar el equilibrio entre el beneficio y el daño de los exámenes de detección y, por lo tanto, será necesario controlar regularmente la reducción de la mortalidad y el sobrediagnóstico .

Deja una respuesta

Tu dirección de correo electrónico no será publicada.