wykorzystaliśmy niejednorodny model wielostanowy do oszacowania częstotliwości nadmiernej diagnozy na podstawie oczekiwanej liczby nie postępujących BCs wśród wykrytych przez ekran przypadków raka w zorganizowanym programie badań przesiewowych opartych na populacji z mammografią u kobiet w wieku 50-69 lat w hrabstwie Sztokholmskim w Szwecji. Okazało się, że tylko 0,43% wykrytych przez ekran przypadków inwazyjnych zostało zbytnio zdiagnozowanych. Częstotliwość nadmiernej diagnozy w przeważającej rundzie była trzykrotnie wyższa niż w kolejnych rundach. Pokazaliśmy, że model niejednorodny lepiej pasował do danych niż model jednorodny.
opublikowane szacunki częstotliwości nadmiernej diagnozy różnią się ze względu na rodzaj programu przesiewowego, projekt badania, wybór grupy kontrolnej, metodę szacowania i dostosowanie do czasu realizacji (Czas, O który badania przesiewowe przyspieszają diagnozę w porównaniu z brakiem badań przesiewowych) . Nadmierna diagnoza na podstawie Szwedzkich danych została oszacowana w czterech badaniach RCT i dwóch badaniach obserwacyjnych.
oszacowanie nadmiernej diagnozy na podstawie Szwedzkich RCTs
w badaniu w Sztokholmie przeprowadzono dwie rundy przesiewowe dla 40 318 kobiet w wieku od 40 do 64 lat, a na koniec badania zaproszono 20 000 osób kontrolnych. Na podstawie procesu Sztokholmskiego dokonano dwóch szacunków dotyczących nadmiernej diagnozy. Gotzsche stwierdził 49% nadmierną diagnozę, porównując względne ryzyko wszystkich BCs w okresie badań przesiewowych . Jednak brak oddzielenia rosnącej zachorowalności z powodu wcześniejszego wykrycia raka (tzw. problem lead-time) skutkuje zawyżeniem diagnozy. Moss stwierdził, że inwazyjne (0,81 w porównaniu do 0,85 na 1000 osobolat w badaniach przesiewowych i w grupach kontrolnych) i wszystkie skumulowane współczynniki występowania BC (0,88 w porównaniu do 0,91 na 1000 osobolat w badaniach przesiewowych i grupach kontrolnych) były podobne w dwóch grupach w ciągu 15 lat obserwacji . Należy zauważyć, że ponieważ grupa kontrolna została również zaproszona do jednego ekranu, co może prowadzić do pewnej przesadnej diagnozy w grupie kontrolnej, przesadna diagnoza prawdopodobnie była niedoceniana w tym podejściu. Nasze ustalenia dotyczące częstotliwości nadmiernej diagnozy w kolejnych rundach zorganizowanego programu przesiewowego były zgodne z ustaleniami Moss w procesie Sztokholmskim, które nie wykazały nadmiernej diagnozy w wyniku ekranów incydentów .
podobne wyniki uzyskano w badaniu prowadzonym w dwóch okręgach i w badaniu w Göteborgu; odpowiednio -0, 02 i -0, 03 na 1000 bezwzględnych nadmiernych skumulowanych przypadków wszystkich BCs stwierdzono w grupie kontrolnej w dwóch badaniach . Duffy et al. zastosował jednorodny model czterostanowy do ilościowego określenia nadmiernej diagnozy . Częstość występowania nadmiernej diagnozy w powszechnym i dwóch kolejnych rundach wynosiła odpowiednio 3,1%/4,2% i 0,3%/0,3% w badaniach prowadzonych w dwóch okręgach/Göteborgu. Szacunki te są zgodne z naszymi szacunkami i potwierdzają niski poziom nadmiernej diagnozy. Korzystając z 29-letnich danych kontrolnych z jednego powiatu w badaniu dwóch hrabstw, Yen et al. ponadto potwierdzono, że badania przesiewowe nie prowadziły do zwiększenia częstości występowania BC w grupie kontrolnej (współczynnik ryzyka 1,00), w której przeprowadzono 100 000 dodatkowych badań przesiewowych w porównaniu z grupą kontrolną. Nie znaleziono dowodów na nadmierną diagnozę inwazyjną lub in situ BC .
szacunki dotyczące nadmiernej diagnozy oparte na badaniu w Malmö I zostały uznane za wiarygodne ze względu na projekt ekranu zatrzymania (kobiety w grupie kontrolnej nigdy nie zostały zaproszone do badań przesiewowych) i odpowiedni czas obserwacji . Zackrisson et al. oszacowano częstość występowania nadmiernej diagnozy na 10% dla wszystkich BCs i 7% dla inwazyjnych BCs u kobiet w wieku od 55 do 69 lat przy przydzielaniu losowym, porównując częstość występowania między grupami zaproszonymi i kontrolnymi po 15 latach obserwacji po zakończeniu badania . Panel Zjednoczonego Królestwa BC ponownie obliczył szacowaną nadmierną diagnozę, porównując nadmiar liczb z różnymi mianownikami, takimi jak liczba nowotworów zdiagnozowanych w całym okresie obserwacji w grupie kontrolnej/grupie zaproszonej lub liczba nowotworów wykrytych przez ekran zdiagnozowanych w okresie badań przesiewowych w grupie zaproszonej . Szacunki wahały się od 11% do 29%. Chociaż RCTs może stanowić dobrą okazję do ilościowego określenia nadmiernej diagnozy, uogólnienie obecnego zorganizowanego programu badań przesiewowych pozostaje wątpliwe.
oszacowanie nadmiernej diagnozy na podstawie zorganizowanych programów przesiewowych
Zahl et al. zastosował specyficzną dla wieku częstość występowania inwazyjnego BC w latach 1971-2000 do określenia ilościowego rosnącej częstości występowania po wprowadzeniu badań przesiewowych mammograficznych w Szwecji . Oszacowali, że częstość występowania nadmiernej diagnozy u kobiet w wieku 50-69 lat wynosiła 45%; jednak czas oczekiwania nie został odpowiednio dostosowany i nie uwzględniono wzrostu częstości występowania w czasie. Jonsson et al. zastosowano również podejście do wskaźnika częstości występowania w celu ilościowego określenia nadmiernej diagnozy w 11 z 20 krajów po wdrożeniu zorganizowanych badań przesiewowych . Częstość występowania przed badaniem przesiewowym (15 lat przed rozpoczęciem badania przesiewowego) została wykorzystana do obliczenia oczekiwanej częstości występowania w przypadku braku badania przesiewowego w okresie badania przesiewowego do roku 2000. W fazie stabilnej wskaźniki nadmiernej diagnozy oszacowano na 54% i 21% odpowiednio dla grup wiekowych 50-59 i 60-69, po dostosowaniu czasu realizacji. Należy zauważyć, że zwiększona częstość występowania może wynikać z rozpowszechnionego efektu przesiewowego wśród nowo przybyłych, potencjalnych zmian czynników ryzyka prowadzących do zmieniających się trendów i tak dalej; dlatego nie należy jej przypisywać całkowicie nadmiernej diagnozie . Jednak dane z zorganizowanego programu badań przesiewowych w okręgu Sztokholmskim nie zostały uwzględnione w tym badaniu, a wybór okresu wstępnego badania przesiewowego mógł mieć wpływ na oszacowanie nadmiernej diagnozy . Dlatego trudno było je porównać z naszymi ustaleniami.
Szacowanie średniego czasu przebywania
nasze szacunki MSTs dla kobiet w wieku 40-49 lat, 50-59 lat i 60-69 lat (2,60, 2,16 i 3,52 lat) były niższe niż wcześniej zgłaszane MSTs w badaniu prowadzonym w dwóch okręgach (2,44, 3,70 i 4,17 lat) . Istnieje kilka przyczyn krótszych MST w naszym badaniu. Po pierwsze, czas przebywania w naszym modelu reprezentuje czas przebywania w postępowym BCs. Nierozstrzygnięte BC posiadające nieskończony czas przebywania zostały rozdzielone. Po drugie, wykazano, że istnieje związek między hormonalną terapią zastępczą (HTZ), ryzykiem wystąpienia BC i czasem przebywania . W Szwecji stosowanie HTZ zwiększyło się od 1990 r .i zmniejszyło się po 2002 r., a większość stosowania HTZ przypadała na grupę wiekową 50-59 lat. Stosowanie HTZ zwiększa ryzyko inwazyjnego raka płata, który ma krótszy czas przebywania niż rak przewodowy . To może wyjaśniać, dlaczego mamy niższe szacunki MST u kobiet w wieku 50-59 lat. Innym wyjaśnieniem może być to, że Duffy et al. wykorzystano wiek przyporządkowany losowo do klasyfikacji populacji na grupy wiekowe, niezależnie od tego, ile mieli lat na koniec badania, a MST oszacowano oddzielnie dla tych grup. Na przykład, kobiety w wieku 50-59 lat przyporządkowane losowo były w wieku 57-66 lat pod koniec badania, a zatem były średnio o 3-4 lata starsze w okresie badania. Oszacowanie dłuższego MST w grupie wiekowej 50-59 znalezione przez Duffy et al. może być częściowo przypisany dłuższemu MST obserwowanemu w wieku 60-69 lat. W przeciwieństwie do tego, w naszym modelu, kobieta może przyczynić się do prawdopodobieństwa oszacowania MST w różnych przedziałach wiekowych, jak przejść przez grupy wiekowe.
obawy związane z nowotworami in situ
częstość występowania raka przewodowego raka in situ znacznie wzrosła od czasu wprowadzenia zorganizowanego programu badań przesiewowych . Wzrost ten został uznany za marker nadmiernej diagnozy . Analizę wrażliwości przeprowadzono łącząc in situ i inwazyjne BCs w tym samym stanie w celu oszacowania nadmiernej diagnozy (dodatkowe pliki 1 i 2). Wśród 9631 przypadków in situ i inwazyjnych przypadków BC stwierdzono 51,6 nie progresywnych przypadków BC, co odpowiada 0,54% nadmiernej diagnozy (dodatkowy plik 3). Chociaż stwierdzono nieco wyższą nadmierną diagnozę, częstość występowania nadmiernej diagnozy była nadal niska. Podobne wyniki wykazano w modelu sześciostanowiskowym u kobiet w wieku 40-49 lat, co sugeruje, że większość nowotworów in situ wykrytych w badaniach przesiewowych wykazywałaby się klinicznie bez badań przesiewowych .
mocne strony i ograniczenia
nasze oszacowanie nadmiernej diagnozy na podstawie niejednorodnego modelu i danych przesiewowych na dużą skalę ma kilka mocnych stron. Po pierwsze, zgodnie z naszą najlepszą wiedzą, jest to pierwsze badanie z wykorzystaniem indywidualnych historii badań przesiewowych do ilościowego określenia częstotliwości nadmiernej diagnozy w zorganizowanym programie badań przesiewowych w Sztokholmie. Zagregowane dane wykorzystywane w większości badań nie mogą odzwierciedlać rzeczywistej ekspozycji na badania przesiewowe. W sztokholmskim programie badań przesiewowych od samego początku zbierano indywidualne historie badań przesiewowych, sprawdzano jakość i regularnie zapisywano je w rejestrze. Rejestrowano prospektywnie datę i status uczestnictwa, wyniki mammograficzne, oceny kontrolne i wyniki leczenia nowotworowego . Po drugie, populacja nieekranowana (przewidywana liczba BCs w przypadku braku badań przesiewowych) została uzyskana na podstawie modelowania Historii Naturalnej, które zapewnia te same cechy (ryzyko) między populacją nieekranowaną a populacją poddaną badaniu przesiewowemu. W ten sposób można było zapobiec uprzedzeniom wynikającym z wyboru grup kontrolnych. Po trzecie, w naszym modelu uwzględniono częstość występowania i czas przebywania. W modelu niejednorodnym zastosowano stałe współczynniki przejścia w częściach i dopasowano dane lepiej niż tradycyjny model jednorodny ze stałymi współczynnikami.
istnieją pewne ograniczenia, które mogły wpłynąć na nasze szacunki dotyczące nadmiernej diagnozy. Po pierwsze, Tryb wykrywania przypadków BC może być błędnie klasyfikowany. Na przykład kobiety urodzone w latach 1920-1941 mogły zostać zaproszone do co najmniej jednej rundy przesiewowej w procesie Sztokholmskim. Dyski SSD mogą być błędnie klasyfikowane jako dyski PSD. Lidbrink i in. stwierdzono, że w zorganizowanym badaniu przesiewowym w Sztokholmie rozmiar guza w jednostkach przesiewowych wykonujących badania przesiewowe był podobny do tego w jednostce, w której przeprowadzono badanie . Mammografia wykonywana poza zorganizowanym programem badań przesiewowych może również wpłynąć negatywnie na nasze wyniki. Wskaźnik uczestnictwa w najgęściej zaludnionych powiatach Szwecji, w tym w okręgu Sztokholmskim, był niższy niż w innych powiatach Szwecji, co może wynikać z wyższego dostępu do prywatnej mammografii, zwłaszcza w pierwszych latach programu . Przypadki raka zdiagnozowane w sektorze prywatnym mogą być błędnie zaklasyfikowane jako NPs w zorganizowanym programie badań przesiewowych. Ryzyko przejścia do CP może być przeszacowane, co prowadzi do niedoszacowania nadmiernej diagnozy.
Po drugie, w naszym badaniu nie uwzględniono nadmiernej diagnozy wynikającej z wykrycia postępujących nowotworów u kobiet, które zmarły przed wystąpieniem objawów raka. Możliwym rozszerzeniem modelu jest uznanie śmierci za odrębny stan . Poza tym, w Sztokholmie, wszystkie przyczyny śmiertelności u kobiet 50-59 i 60-69 od roku 1989 do 2014 wynosiły 3,2 i 7,98 na 1000 kobiet-lat. Tak więc, w okresie pobytu trwającym 2,16 lat, można się spodziewać 6,91 zgonów na tysiąc kobiet w tych progresywnie wykrytych przypadkach piersi w wieku 50-59 lat. Innymi słowy, rozsądne oszacowanie nadmiernej diagnozy spowodowanej śmiercią wyniosłoby około 0,69% dla kobiet w wieku 50-59 lat. Odpowiednie szacunki dla kobiet w wieku 60-69 lat wyniosłyby 2,8%, biorąc pod uwagę 3,52-letni okres pobytu. Prawdziwa wartość będzie niższa po rozważeniu różnicy między czasem realizacji a czasem pobytu.
Po trzecie, należy wziąć pod uwagę założenia przyjęte w modelowaniu Historii Naturalnej. Założyliśmy, że czułość testu jest stała w czasie, wieku i rodzaju BC. Ze względu na brak danych nie można było uwzględnić efektu poprawy narzędzi przesiewowych, takich jak mammografia cyfrowa. Ponadto założono, że przypadki fałszywie ujemne zostaną wykryte w następnej rundzie przesiewowej w celu uproszczenia funkcji prawdopodobieństwa. Może nieco przecenić czułość testu. Co więcej, nasz niejednorodny model wymaga pewnego czasu inicjacji, w którym prawdziwy stan jest znany lub może być modelowany . Ograniczyliśmy model tak, że ryzyko BC było zerowe przed ukończeniem 40 lat. W celu sprawdzenia tego założenia modelu przeprowadzono analizę wrażliwości. Wyniki były podobne, gdy zakładano, że czas rozpoczęcia leczenia wynosi 35 lub 45 lat (nie wykazano). Średni wskaźnik zachorowalności ze Sztokholmskiego Rejestru Nowotworów w latach 1989-2004 został wykorzystany do przybliżenia wskaźnika przejścia z wolnego od BC do progresywnego PCDP w grupie wiekowej 40-49 lat. Podstawowy przedkliniczny wskaźnik częstości występowania może być wyższy niż wskaźnik kliniczny, ponieważ częstość wzrasta wraz z wiekiem. Może to mieć wpływ na inne szacunki parametrów, zwłaszcza MST u kobiet w wieku 40-49 lat, jeśli częstość nie odzwierciedla częstości występowania w tle.
Po czwarte, bardziej solidny CI oszacowania nadmiernej diagnozy można obliczyć za pomocą metody bootstrapping. Ponieważ jednak do oszacowania wykorzystano indywidualną historię badań przesiewowych dla ponad 400 000 kobiet, procedura szacowania była bardzo czasochłonna.
kolejną ważną kwestią jest to, że funkcja prawdopodobieństwa może być płaska i prowadzić do problemu identyfikowalności. Nawet jeśli nasz model dobrze pasował do danych,nie możemy wykluczyć pominięcia modelu. Prawdziwy postęp BC mógł być zbyt uproszczony w naszym modelu czterech państw. Ze względu na niewystarczające lub niekompletne (ocenzurowane) dane, może być trudno uzyskać prawidłowe szacunki. Aby skutecznie oszacować inne parametry i dodatkowo obliczyć nadmierną diagnozę, nasz model opiera się na informacjach z klinicznie wykrytych nowotworów, w tym ICs i NPs (które były najbardziej pouczającymi przypadkami w zbiorze danych, ponieważ dokładny czas przejścia do CP jest znany). Wcześniej pokazaliśmy, że pewna proporcja (5-10%) nieosłoniętej grupy, jak nigdy-attenders, może ustabilizować model . Dlatego też kontrola funkcji prawdopodobieństwa wydaje się konieczna. Sprawdziliśmy Warunki Karusha-Kuhna-Tuckera, aby upewnić się, że algorytm optymalizacji rzeczywiście się zbiegł.
nasze wyniki dostarczają następujących spostrzeżeń dla przyszłych badań. Po pierwsze, warto byłoby ocenić wpływ okresu na ryzyko BC, czas przebywania i wrażliwość w celu zbadania, w jaki sposób ekspozycja na HTZ i mammografię cyfrową wpłynęła na częstotliwość nadmiernej diagnozy. Po drugie, należy przeprowadzić dalsze porównanie szacunków dotyczących nadmiernej diagnozy opartych na innych metodach oceny, takich jak metoda skumulowanej częstości występowania, w tym samym zbiorze danych, aby zapewnić bardziej solidne dowody dla decydentów politycznych w celu dalszego potwierdzenia ustaleń .
częstotliwość nadmiernej diagnozy w zorganizowanym programie badań przesiewowych zależy od ukrytego odsetka nierozstrzygniętych przypadków BC, ale także od programu badań przesiewowych, w którym wyższy wskaźnik uczestnictwa lub lepsza czułość dzięki lepszym narzędziom do badań przesiewowych doprowadzi do wyższej częstotliwości nadmiernej diagnozy. Należy rozważyć równowagę między korzyściami a szkodami wynikającymi z badań przesiewowych i w związku z tym konieczne będzie regularne monitorowanie zmniejszenia śmiertelności i nadmiernej diagnozy .