非均質マルチステートモデルによる集団ベースの組織化乳がんスクリーニングプログラムにおける過剰診断: 長期フォローアップと個々のデータを使用したコホート研究

我々は、ストックホルム郡、スウェーデンの50-69女性のマンモグラフィーと人口ベースの組織スクリー 我々は、画面で検出された侵襲的なケースのわずか0.43%が過剰診断されたことがわかった。 一般的なラウンドでの過剰診断の頻度は、その後のラウンドでのそれよりも三倍高かった。 非均質モデルは均質モデルよりもデータをよく適合させることを示した。

過剰診断の頻度の公表された推定値は、スクリーニングプログラムの種類、研究デザイン、対照群の選択、推定方法、およびリードタイムの調整(スクリー スウェーデンのデータに基づく過剰診断は、四つのRctと二つの観測研究で推定されています。

スウェーデンのRCTsに基づく過剰診断の推定

ストックホルム試験では、40,318人の40歳から64歳の女性に対して二つのスクリーニングラウンドが行われ、20,000人のコントロールも試験終了時に一つのスクリーニングラウンドに招待された。 過剰診断の二つの推定値は、ストックホルム試験に基づいて行われました。 Gotzscheはスクリーニング期間のすべてのBCsの相対的な危険の比較によって49%のoverdiagnosisを見つけました。 しかし、がんの早期発見(いわゆるリードタイム問題)による発生率の増加を分離することができないと、過剰診断の過大評価が生じます。 モスは、侵襲性(スクリーニング群および対照群では0.81対0.85/1000人-年)およびすべてのBC累積発生率(スクリーニング群および対照群では0.88対0.91/1000人-年)が15年 対照群も単一の画面に招待されたため、対照群の過剰診断につながる可能性があるため、このアプローチでは過剰診断が過小評価されていた可能性が 組織化されたスクリーニングプログラムのその後のスクリーニングラウンドにおける過剰診断の頻度の我々の調査結果は、インシデントスクリーンの結果として過剰診断の証拠を示さなかったストックホルムの試験でモスの発見と一致していた。

同様の結果が二郡試験とヨーテボリ試験で発見された;-0.02と-0.03すべてのBCsの1000絶対過剰累積発生率あたり二つの試験でスクリーニングされたグループでそれぞれ発見された。 ダッフィー他 均一な四状態モデルを適用して過剰診断を定量化した。 流行とその後の二つのラウンドでの過剰診断の頻度は、二つの郡/ヨーテボリの試験で、それぞれ3.1%/4.2%と0.3%/0.3%でした。 これらの推定値は、当社の推定値に沿ったものであり、過剰診断の低レベルを確認します。 二つの郡の試験の一つの郡からの29年のフォローアップデータを使用して、Yen et al。 さらに、スクリーニングは、対照群と比較して100,000の追加スクリーンが行われたスクリーニング群(リスク比1.00)におけるBCの過剰発生率につながらなかったことを確認した。 侵襲性またはinsitubcに対する過剰診断の証拠は見出されなかった。

Malmö I試験に基づく過剰診断の推定値は、ストップスクリーン設計(対照群の女性はスクリーニングに招待されなかった)と適切なフォローアップ時間のた Zackrisson et al. 試験終了後、15年間のフォローアップ時に招待群と対照群の間の発生率を比較することにより、すべてのBCsで10%、侵襲性BCsで7%をランダム割り当てで推定した。 英国BCパネルは、対照群/招待群のフォローアップ期間全体にわたって診断された癌の数または招待群のスクリーニング期間中に診断された癌/スクリーン検出癌の数など、異なる分母を持つ過剰数を比較することによって推定過剰診断を再計算した。 推定値は11%から29%まで変化した。 Rctは過診断を定量化する良い機会を提供するかもしれないが、現在の組織化されたスクリーニングプログラムの一般化可能性は疑わしいままである。

組織化されたスクリーニングプログラムに基づく過剰診断の推定

Zahl et al. 1971-2000年の間に侵略的なBCの年齢特定の発生をスウェーデンのmammographicスクリーニングの導入の後で増加する発生を量を示すのに使用しました。 彼らは、50-69歳の女性における過剰診断の頻度は45%であったと推定したが、リードタイムは適切に調整されておらず、時間の経過とともに発生率の増加は考慮されなかった。 Jonsson et al. また、組織的スクリーニングを実施した後、11カ国のうち20カ国で過剰診断を定量化するために発生率アプローチを適用しました。 スクリーニング前発生率(スクリーニング開始の15年前)を使用して、2000年までのスクリーニング期間中にスクリーニングがない場合の予想発生率を計算した。 安定した段階では、過剰診断率は、リードタイム調整後、それぞれ54%と21%の50-59と60-69年齢層のために推定されました。 発生率の増加は、新規参入者の間で流行しているスクリーニング効果、傾向の変化につながる危険因子の潜在的な変化などに起因する可能性があるこ しかし,ストックホルム郡の組織的スクリーニングプログラムからのデータは本研究に含まれておらず,事前スクリーニング期間の選択は過剰診断の推定に影響を与えた可能性がある。 したがって、我々の調査結果と比較することは困難であった。

平均滞在時間の推定

40-49、50-59、および60-69(2.60、2.16、および3.52年)の女性のMstの推定値は、以前に報告されたMstよりも低かった二郡試験(2.44、3.70、および4.17年)。 私たちの研究では、Mstが短い理由がいくつかあります。 まず、このモデルの滞在時間は、プログレッシブBCsの滞在時間を表します。 無限の滞在時間を有する非進行性Bcsを分離した。 第二に、ホルモン補充療法(HRT)、BCリスク、および滞在時間との間に関連があることが示されている。 スウェーデンでは、HRTの使用は1990年に始まり増加し、2002年以降に減少し、HRTの使用の大半は50-59年齢層であった。 HRTの使用はductal癌腫より短い滞在の時間がある侵略的なlobular癌腫の危険を高めます。 これは、50-59歳の女性のMSTの推定値が低い理由を説明するかもしれません。 別の説明は、Duffy et al. ランダム割り当てで年齢を使用して、研究の終了時の年齢に関係なく人口を年齢グループに分類し、MSTはこれらのグループについて別々に推定されました。 例えば、無作為に割り当てられた50-59の女性は、試験終了時に57-66歳であり、したがって、研究期間中に平均3-4歳年上であった。 Duffy et al.によって発見された50-59年齢層におけるより長いMSTの推定値。 60-69歳で観察されたより長いMSTに部分的に起因する可能性があります。 対照的に、我々のモデルでは、女性は、彼らが年齢層を介して移動するように、異なる年齢間隔でMSTの推定のための尤度に寄与する可能性があります。

in situ癌に関する懸念

組織化されたスクリーニングプログラムの導入以来、乳管癌in situ癌の発生率は有意に増加している。 この増加は、過剰診断のマーカーであると考えられている。 感度分析は、同じ状態のin situ BCsと侵襲的BCsを組み合わせて過剰診断を推定することによって行われた(追加ファイル1および2)。 51.6非進行性検出されたBCケース9631in situと侵襲的なBCケースの中で見つかった0.54%のoverdiagnosisに対応する(追加ファイル3)がありました。 わずかに高い過剰診断が認められたが,過剰診断の頻度は依然として低かった。 同じような調査結果は女性40-49の6状態モデルによって示され、スクリーン検出されたin situ癌の大半がスクリーニングの不在で臨床的に示したことを示

強みと制限

非均質モデルと大規模なスクリーニングデータに基づく過剰診断の推定には、いくつかの強みがあります。 まず、我々の知る限りでは、これはストックホルム組織スクリーニングプログラムにおける過剰診断の頻度を定量化するために個々のスクリーニング履歴を ほとんどの研究で使用されている集計データは、スクリーニングの実際の暴露を反映することはできません。 ストックホルムのスクリーニングプログラムでは、個々のスクリーニング履歴が最初から収集され、品質チェックされ、定期的にレジスタに保存され 参加の日付と状況、マンモグラフィー結果、フォローアップ評価、および癌転帰は前向きに記録された。 第二に、スクリーニングされていない集団(スクリーニングがない場合のBCsの予想数)は、スクリーニングされていない集団とスクリーニングされた集団との間に同じ特性(リスク)を提供する自然史モデリングから得られた。 対照群の選択に起因するバイアスは、このように防止することができた。 第三に、我々のモデルでは、年齢特異的発生率と滞在時間を考慮した。 区分的に一定の遷移速度を非均質モデルで使用し,一定の速度を持つ従来の均質モデルよりもデータを良好に適合させた。過診断の推定に影響を与えた可能性のあるいくつかの制限があります。

まず、BCケースの検出モードが誤って分類される可能性があります。 例えば、1920年から1941年に生まれた女性は、ストックホルム裁判で少なくとも1つのスクリーニングラウンドに招待された可能性があります。 SsdがPsdに誤分類される可能性があります。 リドブリンク他 ストックホルムの組織的スクリーニングでは、一般的なスクリーニングを行うスクリーニングユニットの腫瘍サイズは、試験が実施されたユニットのものと類似していたことが分かった。 組織化されたスクリーニングプログラムの外で行われるマンモグラフィーはまた私達の結果をバイアスするかもしれません。 ストックホルム郡を含むスウェーデンの人口密度の高い郡の参加率は、スウェーデンの他の郡よりも低く、特にプログラムの最初の年の間に、民間のマンモグラフィへのアクセスが高いためである可能性がある。 民間部門で診断された癌症例は、組織化されたスクリーニングプログラムでNPsとして誤って分類される可能性があります。 CPに進行するリスクは過大評価され、過剰診断の過小評価につながる可能性があります。第二に、癌が症候性になる前に死亡した女性の進行性癌の検出に起因する過剰診断は、我々の研究ではカウントされなかった。 このモデルの可能性のある拡張は、死を別の状態として考えることです。 また、ストックホルムでは、1989年から2014年までの50-59および60-69歳の女性の全死因死亡率は、3.2および7.98女性1000年あたりであった。 したがって、2.16年の滞在時間の間に、6.91千人の女性あたりの死亡は、年齢50-59でそれらの進歩的な画面で検出された乳房のケースで予想されるかもしれ 言い換えれば、死亡による過剰診断の合理的な推定値は、50-59歳の女性の約0.69%であろう。 60歳から69歳までの女性の2.8%は3.52歳である。 リードタイムと滞在時間の差を考慮すると、真の値は低くなります。

第三に、自然史のモデリングで行われた仮定を考慮する必要があります。 試験感度は、BCの時間、年齢、およびタイプにわたって一定であると仮定した。 データが不足しているため、デジタルマンモグラフィーのようなスクリーニングツールの改善の効果は考慮に入れることができませんでした。 さらに,尤度関数の単純化のために,次のスクリーニングラウンドで偽陰性の症例が検出されると仮定した。 それはわずかにテスト感度を過大評価するかもしれません。 さらに,この非均質モデルは,真の状態が知られているかモデル化できる一定の開始時間を必要とする。 BCのリスクが40歳前にゼロになるようにモデルを制限しました。 このモデルの仮定を確認するために感度解析を行った。 開始時間が3 5年または4 5年であると仮定した場合の結果は類似していた(図示せず)。 1989-2004年のストックホルムがん登録からの平均発生率は、40-49年齢層におけるBCの無料から進行性PCDPへの移行率を近似するために使用されました。 発症率は年齢とともに増加するため、基礎となる前臨床発生率は臨床発生率よりも高い可能性がある。 これは、率が背景発生率を表していない場合、他のパラメータの推定値、特に女性40-49のMSTに影響を与える可能性があります。

第四に、過剰診断の推定値のより堅牢なCIは、ブートストラップ法を介して計算することができます。 しかし、400,000人以上の女性のための個々のスクリーニング履歴が推定に使用されたので、推定手順は非常に時間がかかりました。別の重要な問題は、尤度関数が平坦であり、識別可能性の問題につながる可能性があることです。 モデルがデータを適切に適合させたとしても、モデルの指定ミスを排除することはできません。 BCの真の進行は、私たちの四状態モデルで過度に単純化されている可能性があります。 不十分または不完全な(打ち切り)データのために、正しい推定値を取得することは困難である可能性があります。 正常に他のパラメータを推定し、さらに過診断を定量化するために、我々のモデルは、ICsとNPsを含む臨床的に検出された癌からの情報に依存しています(CPへの正確な遷移時間が知られているため、データセットの中で最も有益な症例であった)。 以前、私たちは、ノンアテンダーのように、ノンアテンダーのグループの一定の割合(5-10%)がモデルを安定させることができることを示しました。 したがって,尤度関数の検査が必要であると思われる。 最適化アルゴリズムが実際に収束していることを確認するために,Karush–Kuhn–Tucker条件を調べた。

私たちの調査結果は、将来の研究のために以下の洞察を提供します。 まず、BCリスク、滞在時間、および感度に対する期間の影響を評価して、HRTおよびデジタルマンモグラフィーへの曝露が過剰診断の頻度にどのように影響したかを調査することは価値がある。 第二に、累積発生率法のような他の評価方法に基づく過剰診断推定値のさらなる比較は、政策立案者が発見をさらに確認するためのより強固な証拠を提供するために、同じデータセット内で実施される必要がある。

組織化されたスクリーニングプログラムにおける過剰診断の頻度は、非進行性BC症例の潜在的な割合に依存するだけでなく、より良いスクリーニング スクリーニングの利益と害のバランスを考慮する必要があり、したがって、定期的に死亡率の減少と過剰診断を監視する必要があります。

コメントを残す

メールアドレスが公開されることはありません。