MEDICINE & AI

翼状片の診断と重症度評価における深層学習:系統的レビューとメタアナリシス

カテゴリ:診断支援・画像解析

公開日:2026年2月19日

タイトル:Deep learning for diagnosing and grading pterygium: A systematic review and meta-analysis. 雑誌名:Comput Biol Med. 2025 Sep; 196(Pt A): 110743. 概 要: 本研究は、翼状片の診断および重症度評価における深層学習(DL)モデルの精度を、臨床専門家と比較して評価する系統的レビューとメタアナリシスです。406件の研究から20件が選定され、合計45,913枚の前眼部写真が分析されました。DLモデルは、翼状片の診断において98.1%の感度と99.1%の特異度を示し、重症度評価では91.2%の感度と92.9%の特異度を達成しました。しかし、外部検証データの欠如や高いバイアスリスクが存在するため、結果の解釈には注意が必要です。 方 法: 1974年から2025年2月までのEMBASE、MEDLINEおよび他の臨床レジストリを系統的に検索し、翼状片の診断または重症度評価に関するAIアルゴリズムの診断性能を調査した臨床研究を対象としました。バイアスリスクはQUADAS-2を用いて評価し、診断精度は二項ランダム効果モデルを用いて分析しました。 結 果: 20件の研究が含まれ、13件は症例対照研究、7件は横断研究でした。DLモデルは、診断および重症度評価において臨床専門家と同等の精度を示しましたが、外部検証データは提供されていませんでした。感度は98.1%、特異度は99.1%であり、重症度評価では感度91.2%、特異度92.9%でした。 結 論: DLモデルは翼状片の診断と重症度評価において高い精度を持ち、臨床専門家と同等の性能を示す可能性があります。しかし、外部検証の欠如や研究デザインの限界により、結果の解釈には慎重さが求められます。今後の研究では、透明性のある報告や外部検証を重視する必要があります。