MEDICINE & AI

肝脂肪症における人工知能の診断性能と臨床的影響の評価:系統的レビューとメタアナリシス

カテゴリ:医療現場の業務効率化

公開日:2025年11月21日

タイトル:Assessment of the Diagnostic Performance and Clinical Impact of Artificial Intelligence in Hepatic Steatosis: a Systematic Review and Meta-Analysis 雑誌名:J Med Internet Res. 2025 Nov 11; doi: 10.2196/78310. Epub 2025 Nov 11. 概 要: 本研究は、代謝関連脂肪肝疾患(MAFLD)の診断における人工知能(AI)の性能を系統的に評価し、臨床応用の可能性や実装における障壁を探ることを目的としています。肝生検の侵襲性や超音波検査の感度の限界から、AIは医療画像データを用いた肝脂肪症(HS)の自動検出とグレーディングにおいて変革的なツールとして浮上しています。36件の研究が対象となり、AIモデルの診断精度は優れており、感度0.95、特異度0.93、AUC 0.98が示されました。しかし、研究間の異質性が高く、実世界での性能過大評価のリスクが指摘されています。 方 法: PubMed、Cochrane Library、Embase、Web of Science、IEEE Xploreのデータベースを2025年9月24日まで検索し、AIを用いた肝脂肪症の診断に関する研究を対象としました。診断性能指標(感度、特異度、SROC曲線のAUC)を抽出し、メタアナリシスを実施しました。QUADAS-2ツールを用いて研究の方法論的質とバイアスリスクを評価し、異質性はI²統計量やバイバリアットボックスプロットを用いて評価しました。 結 果: 33件の研究(62のコホート)が定量的合成に含まれ、AIモデルの診断精度は感度0.95、特異度0.93、AUC 0.98と優れた結果を示しました。臨床適用性分析では、AIが肝脂肪症の確認と除外に強い可能性を持つことが支持されましたが、研究間の異質性が高いことが確認されました。深層学習モデルは従来の機械学習アプローチよりも優れた性能を示しました。 結 論: AIは肝脂肪症の非侵襲的スクリーニングと評価において顕著な可能性を示していますが、臨床翻訳は性能の変動、外部検証の不足、データプライバシーやワークフロー統合といった実用的な障壁によって制限されています。今後の研究では、前向き多施設試験や標準化された開発パイプライン、堅牢な外部検証が重要です。このレビューの革新点は、単一モダリティ評価を超えた証拠を統合する統一的な分析フレームワークを確立したことです。