MEDICINE & AI

医療決定を支援する予測人工知能モデルの性能評価指標に関する概要とガイダンス

カテゴリ:公衆衛生・予防医療

公開日:2026年2月19日

タイトル:Evaluation of performance measures in predictive artificial intelligence models to support medical decisions: overview and guidance. 雑誌名:Lancet Digit Health. 2025 Dec; 7(12): 100916. 概 要: 本論文では、医療実践における予測人工知能(AI)モデルの性能を示すために提案された多くの指標を評価します。適切な性能指標の選択は、医療における予測AIモデルの使用において重要です。性能が不十分なモデルは誤解を招き、患者にとって有害な誤った臨床判断を引き起こす可能性があります。32の性能指標を5つの性能領域(識別、キャリブレーション、全体性能、分類、臨床的有用性)にわたって議論し、特に二項結果の確率を推定するモデルに焦点を当てています。 方 法: 本研究は、予測AIモデルの性能を評価するための32の性能指標を検討したもので、識別、キャリブレーション、全体性能、分類、臨床的有用性の5つの領域に分類されます。選択した性能指標が、正しい確率を用いて計算された場合に期待値が最適化されるかどうか、また統計的性能と意思決定分析性能を適切に考慮しているかを評価しました。 結 果: 17の指標は両方の特性を示し、14は1つの特性を示しました。すべての分類指標は、閾値が0.5または真の有病率と等しい場合を除き、臨床的に関連する決定閾値に対して不適切でした。ADNEXモデルを用いて、これらの指標と特性を具体的に示しました。 結 論: 本研究は、医療における予測AIモデルの性能評価において重要な指標とその特性を明らかにし、受信者動作特性曲線下面積やキャリブレーションプロット、臨床的有用性を示す指標の報告を推奨します。これにより、医療決定の質を向上させることが期待されます。