膵臓腫瘍におけるAI支援の腫瘍ボード意思決定
カテゴリ:手術支援
公開日:2026年3月21日
タイトル:AI-assisted tumor board decision-making in pancreatic oncology
DOI:10.1186/s12911-026-03444-x
概 要:
膵臓癌の治療計画は、腫瘍ボードでの多面的なアプローチが必要です。本研究では、LLaMA 3.3(70b)が新たに診断された膵臓癌患者の腫瘍ボードの意思決定を予測する能力を評価しました。42件の初診例から収集した臨床文書を用い、外科的切除(SURG)、新補助化学療法(NEO)、緩和療法(PALL)の3つの治療オプションのいずれかを予測することを目的としました。複数のプロンプト戦略を評価し、モデルの性能を正確性やF1スコアで測定しました。
方 法:
この研究は、42人の初診膵臓癌患者の臨床文書を用いた評価研究です。LLaMA 3.3(70b)モデルは、腫瘍ボードの決定を予測するために、ゼロショット、進化したゼロショット、Chain-of-Thought(CoT)、少数ショットの4つのプロンプト戦略を使用しました。主要評価指標は、正確性、マイクロおよびマクロ平均F1スコア、カテゴリ別リコールです。
結 果:
進化したゼロショットおよびCoT戦略は、全体の正確性78.6%とマイクロ平均F1スコア0.786を達成しましたが、主に外科的および緩和的治療の正確な分類によるものでした。新補助療法候補の識別には失敗し、リコールは0.00でした。少数ショットプロンプトは新補助症例の検出を改善しましたが、全体の正確性は56.7%に低下しました。LLaMA 3.3(70b)は、明確な外科的または緩和的ケースに対しては高い一致を示しましたが、新補助療法候補の識別において重大な系統的失敗を示しました。
結 論:
現在のLLMは、主要クラスの決定を近似することはできるものの、複雑なシナリオにおいて治癒的治療経路を見逃すリスクがあることが示されました。臨床での考慮には厳格な監視と特定の適応が必要です。