機械学習は大規模言語モデルを上回る:進行肝細胞癌における生存予測の多施設研究
カテゴリ:手術支援
公開日:2026年5月1日
タイトル:Machine learning outperforms large language models for survival prediction in advanced hepatocellular carcinoma: a multicenter study.
雑誌名:Sci Rep. 2026 Apr 30; doi: 10.1038/s41598-026-50991-4.
概 要:
進行肝細胞癌(HCC)における正確な予後予測は重要な未解決のニーズです。本研究では、機械学習(ML)モデルと大規模言語モデル(LLM)の予後予測能力を比較しました。1031人のHCC患者を対象に、介入療法と標的治療を受けた患者を分析し、717人を訓練群、314人をテスト群に分けました。年齢、併存疾患、アルブミン-ビリルビングレード、腫瘍負荷、門脈腫瘍血栓、アルファフェトプロテインレベルの7つの変数が重要な予測因子として特定されました。テスト群では、SVMが最も高い性能(AUC = 0.658)を示し、LLMは限られた識別能力(AUC = 0.590-0.591)でした。MLモデルは、患者をリスク群に効果的に分類し、1年生存率に有意な差を示しましたが、LLMによる予測は結果を区別できませんでした。
方 法:
この研究は、多施設の後ろ向き研究で、1031人の進行肝細胞癌患者を対象としました。患者は介入療法と標的治療を受け、717人が訓練群、314人がテスト群にランダムに分けられました。6つのMLアルゴリズムが開発され、2つのLLM(ChatGPT-4oおよびDeepSeek-v3)と比較されました。主要評価指標はAUCで、7つの変数が予測因子として特定されました。
結 果:
テスト群において、SVMが最も高い性能(AUC = 0.658)を示し、次いでXGBoost(AUC = 0.654)でした。LLMは識別能力が限られており(AUC = 0.590-0.591)、MLモデルは患者をリスク群に効果的に分類し、1年生存率に有意な差を示しました。
結 論:
機械学習モデルは、構造化された予後予測において現在の大規模言語モデルを上回り、進行肝細胞癌におけるリスク層別化と臨床意思決定に対してより信頼性のある支援を提供することが示されました。