MEDICINE & AI

乳がんにおける病理学的完全奏効の検出に対する大規模言語モデルの検証

カテゴリ:手術支援

公開日:2026年2月19日

タイトル:Validation of large language models for detecting pathologic complete response in breast cancer using population-based pathology reports. 雑誌名:BMC Med Inform Decis Mak. 2024 Oct 03; 24(1): 283. doi: 10.1186/s12911-024-02677-y. Epub 2024 Oct 03. 概 要: 本研究の主な目的は、大規模言語モデル(LLMs)が複雑な医療文書を理解し処理する能力を評価することです。特に、病理報告における病理学的完全奏効(pCR)の特定に焦点を当てています。このアプローチは、包括的な報告、健康研究、公衆衛生監視の進展に寄与し、患者ケアや乳がん管理戦略の向上を目指しています。 方 法: 本研究では、医療システムの計算環境内で開発された2つの分析パイプラインを使用しました。まず、15種類のトランスフォーマーベースのモデルを用いて病理報告から埋め込みを抽出し、これらの埋め込みにロジスティック回帰を適用してpCRの有無を分類しました。次に、生成事前学習変換器(GPT-2)モデルを微調整し、単純なフィードフォワードニューラルネットワーク(FFNN)層を追加して病理報告からのpCR検出性能を向上させました。 結 果: 2010年から2017年の間にネオアジュバント化学療法(NAC)を受けた351人の女性乳がん患者のコホートにおいて、最適化された方法は感度95.3%(95%CI: 84.0-100.0%)、陽性的中率90.9%(95%CI: 76.5-100.0%)、F1スコア93.0%(95%CI: 83.7-100.0%)を示しました。これらの結果は、従来の機械学習モデルを上回り、臨床病理情報抽出におけるLLMsの可能性を強調しています。 結 論: 本研究は、LLMsがデジタル病理データを解釈・処理する効果を示し、特にNAC後の乳がん患者におけるpCRの特定において優れた性能を発揮することを成功裏に示しました。LLMベースのパイプラインが従来のモデルよりも優れていることは、ナラティブ報告からの重要な臨床データの抽出と分析における大きな可能性を示しています。今後の外部検証が必要であり、これらの方法の信頼性と広範な適用性を確認することが重要です。