記事詳細｜大規模言語モデルを用いた甲状腺癌のステージングとリスクレベル分類のための固有表現フレームワークの開発

大規模言語モデルを用いた甲状腺癌のステージングとリスクレベル分類のための固有表現フレームワークの開発

カテゴリ：手術支援

公開日：2026年2月19日

タイトル：Developing a named entity framework for thyroid cancer staging and risk level classification using large language models. 雑誌名：NPJ Digit Med. 2025 Mar 01; 8(1): 134. doi: 10.1038/s41746-025-01528-y. Epub 2025 Mar 01. 概　要：本研究では、甲状腺癌に関する半構造化臨床ノートから情報を抽出するための固有表現（NE）フレームワークを開発し、良性分化型甲状腺癌患者のためのアメリカ癌学会（AJCC）第8版ステージングおよびアメリカ甲状腺学会（ATA）リスクカテゴリを分類するための大規模言語モデル（LLM）の戦略を検討しました。NEフレームワークは、注釈ガイドラインの開発、真実ラベリング、プロンプト手法、評価コードから構成されます。4つのLLM（Mistral-7B-Instruct、Llama-3.1-8B-Instruct、Gemma-2-9B-Instruct、Qwen2.5-7B-Instruct）を用いて情報抽出を行い、専門家による真実と比較しました。50件のTCGA-THCA病理ノートを使用してフレームワークを開発し、289件のTCGA-THCAノートと35件の擬似臨床ケースを用いて検証しました。アンサンブルのような多数決戦略を採用することで、開発セットおよび検証セットの両方でAJCCおよびATAの分類において満足のいく性能を達成しました。このフレームワークとアンサンブル分類器は、甲状腺癌患者のステージおよびリスクカテゴリの分類の効率と精度を最適化しました。方　法：本研究は、甲状腺癌に関する50件のTCGA-THCA病理ノートを使用したフレームワークの開発を行いました。289件のTCGA-THCAノートと35件の擬似臨床ケースを用いて検証を実施しました。情報抽出には4つの大規模言語モデルをオフラインで利用し、専門家による真実と比較しました。主要評価指標は、AJCCおよびATAの分類性能です。結　果：アンサンブルの多数決戦略を用いることで、AJCCおよびATAの分類において開発セットおよび検証セットの両方で満足のいく性能を達成しました。具体的な数値は記載されていませんが、フレームワークは甲状腺癌患者のステージおよびリスクカテゴリの分類の効率と精度を向上させました。結　論：本研究で開発した固有表現フレームワークは、甲状腺癌患者のステージおよびリスクカテゴリの分類において高い効率と精度を示し、臨床現場での応用が期待されます。

「手術支援」の記事一覧へ

MEDICINE & AI

大規模言語モデルを用いた甲状腺癌のステージングとリスクレベル分類のための固有表現フレームワークの開発