自動心エコー報告分析のためのプライバシー保護型大規模言語モデルの比較分析
カテゴリ:診断支援・画像解析
公開日:2026年2月19日
タイトル:A comparative analysis of privacy-preserving large language models for automated echocardiography report analysis
雑誌名:J Am Med Inform Assoc. 2025 Jul 01; 32(7): 1120-1129. doi: 10.1093/jamia/ocaf056.
概 要:
本研究は、心エコー報告からの自動データ抽出が弁膜疾患(VHD)の大規模レジストリ作成や臨床監視を促進する可能性を評価しました。オープンソースの大規模言語モデル(LLM)を用い、プロンプト指示と思考の連鎖(CoT)を活用して、人工弁の有無やVHDの重症度を分類しました。2019年の心エコー報告200件をプロンプト最適化に、2023年の1000件を評価に使用しました。
方 法:
本研究は、2019年の心エコー報告200件を用いてプロンプト最適化を行い、2023年の1000件を評価に使用したコホート研究です。5つの指示調整されたLLM(Qwen2.0-72B、Llama3.0-70B、Mixtral8-46.7B、Llama3.0-8B、Phi3.0-3.8B)を使用し、CoTの有無でプロンプト指示に基づいて人工弁の有無とVHDの重症度を分類しました。専門家によるラベル付けと比較して性能を評価しました。
結 果:
CoTプロンプトを用いた場合、Llama3.0-70BとQwen2.0が最高の性能を示し、VHDの重症度で99.1%と98.9%、人工弁の検出で100%と99.9%の精度を達成しました。小型モデルはVHDの重症度で54.1%-85.9%の精度でしたが、人工弁検出では96%以上の高精度を維持しました。CoT推論により、大型モデルの精度が向上しましたが、処理時間は2-25秒から67-154秒に増加しました。
結 論:
本研究は、オープンソースのLLMが自動心エコー報告解釈においてほぼ完璧な性能を示すことを明らかにしました。大規模モデルはプロンプト最適化を通じて優れた精度を達成しましたが、実用化には性能と計算効率のバランスが必要です。