大規模言語モデルを用いた救急部門における患者トリアージとガイダンス:マルチメトリック研究
カテゴリ:手術支援
公開日:2026年2月19日
タイトル:Patient Triage and Guidance in Emergency Departments Using Large Language Models: Multimetric Study
雑誌名:J Med Internet Res. 2025 May 15; 27: e71613. doi: 10.2196/71613. Epub 2025 May 15.
概 要:
本研究は、救急部門における患者のトリアージと外来部門の選択におけるGPT-4ベースのChatGPTモデル(GPT-4oおよびGPT-4-Turbo)の精度、一貫性、実現可能性を評価することを目的としています。救急部門は過密、長時間の待機、スタッフ不足に直面しており、効率的なトリアージシステムと正確な部門ガイダンスが重要です。シミュレーションされた患者シナリオを用いて、これらのモデルの性能を検証しました。
方 法:
本研究は2段階の実験的研究で構成されています。第1段階では、1854のシミュレーション患者シナリオを用いて、MEWSに基づくトリアージ精度を評価しました。第2段階では、264のシナリオを用いてGPT-4oの外来部門選択精度を評価しました。データ分析にはウィルコクソン検定、ケンドール相関係数、ロジスティック回帰分析が含まれました。
結 果:
第1段階では、プロンプトエンジニアリング後にChatGPTのトリアージ精度が向上し、GPT-4-Turboは100%の精度を達成しました。第2段階では、GPT-4oは全体のガイダンス精度92.63%を示し、内科での精度が最も高く(93.51%)、一般外科での精度が最も低かった(91.46%)です。
結 論:
ChatGPTは救急部門における患者トリアージと外来ガイダンスを支援する有望な能力を示しました。GPT-4-Turboはプロンプトエンジニアリングへの適応性が高く、GPT-4oは患者対応に必要な感情的応答性が優れています。今後の研究では、実際の実装と限界の克服に向けた探求が求められます。