大規模言語モデルと若手医師が作成した退院手紙の質の比較:単盲検研究
カテゴリ:医療現場の業務効率化
公開日:2025年10月24日
タイトル:Comparison of the Quality of Discharge Letters Written by Large Language Models and Junior Clinicians: Single-Blinded Study
雑誌名:J Med Internet Res. 2024 Jul 24; 26: e57721. doi: 10.2196/57721. Epub 2024 Jul 24.
概 要:
退院手紙は、専門医とプライマリケア提供者間のケアの継続において重要な役割を果たしますが、作成には時間がかかり、直接的な臨床ケアに比べて優先度が低く、若手医師に任されることが多いです。本研究では、GPT-4が泌尿器科外来からプライマリケア提供者向けに作成した退院手紙の質を評価し、若手医師が作成した手紙と比較しました。
方 法:
5つの一般的な泌尿器科外来ケースに基づく架空の電子記録を作成し、GPT-4に退院手紙を作成させました。若手医師にも同様のケース記録と指示を提供し、GPT-4の出力を評価しました。プライマリケア医師の盲検パネルが標準化された質問票を用いて手紙を評価しました。
結 果:
GPT-4は情報提供において若手医師を上回り(平均4.32 vs 3.70; P=.03)、幻覚の発生はありませんでした。明確さ、協調性、簡潔さ、フォローアップの推奨、全体的な満足度においては統計的に有意な差は見られませんでした。
結 論:
GPT-4が作成した退院手紙は、若手医師が作成したものと同等の質を持ち、幻覚もありませんでした。この研究は、大規模言語モデルが臨床文書作成において有用かつ安全なツールであることを示す概念実証を提供します。