チャットボット健康アドバイス研究における大規模言語モデル:系統的レビュー
カテゴリ:手術支援
公開日:2025年10月24日
タイトル:Large Language Models for Chatbot Health Advice Studies: A Systematic Review
雑誌名:JAMA Netw Open. 2025 Feb 03; 8(2): e2457879.
概 要:
本研究は、生成的人工知能(AI)を用いたチャットボットが健康アドバイスを提供する際の報告のばらつきを評価するための系統的レビューを実施しました。7752件の文献を検索し、137件の主要研究を特定しました。これらの研究は、外科(40.1%)、医学(37.2%)、プライマリケア(9.5%)に関するもので、主に治療(66.4%)、診断(43.8%)、疾病予防(21.2%)に焦点を当てていました。ほとんどの研究は、LLMの特性について十分な情報を提供しておらず、倫理的および規制上の考慮も不足していました。
方 法:
MEDLINE、Embase、Web of Scienceを用いて、2023年10月27日までの文献を検索しました。タイトルと要約によるスクリーニングの後、生成的AIチャットボットの臨床精度を評価する主要研究を特定しました。137件の適格研究からデータを抽出しました。
結 果:
137件の研究が含まれ、外科、医学、プライマリケアに関するトピックが調査されました。ほとんどの研究(99.3%)は、閉鎖的なLLMを評価し、そのバージョンを特定する情報が不足していました。研究の多くは、チャットボットの成功したパフォーマンスを主観的に定義し、倫理的および患者安全に関する問題に十分に対処していませんでした。
結 論:
この系統的レビューは、チャットボット健康アドバイス研究の報告品質が不均一であることを示し、CHART報告基準の開発に寄与する可能性があります。LLMの臨床統合に関する倫理的、規制的、患者安全の考慮が重要です。