MEDICINE & AI

台湾国家薬剤師免許試験におけるChatGPT-3.5とChatGPT-4の性能:比較評価研究

カテゴリ:医学教育

公開日:2026年2月19日

タイトル:Performance of ChatGPT-3.5 and ChatGPT-4 in the Taiwan National Pharmacist Licensing Examination: Comparative Evaluation Study 雑誌名:JMIR Med Educ. 2025 Jan 17; 11: e56850. doi: 10.2196/56850. Epub 2025 Jan 17. 概 要: 本研究は、台湾国家薬剤師免許試験におけるGPT-3.5とGPT-4の有効性を検証し、臨床薬学および教育における応用可能性を探ることを目的としています。GPT-4は、基本科目においてGPT-3.5を大きく上回る性能を示しましたが、臨床科目ではわずかな差異が見られました。今後の研究では、プロンプトの改善や医療データベースの統合が求められます。 方 法: 台湾の薬剤師試験は基本科目と臨床科目の2段階で構成されています。本研究では、試験問題を手動でGPT-3.5およびGPT-4に入力し、その回答を記録しました。分析は、回答精度の評価、問題タイプの分類、計算問題と状況問題におけるモデルの性能比較を含み、Microsoft ExcelおよびRソフトウェアを使用しました。 結 果: GPT-4は72.9%の正答率を達成し、GPT-3.5の59.1%を大きく上回りました(P<.001)。基本科目ではGPT-4が73.4%に対し、GPT-3.5は53.2%でした(P<.001)。臨床科目ではわずかな差異があり、特に計算問題と状況問題においてGPT-4が優れた性能を示しました。 結 論: GPT-4は台湾国家薬剤師免許試験においてGPT-3.5を上回る性能を示し、特に基本科目での有用性が確認されました。臨床実践や薬学教育への応用の可能性はあるものの、限界もあるため注意が必要です。今後は、プロンプトの改善や学生の能力をより適切に評価する問題設計が求められます。