MEDICINE & AI

デジタルヘルス教育におけるAI駆動の客観的構造化臨床試験生成:3つのGPT-4o構成の比較分析

カテゴリ:医学教育

公開日:2026年2月19日

タイトル:AI-Driven Objective Structured Clinical Examination Generation in Digital Health Education: Comparative Analysis of Three GPT-4o Configurations 雑誌名:JMIR Med Educ. 2026 Jan 15; 12: e82116. doi: 10.2196/82116. Epub 2026 Jan 15. 概 要: この研究は、デジタルヘルスにおける客観的構造化臨床試験(OSCE)を生成するための3つのGPT-4o構成を評価することを目的としています。OSCEは医療教育において評価手法として使用されますが、特にデジタルヘルスのような新興分野では、教育的専門知識と投資が必要です。本研究では、標準GPT、パーソナライズされたGPT、シミュレーションエージェントGPTの3つの構成を用いて、24のOSCEステーションを生成し、それぞれの形式遵守と教育内容の質を評価しました。 方 法: 合計で24のOSCEステーションが8つのデジタルヘルスのトピックにわたって各GPT-4o構成で生成されました。形式遵守は1人の専門家によって評価され、教育内容は2人のデジタルヘルス専門家によって独立して評価されました。統計解析にはKruskal-Wallis検定が使用されました。 結 果: シミュレーションエージェントGPTは、形式遵守と内容の質基準のほとんどで最も良い結果を示しました。特に正確性(平均4.47/5、SD 0.28; P=.01)と明確性(平均4.46/5、SD 0.52; P=.004)で高得点を得ました。また、88%(14/16)のユーザビリティを示し、他の構成を上回る評価を受けました。パーソナライズされたGPTは形式遵守が最も低く、標準GPTは明確性と教育的価値で最低得点を記録しました。 結 論: 構造化されたプロンプティング戦略、特にエージェントのシミュレーションは、LLM生成のOSCEコンテンツの信頼性とユーザビリティを向上させることが示されました。これらの結果は、医療教育における人工知能の使用を支持し、専門家による検証の必要性を確認しています。