記事詳細｜デジタルヘルス教育におけるAI駆動の客観的構造化臨床試験生成：3つのGPT-4o構成の比較分析

デジタルヘルス教育におけるAI駆動の客観的構造化臨床試験生成：3つのGPT-4o構成の比較分析

カテゴリ：医学教育

公開日：2026年2月19日

タイトル：AI-Driven Objective Structured Clinical Examination Generation in Digital Health Education: Comparative Analysis of Three GPT-4o Configurations 雑誌名：JMIR Med Educ. 2026 Jan 15; 12: e82116. doi: 10.2196/82116. Epub 2026 Jan 15. 概　要：この研究は、デジタルヘルスにおける客観的構造化臨床試験（OSCE）を生成するための3つのGPT-4o構成を評価することを目的としています。OSCEは医療教育において評価手法として使用されますが、特にデジタルヘルスのような新興分野では、教育的専門知識と投資が必要です。本研究では、標準GPT、パーソナライズされたGPT、シミュレーションエージェントGPTの3つの構成を用いて、24のOSCEステーションを生成し、それぞれの形式遵守と教育内容の質を評価しました。方　法：合計で24のOSCEステーションが8つのデジタルヘルスのトピックにわたって各GPT-4o構成で生成されました。形式遵守は1人の専門家によって評価され、教育内容は2人のデジタルヘルス専門家によって独立して評価されました。統計解析にはKruskal-Wallis検定が使用されました。結　果：シミュレーションエージェントGPTは、形式遵守と内容の質基準のほとんどで最も良い結果を示しました。特に正確性（平均4.47/5、SD 0.28; P=.01）と明確性（平均4.46/5、SD 0.52; P=.004）で高得点を得ました。また、88%（14/16）のユーザビリティを示し、他の構成を上回る評価を受けました。パーソナライズされたGPTは形式遵守が最も低く、標準GPTは明確性と教育的価値で最低得点を記録しました。結　論：構造化されたプロンプティング戦略、特にエージェントのシミュレーションは、LLM生成のOSCEコンテンツの信頼性とユーザビリティを向上させることが示されました。これらの結果は、医療教育における人工知能の使用を支持し、専門家による検証の必要性を確認しています。

「医学教育」の記事一覧へ

MEDICINE & AI

デジタルヘルス教育におけるAI駆動の客観的構造化臨床試験生成：3つのGPT-4o構成の比較分析