MEDICINE & AI

ChatGPTの医学教育における適性評価:呼吸器学試験における3年生医学生との比較分析

カテゴリ:医学教育

公開日:2026年2月19日

タイトル:Appraisal of ChatGPT's Aptitude for Medical Education: Comparative Analysis With Third-Year Medical Students in a Pulmonology Examination 雑誌名:JMIR Med Educ. 2024 Jul 23; 10: e52818. doi: 10.2196/52818. Epub 2024 Jul 23. 概 要: 本研究は、呼吸器学試験におけるChatGPTのパフォーマンスを評価し、3年生医学生との比較分析を行うことを目的としています。ChatGPTの進化は医学教育において注目を集めており、特にその能力を評価することが重要です。244人の3年生医学生と、コンテキストなし(V1)およびコンテキストあり(V2)の2つの会話セットでChatGPT-3.5を比較しました。 方 法: 本研究は横断的研究で、244人のフランス語で実施された2020年の呼吸器学試験を受けた3年生医学生と、同じ質問セットを受けたChatGPTの2つのグループを比較しました。ChatGPTは、V1とV2の2つの異なる条件で評価されました。 結 果: V1は放射線学、微生物学、胸部外科で優れた能力を示しましたが、病理学、薬理学、臨床肺病学では課題がありました。一方、V2はすべての質問カテゴリーでより正確な回答を提供し、特に構造化されたオープンエンドの質問において優れたパフォーマンスを示しました。V1は試験に合格できませんでしたが、V2は139人(62.1%)の医学生を上回る結果を出しました。 結 論: ChatGPTは包括的なウェブベースのデータセットにアクセスできますが、そのパフォーマンスは平均的な医学生に近いことが示されました。結果は質問形式、項目の複雑さ、文脈のニュアンスによって影響を受け、情報の統合や高度な分析能力、臨床判断を必要とする医療の文脈では課題があることが明らかになりました。