記事詳細｜国家試験におけるマルチモーダルLLMのパフォーマンスが作業療法教育に与える示唆

国家試験におけるマルチモーダルLLMのパフォーマンスが作業療法教育に与える示唆

カテゴリ：医学教育

公開日：2026年2月19日

タイトル：What the performance of multimodal LLMs on a national licensing exam teaches us about occupational therapy education 雑誌名：BMC Med Educ. 2026 Jan 02; 26(1): 180. doi: 10.1186/s12909-025-08542-4. Epub 2026 Jan 02. 概　要：本研究は、作業療法（OT）教育におけるマルチモーダル大規模言語モデル（LLM）の性能を、日本の作業療法士国家試験（JNEOT）において分析し、特に視覚に基づく質問に焦点を当てています。LLMはOT教育に新たな学習と評価の機会を提供しますが、国家試験におけるその能力は未探索でした。研究結果は、OT教育者に対する教育的示唆を提供します。方　法： 2025年のJNEOT（199項目、177のテキストのみの質問と22の視覚に基づく質問）をOpenAI o3、Gemini 2.5、GPT-4.5、Claude 3.7にゼロショット方式で提示しました。公式の解答キーを基準として、テキストのみの質問と視覚に基づく質問、一般的な項目と実践的な項目の正答率を計算しました。CochranのQを用いて差異を検討し、有意な結果にはBonferroni補正を施したMcNemar検定を行いました。結　果：全モデルはテキストベースの質問で合格レベル（82.4-91.0%）を達成しましたが、視覚に基づく項目では著しい低下（50.0-68.2%）を示しました。視覚タスクにおいてモデル間の有意差は見られませんでした。OT特有の10問は全モデルが不正解でした。結　論： LLMはOTの基礎知識を強化するのに効果的ですが、視覚的解釈や文脈的推論には限界があります。教育者にとって、LLMを理論的学習の強化に活用しつつ、反省的かつ体験的な能力開発のためにはOT教育者の指導が必要であることを示唆しています。

「医学教育」の記事一覧へ

MEDICINE & AI

国家試験におけるマルチモーダルLLMのパフォーマンスが作業療法教育に与える示唆