医学生の臨床パフォーマンスに関する評価報告からの辞書ベースの感情分析の妥当性評価
カテゴリ:医学教育
公開日:2026年2月19日
タイトル:A validity evaluation of lexicon-based sentiment analysis of medical students' clinical performance from in-training evaluation reports.
雑誌名:Med Educ. 2025 Nov 25; doi: 10.1111/medu.70101. Epub 2025 Nov 25.
概 要:
本研究は、医学生の臨床パフォーマンスを評価するために、従来のリッカート尺度に基づく評価に加え、自然言語処理(NLP)の進展を活用して、豊かなナラティブデータを評価に組み込むことを目的としています。具体的には、医学生の臨床パフォーマンスに関する評価報告(ITERs)からの辞書ベースの感情分析の妥当性を評価し、将来的な評価決定に機械的プロセスとして統合することを目指しました。
方 法:
本研究は、Kaneの妥当性フレームワークに基づく混合方法の回顧的導出/検証コホート研究です。パフォーマンス記述子の辞書を作成するために内容分析を行い、G研究を実施し、記述子の陽性尤度比(LR+)を計算しました。一般化を評価するために、クラス内相関係数を計算し、導出コホートと検証コホートの記述子を比較しました。その後、辞書ベースの感情分析を行い、最高パフォーマンス学生(HPS)と最低パフォーマンス学生(LPS)のコホート間で異なるタイプの記述子の数を比較しました。
結 果:
G研究では、86.6%の分散が学生に起因していることが示されました。記述子の特定における評価者間のICCは0.93でした。中立的な記述子の平均数はHPSとLPSで類似していましたが、LPSの否定的記述子の数は高く(11.4(10.8)対HPSの1.4(1.6)、p<0.01、d=1.37)、HPSの肯定的記述子の数は高かった(19(14)対LPSの1.4(1.5)、p<0.001、d=1.86)。
結 論:
臨床業務の忙しい合間に、指導者は医学生についての物語を語る時間を見つけており、これらのナラティブデータは評価ポートフォリオを豊かにします。本研究の妥当性の議論に基づき、ITERsにおける臨床パフォーマンス記述子の辞書ベースの感情分析には役割があり、これらの結果は評価決定に有意義に寄与する可能性があると考えています。