MEDICINE & AI

SDoH-GPT:大規模言語モデルを用いた健康の社会的決定因子の抽出

カテゴリ:診断支援・画像解析

公開日:2026年1月29日

タイトル:SDoH-GPT: using large language models to extract social determinants of health. 雑誌名:J Am Med Inform Assoc. 2026 Jan 01; 33(1): 67-78. doi: 10.1093/jamia/ocaf094. 概 要: 本研究は、医療ノートから健康の社会的決定因子(SDoH)を抽出するための新しいフレームワーク「SDoH-GPT」を提案します。このフレームワークは、少数ショット学習を活用した大規模言語モデル(LLM)を利用し、従来の労働集約的なアノテーションに依存せず、効率性と汎用性を向上させることを目指しています。SDoH-GPTは、医療ノートからのSDoH抽出を自動化し、コストと時間を大幅に削減することが期待されます。 方 法: SDoH-GPTは、少数ショット学習LLMを用いて医療ノートからSDoHを抽出し、生成されたアノテーションをトレーニングデータセットとして使用するXGBoost分類器を組み合わせたフレームワークです。この独自の組み合わせにより、広範な医療アノテーションや高コストの人間の介入に依存せずにSDoHを抽出することが可能になります。 結 果: 本アプローチは、時間とコストをそれぞれ10倍および20倍削減し、Cohenのカッパで最大0.92の人間アノテーターとの一貫性を示しました。LLMとXGBoostの革新的な組み合わせにより、高精度と計算効率を確保し、常に0.90以上のAUROCスコアを維持しました。 結 論: 本研究の重要な貢献は、LLMとXGBoostの統合により、コスト効率の良い高品質なSDoHアノテーションを可能にした点です。この研究は、SDoHがよりアクセスしやすく、スケーラブルで、将来の医療ソリューションにおいて影響力を持つことを示唆しています。