MEDICINE & AI

大規模言語モデルを用いた中国のオンライン健康教育リソースの自動多層タグ付け:開発と検証研究

カテゴリ:医療現場の業務効率化

公開日:2025年11月19日

タイトル:Automated Multi-Tier Tagging of Chinese Online Health Education Resources Using a Large Language Model: Development and Validation Study 雑誌名:J Med Internet Res. 2025 Nov 18; doi: 10.2196/83219. Epub 2025 Nov 18. 概 要: 本研究は、個々のニーズに合わせた健康メッセージの提供を目指す精密健康促進のために、大規模言語モデル(LLM)を用いた自動タグ付けシステムを開発、展開、検証することを目的としています。デジタル健康リソースライブラリにおける構造化メタデータの欠如が、パーソナライズされたコンテンツ配信を妨げている現状を改善するための基盤を提供します。 方 法: ハイブリッドデファイ法とコーパスマイニング手法を用いて、10の主要タグ、34の二次タグ、90,562の三次タグからなる包括的な三層健康促進分類法を開発しました。Baichuan2-7B LLMをLow-Rank Adaptation(LoRA)で微調整し、初期タグ生成のためのハイブリッド推論パイプラインを構築しました。システムの性能は、1000リソースのテストセットに対する非専門家による手動注釈と比較して評価されました。 結 果: AIと人間の合意は中程度であり(Cohenのカッパ=0.544)、これは非専門家の人間同士の合意(Cohenのカッパ=0.323)よりも高い結果でした。AIが追加したタグは159件(15.9%)であり、専門家による審査では90.0%の精度で正確で関連性があると確認されました。 結 論: 微調整されたLLMをハイブリッドパイプラインに統合することで、健康コンテンツの注釈において強力な補完ツールとして機能することが示されました。この研究は、公共の健康設定における精密健康コミュニケーションを強化するためのAI実装のための堅牢な技術的および方法論的な青写真を提供します。