MEDICINE & AI

大規模言語モデルを用いた自動観察医療成果パートナーシップマッピングツールの開発と検証研究

カテゴリ:公衆衛生・予防医療

公開日:2026年2月19日

タイトル:Breaking Digital Health Barriers Through a Large Language Model-Based Tool for Automated Observational Medical Outcomes Partnership Mapping: Development and Validation Study 雑誌名:J Med Internet Res. 2025 May 15; 27: e69004. doi: 10.2196/69004. Epub 2025 May 15. 概 要: 本研究は、臨床試験、電子健康記録、レジストリデータのOMOP(Observational Medical Outcomes Partnership)変換プロセスを自動化するユーザーフレンドリーなツールを開発・検証することを目的としています。多様な臨床データソースの統合には標準化が必要ですが、データ要素をOMOP概念にマッピングするには専門的な技術と時間がかかります。特に小規模な臨床試験や研究では、リソースが不足し、貴重な研究データが孤立してしまうことが多いです。 方 法: GPT-3の埋め込みを使用した3層のセマンティックマッチングシステムを開発し、異種の臨床データをOMOP共通データモデルに変換しました。システムは、入力用語のベクトル埋め込みを生成し、事前計算された語彙埋め込みに対してコサイン類似度を計算し、潜在的なマッチをランク付けします。開発セットとして慢性疼痛およびオピオイド使用障害に関する76のNIH臨床試験共通データ要素を使用し、別の検証セットとしてCOVID-19関連の電子健康記録概念を用いて検証しました。 結 果: システムは、臨床試験共通データ要素のマッピングにおいて、受信者動作特性曲線の面積(AUROC)が0.9975を達成しました。精度は0.92から0.99、再現率は0.88から0.97の範囲でした。実際の応用では、手動での情報技術専門知識を必要としたマッピングを自動化し、研究チームが大規模なデータ共有イニシアティブに参加するための技術的障壁を低減しました。 結 論: 本研究で検証された大規模言語モデルベースのツールは、臨床データをOMOP形式に自動変換し、高い精度を維持します。セマンティックマッチング機能と研究者に優しいインターフェースの組み合わせにより、小規模な研究チームでも広範な情報技術サポートなしにデータの調和が可能となります。これは、臨床研究データの標準化を加速し、NIHのデータエコシステムなどのイニシアティブへの参加を促進することに直接的な影響を与えます。