医療コンテキスト強化フレームワークCATIによるUKバイオバンク研究における診断コード割り当て
カテゴリ:診断支援・画像解析
公開日:2026年2月19日
タイトル:CATI: A medical context-enhanced framework for diagnosis code assignment in the UK Biobank study.
雑誌名:Artif Intell Med. 2025 Aug; 166: 103136.
概 要:
本研究は、UKバイオバンクの患者に対して診断コードを割り当てるための医療コンテキスト強化フレームワーク「CATI」を開発しました。診断コードは病気や医療状態の標準コード形式であり、特に一部の患者に対するコードの欠落問題に対処することが重要です。従来の手法は構造化データに依存していましたが、テキスト情報や病気コードの階層構造を活用していませんでした。CATIは、重要な特徴から得られたテキスト詳細と病気の階層を統合し、診断コードの割り当てを改善します。
方 法:
本研究はUKバイオバンクデータに基づくもので、PhecodesおよびICD-10コードを標準病気形式として使用しています。10の情報豊富な特徴を正式名称で表現し、これをテキスト埋め込みとしてCATIに統合しました。BioBERTの事前学習モデルを用いたプロンプトチューニングを通じて実現しました。また、診断コードの階層構造を認識し、隣接する診断コード間でロジットを効果的に伝播させる新しい畳み込み層を開発しました。
結 果:
CATIは、PhecodesおよびICD-10コードに関して、既存の最先端手法を上回る性能を示しました。未見の病気コードに対して平均AUROCが5.16%向上し、トレーニングインスタンスが(1000,10000]の病気コードに対して平均AUPRCが8.68%向上しました。このフレームワークは、下流研究のための明確なコホート形成に寄与し、重要な医療コンテキストを取り入れることで複雑な医療タスクに対処する新たな視点を提供します。
結 論:
CATIは、医療コンテキストを活用した診断コードの割り当てにおいて、既存の手法を超える性能を発揮し、医療研究におけるデータの活用を促進する可能性があります。