プライバシーを保護したマルチサイト異種電子健康記録の欠損値補完手法FedIMPUTE
カテゴリ:医学教育
公開日:2025年10月24日
タイトル:FedIMPUTE: Privacy-preserving missing value imputation for multi-site heterogeneous electronic health records.
雑誌名:J Biomed Inform. 2025 May; 165: 104780.
概 要:
本研究では、FedIMPUTEという通信効率の良いフェデレーテッドラーニング(FL)に基づく欠損値補完(MVI)手法を提案します。この手法は、複数のサイトがプライバシーを保護しながら共同で欠損値補完を行うことを可能にし、データ共有の制約や集団の異質性に対処します。各参加サイトでのローカルなMVIを行った後、サイト固有のデータを共有することなく、さまざまなFL戦略を適用してローカルMVIモデルを連携させます。
方 法:
参加サイトでローカルにMVIを実施し、その後、基本的なものから高度なものまでのFL戦略を適用してローカルMVIモデルを連携させます。連携されたモデルは各サイトに配信され、MVIに使用されます。FedIMPUTEの評価は、シミュレーション研究と、実際の電子健康記録(EHR)を用いた緊急治療室(ED)アウトカム予測の実証研究を通じて行われました。
結 果:
シミュレーション研究では、FedIMPUTEが比較したすべてのベースラインMVI手法を上回り、下流の予測性能を向上させ、サイト間のデータの異質性を効果的に処理することが示されました。デューク大学医療システム(DUHS)の3つの病院からのEDデータセットを使用した結果、FedIMPUTEはベンチマークMVI手法の中で最も低い平均二乗誤差(MSE)を達成し、優れた補完精度を示しました。
結 論:
FedIMPUTEは、特に欠損データ率が高くサンプルサイズが小さいサイトにおいて、下流のリスク予測タスクの性能を向上させます。この手法は実装が容易で、サイトが共有する必要があるのは非患者レベルの要約統計のみであり、通信効率も良好です。