公衆衛生データを用いたHIV発生率予測のための機械学習モデル開発
カテゴリ:公衆衛生・予防医療
公開日:2026年2月19日
タイトル:Development of a Machine Learning Modeling Tool for Predicting HIV Incidence Using Public Health Data From a County in the Southern United States
雑誌名:Clin Infect Dis. 2024 Sep 26; 79(3): 717-726. doi: 10.1093/cid/ciae100.
概 要:
本研究は、南部アメリカのHIV発生率が高い郡からの公衆衛生データを用いて、機械学習(ML)モデルを開発し、HIV発生率を予測することを目的としています。電子医療記録や登録簿を用いた従来のモデルの精度向上に加え、通知が義務付けられた性感染症(STI)の非識別データセットを活用することで、HIV発生率の予測の実現可能性と精度を評価し、公衆衛生介入の向上に寄与することを目指しました。
方 法:
2010年1月から2021年12月までの2つの非識別公衆衛生データセットを分析しました。データ処理と特徴抽出を行い、社会人口統計要因、STI症例、社会的脆弱性指数(SVI)指標を含めました。さまざまなMLモデルを訓練し、精度、適合率、再現率、F1スコアなどの指標を用いてHIV発生率を予測しました。
結 果:
85,224人の個人が含まれ、そのうち2,027人(2.37%)が研究期間中に新たにHIVと診断されました。MLモデルは、男女ともにHIV発生率を高精度で予測することができました。男性においては、STI診断時の年齢、過去のSTI情報、提供者の種類、SVIが重要な特徴として挙げられました。女性では、年齢、民族、過去のSTI情報、全体のSVI、人種が予測に寄与しました。
結 論:
本研究のMLモデルはHIV発生率を高精度で予測できることが示され、公衆衛生データセットを用いたHIV検査や予防のための介入の可能性を示唆しています。これらの結果は有望ですが、実際の公衆衛生応用に向けたさらなる研究が必要です。