MEDICINE & AI

中高年中国人における長期心血管疾患リスク予測のための説明可能な機械学習:ウェブベースのリスク計算機を用いた9年間の縦断コホート研究

カテゴリ:高齢者医療・介護

公開日:2026年3月26日

タイトル:Explainable machine learning for long-term cardiovascular disease risk prediction in Chinese middle-aged and older adults: a 9-year longitudinal cohort study with web-based risk calculator DOI:10.1038/s41598-026-45297-4 概 要: 本研究は、中国における心血管疾患のリスク予測を改善するために、説明可能な機械学習ツールを開発しました。心血管疾患は中国での死亡原因の主要因であり、既存のリスク予測モデルは主に西洋の人口に基づいているため、中国の中高年層には適切に調整されていません。研究では、2011-2020年の中国健康と退職に関する縦断研究(CHARLS)から8,080人の参加者を対象に、心血管疾患の発生を予測するための10種類の機械学習アルゴリズムを比較しました。最適なモデルを特定し、SHAP法を用いて透明性のある解釈を実現しました。 方 法: 本研究は、CHARLSのデータを用いたコホート研究で、参加者は45歳以上の中高年者で、心血管疾患の既往がない人々です。77の候補変数からロジスティック回帰分析により11の予測因子を特定しました。データは訓練セット(5,657人)と検証セット(2,423人)にランダムに分割され、10種類の予測モデルが構築されました。主要評価指標は、受信者動作特性曲線下面積(AUROC)や決定曲線分析を用いて評価されました。 結 果: 訓練コホート内で心血管疾患が1,246人(22.0%)に発生しました。多変量解析により、高血圧(調整オッズ比1.80)、ウエスト周囲径(調整オッズ比1.05)、脂質異常症(調整オッズ比1.42)、肝疾患(調整オッズ比1.60)が主要な独立予測因子として特定されました。10のアルゴリズムの中で、ランダムフォレストが最も優れた性能を示し、検証セットのAUCは0.829でした。SHAP分析では、ウエスト周囲径が最も重要な寄与因子であることが明らかになりました。 結 論: ランダムフォレストモデルは、中国の中高年層における心血管疾患リスクを高精度で予測できることが示されました。このモデルはウェブベースのリスク計算機として実装され、地域社会でのスクリーニングや個別化された予防に寄与する可能性があります。