局所進行直腸癌における新補助化学放射線療法に対する病理学的反応の予測:二段階特徴選択とアンサンブル学習を用いて
カテゴリ:公衆衛生・予防医療
公開日:2026年2月19日
タイトル:Predicting pathological response to neoadjuvant chemoradiotherapy in locally advanced rectal cancer with two step feature selection and ensemble learning.
雑誌名:Sci Rep. 2025 Mar 22; 15(1): 9936.
概 要:
この研究は、局所進行直腸癌(LARC)患者における新補助化学放射線療法(nCRT)に対する反応を予測するための効果的なバイオマーカーを特定し、アンサンブル学習に基づく予測モデルを開発することを目的としています。二段階の特徴選択法を用いて、nCRTを受けるLARC患者から安定した逆転遺伝子ペアを導出し、予測バイオマーカーを特定しました。最終的に、32遺伝子ペア署名(32-GPS)が確立され、テストセットでのモデルはAUPRC 0.983、精度0.988を達成しました。検証コホートでもAUPRC 0.785、精度0.898を示し、モデルの強力な性能を示しました。
方 法:
この研究では、LARC患者を対象に二段階の特徴選択法を用いて予測バイオマーカーを特定しました。初期スクリーニングにはMDFS、Boruta、MCFS、VSOLassoBagの4つの方法を使用し、候補特徴セットを形成しました。次に、Permutation Importanceに基づいて特徴をランク付けし、Extreme Gradient Boosting(XGBoost)を用いたIncremental Feature Selection(IFS)で最終的な予測遺伝子ペアを決定しました。アンサンブルモデルBoostForestを用いて予測を行い、SHAPを用いて解釈性を確保しました。
結 果:
最終的に確立された32-GPSは、テストセットでAUPRC 0.983、精度0.988を達成しました。検証コホートではAUPRC 0.785、精度0.898を示し、BoostForestはRandom Forest、Support Vector Machine(SVM)、XGBoostよりも優れた全体的な性能を示しました。32-GPSは、他の2つの特徴セット(lasso-GPSおよび15-SGPS)と比較しても優れた性能を発揮しました。
結 論:
二段階の特徴選択法により、堅牢な予測バイオマーカーが特定され、BoostForestは分類性能と予測能力においてRandom Forest、SVM、XGBoostを上回ることが示されました。この研究は、LARC患者におけるnCRTに対する反応予測の向上に寄与する可能性があります。