MEDICINE & AI

アンサンブル深層学習モデルによるリポカリン配列分類の最適化

カテゴリ:公衆衛生・予防医療

公開日:2026年2月19日

タイトル:Optimizing lipocalin sequence classification with ensemble deep learning models 雑誌名:PLoS One. 2025; 20(4): e0319329. 概 要: 本研究では、リポカリン配列の識別と分類を強化するための新しいアンサンブル深層学習フレームワーク「EnsembleDL-Lipo」を提案します。リポカリンは多機能な細胞外タンパク質であり、さまざまな疾患やストレス応答に関与していますが、配列の類似性が低く、分類が困難です。このフレームワークは、畳み込みニューラルネットワーク(CNN)と深層ニューラルネットワーク(DNN)を組み合わせ、PSSM(位置特異的スコア行列)に基づく特徴を用いて多様な配列パターンに対する分類性能を最適化します。モデルは、トレーニングデータセットで97.65%の精度を達成し、独立したテストセットでも95.79%の精度を示しました。これにより、EnsembleDL-Lipoはリポカリン配列の識別において非常に効果的で計算効率の良いツールであることが示されました。 方 法: 本研究は、アンサンブル深層学習モデルを用いたリポカリン配列の分類に関するもので、PSSMに基づく特徴を活用して多数の深層学習モデルを訓練しました。モデルの性能評価には、精度(ACC)、再現率、マシューズ相関係数(MCC)、曲線下面積(AUC)が用いられました。 結 果: EnsembleDL-Lipoは、トレーニングデータセットで97.65%の精度、97.10%の再現率、MCC 0.95、AUC 0.99を達成しました。独立したテストセットでは、95.79%の精度、90.48%の再現率、MCC 0.92、AUC 0.97を示し、モデルの堅牢性が確認されました。 結 論: EnsembleDL-Lipoは、リポカリン配列の識別において優れた性能を発揮し、既存の手法を大きく上回る結果を示しました。このフレームワークは、バイオマーカー発見などの応用において強い可能性を持っています。