救急科における長時間待機予測の公平性評価:解釈可能な極端勾配ブースティングを用いて
カテゴリ:災害・救急医療
公開日:2025年10月23日
タイトル:Evaluating fairness of machine learning prediction of prolonged wait times in Emergency Department with Interpretable eXtreme gradient boosting
雑誌名:PLOS Digit Health. 2025 Mar; 4(3): e0000751.
概 要:
本研究は、救急科における患者の待機時間を予測するために機械学習(ML)を用い、そのモデルの性能と公平性を評価することを目的としています。成人患者(18歳以上)を対象にした後ろ向き観察研究で、173,856件の救急科訪問が含まれ、待機時間が30分以上の「長時間待機」を定義しました。極端勾配ブースティング(XGBoost)を用いて待機時間を予測し、モデルの性能を精度、再現率、適合率、F1スコア、偽陰性率(FNR)で評価しました。また、SHAPを用いて特徴の重要性を解釈し、性別、人種・民族、保険の有無に基づく公平性を評価しました。
方 法:
本研究は、173,856件の救急科訪問を対象とした後ろ向き観察研究です。患者はトリアージ時に緊急度指数(ESI)レベル3に分類され、長時間待機は30分以上と定義されました。XGBoostを用いて待機時間を予測し、モデルの性能をAUROC(0.81)などで評価しました。公平性は性別、人種・民族、保険の有無に基づいて評価されました。
結 果:
救急科の訪問の約48.43%(84,195件)が長時間待機を示しました。XGBoostモデルは中程度の精度(AUROC=0.81)を示しましたが、性別、民族、保険の有無に基づく不公平が存在しました。特に、女性、ヒスパニック、保険未加入の患者のFNRは、対照群に比べて低い結果が得られました。
結 論:
XGBoostモデルは救急科における長時間待機の予測において受け入れ可能な性能を示しましたが、性別、人種・民族、保険の有無による不公平が見られました。臨床実践におけるMLモデルの有用性を高めるためには、性能評価と公平性評価が重要です。