項目応答理論を用いたカテゴリカル欠損値の補完手法
カテゴリ:手術支援
公開日:2025年11月11日
タイトル:Using item response theory as a methodology to impute categorical missing values
雑誌名:Sci Rep. 2025 Nov 05; 15(1): 38675.
概 要:
多くのデータセットは部分的または完全な欠損値を抱えており、これがデータに基づくモデルのテストや統計的推論に制限を与えます。本研究では、カテゴリカルデータの欠損値を補完するために項目応答理論(IRT)に基づくアプローチを提案し、k最近傍法(kNN)、多重補完連鎖方程式(MICE)、およびAWSの深層学習手法であるDataWigなど、現在の機械学習分野で使用されているいくつかの手法と比較しました。異なるデータセットに対してこれらの手法を比較分析し、欠損値の再現精度と補完データを用いた予測性能を評価しました。
方 法:
本研究は、カテゴリカルデータの補完においてIRTを用いた手法を評価するため、3つの異なるデータセット(順序、名義、二項カテゴリを含む)を使用しました。データは欠損の割合や欠損データの体系化に応じて変更され、精度評価と予測性能評価の2つの異なるパフォーマンス評価が行われました。
結 果:
提案されたIRTに基づくカテゴリカル補完手法は、現在使用されている多重補完手法と比較して良好な結果を示し、多くの条件下でいくつかの手法を上回る性能を発揮しました。特に、欠損セルのカテゴリ所属を決定するための確率的用語の生成において理論的基盤があるため、IRTは現在のアプローチに対する有効な代替手段を提供します。
結 論:
IRTを用いたカテゴリカル欠損値の補完手法は、既存の手法に対して優れた性能を示し、データ補完の新たなアプローチとしての可能性を持っています。これにより、臨床スコアの計算やモデル構築における欠損データの影響を軽減できることが期待されます。