キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
DataRobot コミュニティ

特徴量のインパクトの結果解釈について

Giyu_Tom
NiCdバッテリー

特徴量のインパクトの結果解釈について

各特徴量のインパクトもほかの特徴量の影響を受けていると思います(各特徴量が完全に独立であるとはいえないので)。とすると1つの特徴量のインパクトを正確に測る方法はないのではないかと思うのですが、そのあたりの兼ね合いをどのようにとっているのでしょうか。

0 件の賞賛
1件の返信1
Kei
データサイエンティスト
データサイエンティスト

DataRobotの「特徴量のインパクト」は、「他の特徴量がそのままの値をとりながら、もし該当の特徴量がデタラメだった場合に、検定データに対する予測精度がどの程度低下するか」を相対的に比較したものです。したがって、ご指摘の通り、もし複数の特徴量間に多重共線性が認められれば、特徴量のインパクトは過小評価される可能性があります。というのも多重共線性を持つ特徴量A,Bのうち一方を除いても、もう一方が残っていれば検定データの予測精度があまり低下しないと考えられるからです。 

そのため、特徴量のインパクトで下位に出てきている特徴量を逐次的に削除し、重要な特徴量の1つ1つの影響をより色濃く捉えていくといった方法が有効です。

こちらのブログにその詳細を記載しております。