importance-validationとfeature impactの中身を 知った上で最終的にモデルの解釈を行う際に どのように使い分けられるのでしょうか
importance-validationの算出の際には各アルゴリズムが提供するAPIが利用されますが、この際多くの場合においてはジニ不純度に基づいた計算が行われます。 ジニ不純度は各ノードが受け取ったデータ内でどれだけターゲットが分類されず混ざっているのかを表しており、データがノードを通過した際にそれがどれだけ改善したかという視点でモデルに対する特徴量の重要性を評価します こちらの手法は木型のみに適用可能な手法であり他のタイプのモデルとの比較ができないため、モデルの選択の際に木型のみ利用するといった制限がない場合にはimportance-validationを使うのは有効な手法とはなりません。 一方で、feature impactはすべてのアルゴリズムに対して適用可能な手法となりますので、モデルの選択の際にすべてのアルゴリズムで比較を行うのであればfeature impactが有効となります。