自身の理解の確認のために質問させてください。
特徴量の作用の部分依存の確率値を全特徴量で合計すれば予測値になるという事であってるかを確認したいです。
特徴量の作用の部分依存について下記のブログなどで計算の概要などは概ね把握しています。
他の特徴量の数値は元のデータのままで、興味のある特徴量の数値を全て特定の値に変えた時の予測の平均値という理解です。
https://www.datarobot.com/jp/blog/2018-02-15-modelxray/
このブログの結果を例にすると、年収入が40000だと確率値的には19%ぐらいになっていると思います。
同様に、他の特徴量でローン額がXXX万だと部分依存の確率値がYY%等、わかると思いますが、
以下の様に考えて問題ないのでしょうか。
質問1.
年収入40,000でローン額がXXX万の際のデータを予測させた際の
該当モデルの予測値は、19% + YY% になるか?
※他の特徴量も実際にはあるかとは思いますが、一旦、2変数だけで書いています。
あくまで部分依存の確率値は平均値だから上記のようにならないですかね?
むしろ上記の計算式は部分依存の確率を利用するのではなくて水色線の予測値になるのでしょうか。
ちょっとモヤモヤしている部分なので、ご回答いただけると嬉しいです。
特徴量の作用の部分依存について下記のブログなどで計算の概要などは概ね把握しています。他の特徴量の数値は元のデータのままで、興味のある特徴量の数値を全て特定の値に変えた時の予測の平均値という理解です。
年収入 | ローン額 | 貸し倒れ |
10000 | 3000 | 0.1 |
10000 | 3000 | 0.1 |