キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
DataRobot コミュニティ

「予測の説明」についての見方を教えて下さい

1040727
リニアアクチュエータ

「予測の説明」についての見方を教えて下さい

教師フラグ「TRUE」としたにもかかわらずPredictionが低かったものを確認するため、「予測の説明」機能を利用して個別行ごとに閲覧しようとしています。(5つ表示するよう選択)
ただ、ダウンロード後に一見すると、「Explanation Strength」が「+++」となっている項目がほとんど、かつ他のPredictionが高かったものとあまり変わりないように見えており、なぜPredictionが低い結果になったのかが腹落ちしません。

やはり個別行ごとに見るしかないのでしょうか。また、このような事象は往々にしてあり得るものでしょうか。

2件の返信2
NaoyukiMasuda
青色LED

予測全体の分布がFalse寄りの場合によくあるケースかと思われます。

予測の説明は添付の画像(*1)のように、
まず説明対象のデータに対して特徴量の値を変えて予測値を計算します。
そして、その平均値(ベースライン)に対する差分を特徴量の寄与度として算出します。
そのため、予測の平均値が小さいと、寄与度が+に出やすくなります。
ご質問頂いたケースの場合、データのほとんどで、予測値が小さい値(ないしほとんどゼロ)ではないでしょうか?
そうなると、予測値が小さくない(ほとんどゼロでない)レコードは、その中での予測値の大小によらず、寄与度として+が出やすくなります。

なお、このようなケースでは、SHAPベースの予測の説明(*2)を用いると解釈がしやすくなります。
SHAPベースの予測の説明を表示するには、プロジェクト開始前に設定が必要です。
設定の手順は以下です。
データアップロード後、「高度なオプション」⇒「その他」⇒「SHAP値をサポートするモデルのみを含める」


参考
(*1)https://www.datarobot.com/resources/xemp-prediction-explanations/
(*2)https://app.datarobot.com/docs-jp/modeling/investigate/understand/pred-explain/shap-pe.html?#shapキャプチャ.PNG

1040727
リニアアクチュエータ

本当にわかりやすい説明ありがとうございました!まさに「ご質問頂いたケースの場合、データのほとんどで、予測値が小さい値(ないしほとんどゼロ)ではないでしょうか?」に当てはまっておりました。
プロジェクトをコピーの上、SHAPベースでモデルを再作成してみました。これをもって、個別にデータ項目の追加・削除を行いたいと思います。

引続きよろしくお願いいたします!

0 件の賞賛