アップデートに伴い、特徴量インパクト計算の際にサンプルサイズを調整するボタンが追加された件について質問です。
・サンプルサイズ調整ボタンが出る前まではどれくらいのサイズで計算されていたのでしょうか。
アップデート後は最大10万行などの制約下で調整しているかと思います。
・サンプルサイズ調整でサンプルされたデータはどのように選ばれているのでしょう。(データの上から順に10万行やランダムなど)
解決済! 解決策の投稿を見る。
アップデート前は、マニュアル記載の通りランダム抽出で2,500行となります。
仕様に関しましては、マニュアルに記載(コミュニティの「レファレンス」に一部転載しております)がございますので、ぜひ事前にご確認くださいませ。
特徴量のインパクトは、モデルのトレーニングデータの最大2500行を使用して計算されます。https://community.datarobot.com/t5/リファレンス/特徴量のインパクト/ta-p/3142
補足ですが、今でもデフォルトの挙動は一緒です。(モデルの学習データから最大2500行)
必要に応じて、「サンプルサイズを調整する」を選択して頂くと最大10万行まで確認可能となります。
お二方ご返信ありがとうございます!
助かりました。