キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
コミュニティラジオ「DataRobot充電中」5月のテーマ「データインジェスト」投稿

特徴量インパクト計算の際のサンプルサイズについて

H.Hori
青色LED

アップデートに伴い、特徴量インパクト計算の際にサンプルサイズを調整するボタンが追加された件について質問です。

・サンプルサイズ調整ボタンが出る前まではどれくらいのサイズで計算されていたのでしょうか。

アップデート後は最大10万行などの制約下で調整しているかと思います。

・サンプルサイズ調整でサンプルされたデータはどのように選ばれているのでしょう。(データの上から順に10万行やランダムなど)

0 件の賞賛
3件の返信3
ManaM
コミュニティチーム
コミュニティチーム

アップデート前は、マニュアル記載の通りランダム抽出で2,500行となります。

仕様に関しましては、マニュアルに記載(コミュニティの「レファレンス」に一部転載しております)がございますので、ぜひ事前にご確認くださいませ。

 

特徴量のインパクトは、モデルのトレーニングデータの最大2500行を使用して計算されます。https://community.datarobot.com/t5/リファレンス/特徴量のインパクト/ta-p/3142

Isao
データサイエンティスト
データサイエンティスト

補足ですが、今でもデフォルトの挙動は一緒です。(モデルの学習データから最大2500行)

必要に応じて、「サンプルサイズを調整する」を選択して頂くと最大10万行まで確認可能となります。

Isao_0-1616457792102.png

 

H.Hori
青色LED

お二方ご返信ありがとうございます!

助かりました。

0 件の賞賛