キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

ダウンサンプル後のモデル生成エラー

daiki
青色LED

ダウンサンプリング後のモデル生成にエラーが発生しています。

ダウンサンプリングを行い、全体のデータ件数を10,000件以下にしたのですが、モデル生成においては30,000件のデータが使われておりました。

 

DataRobot側のエラーかと思うのですが、何かしら用意したデータ自体に問題があるのか、ご教示いただければと思います。

daiki_0-1617697912197.png

 

0 件の賞賛
1件の返信1
HajimeO
コミュニティチーム
コミュニティチーム

こんにちは、ROC曲線のページに表示される混同行列の行数は、ダウンサンプリングの有無にかかわらず元のデータセットの行数ベースでシミュレーションができるように調整されています。ダウンサンプルをした場合は、マジョリティクラスの行数に1以上の重みが割り当てられることによって、ダウンサンプル前相当の行数をあらわすようになっています。

今回は、元の行数が約196000行
このモデルは79.97%までトレーニングしていますので、対象行数は 196000*0.7997=156741
ここでは検定データを表示していますので、交差検定がデフォルトの5と想定して、156741/5=31348
ということで、概ね表示されている数字と一致しています。

したがって、これらの数値とエラーとの関連性は見出せないと思います。

まずは、どのようなエラーメッセージでしたでしょうか?

0 件の賞賛