ダウンサンプリング後のモデル生成にエラーが発生しています。
ダウンサンプリングを行い、全体のデータ件数を10,000件以下にしたのですが、モデル生成においては30,000件のデータが使われておりました。
DataRobot側のエラーかと思うのですが、何かしら用意したデータ自体に問題があるのか、ご教示いただければと思います。
こんにちは、ROC曲線のページに表示される混同行列の行数は、ダウンサンプリングの有無にかかわらず元のデータセットの行数ベースでシミュレーションができるように調整されています。ダウンサンプルをした場合は、マジョリティクラスの行数に1以上の重みが割り当てられることによって、ダウンサンプル前相当の行数をあらわすようになっています。
今回は、元の行数が約196000行
このモデルは79.97%までトレーニングしていますので、対象行数は 196000*0.7997=156741
ここでは検定データを表示していますので、交差検定がデフォルトの5と想定して、156741/5=31348
ということで、概ね表示されている数字と一致しています。
したがって、これらの数値とエラーとの関連性は見出せないと思います。
まずは、どのようなエラーメッセージでしたでしょうか?