データが少ない場合、一般的に機械学習で良いモデルを作ることができません。間違った解釈にならないよう、DataRobotでは一定数サンプルが小さいデータについては、分析ができないようになっています。
2022年12月時点のデータ数に関する製品仕様は下記のようになっています
https://app.datarobot.com/docs-jp/platform/data-sharing/file-types.html
対策としては、大きく2つあります。
このままだと同じデータが2回登場することになり、学習データの中に、検定データと全く同じデータが含まれ、精度を過剰評価してしまう可能性があります。(全く同じデータがある場合、そのまま記憶してしまえば、完全に当てることができます)そのため、重複したデータが同じパーティションに入るように、グループパーティションの設定を行います。グループパーティションの説明はこちらです。https://www.datarobot.com/jp/blog/summary-of-ml-partitioning-part-2/
上記のステップをふむと、DataRobotが回るようになります。なお、繰り返しになりますが、データ少ないことに変わりはないので、その中で分析をする目的を明確にし、取り組んでいただければと思います。