DataRobotでモデリング後、予測用データをアップロードして予測値を取得したいと考えています。
以下手順で予測用データをアップロードしたのですが、エラーになってしまいます。
1. リーダーボードからモデルを選択
2. 予測→ 予測を作成 を選択
3. データをドラッグ&ドロップでアップロードすると80%まではプログレスバーが進むのですが、下記のエラーが出ました。
===
データセットに含めることができる名称未設定列は1つだけです。2つ目の名称未設定列がデータセットの位置4で見つかりました。. ご質問がございましたら次の情報を含めてDataRobotサポートにコンタクトしてください:
===
エラー内容から察するに列名が原因かと思ったのですが、列名は学習データと一致しています。
学習、予測データはAWSで作成したもので、encodingはcp932にしています。
どのように対処すればよろしいでしょうか? よろしくお願い致します。
DataRobotでテーブルデータを入れて頂いた際、列名が設定されていない列に対しては仮の名前を当てはめますが、2列以上名前が入っていない列が入っている場合には表示されたようなエラーとなります。
基本的にはDataRobotでモデリングを行う際には使用する全ての列に一意の列名を付けて頂くことを推奨しております。投入頂いたデータの列名の一部が空白(未指定)になってはいないでしょうか?
「2つ目の名称未設定列がデータセットの位置4で見つかりました。」
とありますので、予測に使うデータの4列目に2つ目の名称未指定の列が入っているように見受けられます。
もし学習データに名称未指定の列が含まれているのでなければ、予測に使うデータの方に意図せず名称未指定の列名が含まれている可能性がございます。
従いまして、下記2点のご対応を頂ければと思います。
・学習データ・予測データの列名は全て一意の名称を付けて頂く。
・列名を正しく付けて頂いた場合でこのエラーが出ていた場合は、意図せず名称未指定の列が検出されているので、データを確認頂く。
ご回答ありがとうございます。
こちらですが、予測用ファイルに特殊なセキュリティが掛けられていたことが原因でした。
失礼致しました。
本件クローズさせて下さい。