3年以上前にアップロードした学習データの元データをCSV形式でDRのUI上からダウンロードしたいのですが仕様的に可能でしょうか。
AIカタログにもアップロードしていればダウンロード可能かと思いますが、今回ダウンロードしたいデータが3年以上前にアップロードしたものでAIカタログ上になく、、
「元データを見る」では見れるのでサーバー上にデータはありそうなのですが、ダウンロード可否と方法をご教示いただきたいです。
解決済! 解決策の投稿を見る。
3年以上前にアップロードした学習データの元データをCSV形式でDRのUI上からダウンロードしたいのですが仕様的に可能でしょうか。
はい。本来の活用目的とは異なるかもしれませんがモデルの予測タブから学習データをダウンロードすることは可能です。
以下具体的な方法になります。
①リーダーボードより元の特徴量セットで作成された適当なモデルを選択>「予測タブ」>「テスト予測」を選択
②「テスト予測」下部の「予測データセット」内にある「トレーニングデータ」右のオレンジ色ハンバーガーマーク(※「三」)を選択
③「フルデータセットをダウンロード」を選択しcsv形式で保存
ご回答ありがとうございます。2点聞かせてください
①仰った方法を実施してみましたが、そのオレンジ色ハンバーガーマーク(※「三」)がない状況です。
その問題の原因は権限なのかプロジェクトの設定なのかを教えていただけませんでしょうか。解決方法があればぜひ教えてください。
②同じな目的ではAPIでダウンロードできますか?APIのDatasetやProjectのメソッドを試しましたが、DatasetのほうはAIカタログのデータしかダウンロードできなくて、ProjectのほうもPredictDatasetしかできないです。
@khoahv さま
ご確認いただきましてありがとうございます。
①については、恐らくDataRobotのバージョンによるものと思われます。私も以前はハンバーガーマークが確認できたのですが、同様に消えてしまっておりました。
②既存のAPIメソッドでは、コメントいただいた以外の方法でDatasetをダウンロードできないのではないかと考えられます。
AIカタログなどに登録されているのであればダウンロード可能ですが、既存プロジェクトから直接学習データをダウンロードするメソッドはdocsを確認する限りでも存在しない状況です。
少し手間のかかり、かつ現実的な方法か判断つきかねますが、もし仮に学習データにユニークIDが付与されているのであれば、予測タブ>テスト予測>予測データセットの「ダウンロードに含める特徴量」で可能な限り特徴量を加え、改めてデータベース等から教師データを抽出いただくことも視野に入れられてもよろしいかもしれません。
お力になれず申し訳ございません。