DataRobotへのデータ投入

様々な方法でDataRobotへデータ投入ができます。curlコマンドを用いたREST API、またはDataRobotが提供しているPython SDKを利用してデータ投入ができます。

DataRobotでサポートしているデータソースのタイプは下記の3種類です。

  • ローカルファイル
  • URL
  • JDBC コネクション

データ投入したら次のステップはモデルの作成です。 こちらでどのようにモデルを作成するか学ぶことができます。Python Client ドキュメントはこちらにあります。

DataRobot Community Githubのワークフローとスニペットのサンプルコードは こちらにあります。

Import Data with REST API

ローカルファイル:

必要事項

  • api_key—DataRobotのGUI開発ツール画面に記載
  • file_path—インポートするファイルのパス

リクエストコードのフォーマット

 

curl \ 
-H "Authorization: Bearer YOUR_API_KEY" \ 
-H "Content-Type: multipart/form-data" \
-X POST \ 
-F 'file=@YOUR_FILE_PATH' \ 
https://app.datarobot.com/api/v2/projects/

 

リクエストコードのサンプル

(ファイルからのインポートの場合のcURLサンプル)

 

API_KEY=YOUR_KEY
FILE_PATH=~YOUR_PATH
DR_ENDPOINT=YOUR_DR_URL/api/v2/projects

curl -v \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: multipart/form-data" \
-X POST \
-F file=@$FILE_PATH \
$DR_ENDPOINT

 

URL:

必要事項

  • api_key—DataRobotのGUI開発ツール画面に記載
  • url—インポートしたいデータファイルのURL

リクエストコードのフォーマット

 

curl -v \
-X POST \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d "{\"url\": \"YOUR_DATA_FILE_URL\"}" \
https://app.datarobot.com/api/v2/projects

 

リクエストコードのサンプル

(URLからインポートするときの cURLのサンプル)

 

DATA_FILE_URL=https:/user/10k_diabetes_test.xlsx
API_KEY=YOUR_API_KEY
DR_ENDPOINT=YOUR_DR_URL/api/v2/projects/

curl -v \
-X POST \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \
-d "{\"url\": \"$DATA_FILE_URL\"}" \
$DR_ENDPOINT

 

JDBCコネクション

必要事項

  • api_key—DataRobotのGUIの開発者ツール画面に記載
  • datasourceId—データソースプロジェクトのID、またはオブジェクト
  • user—データベースのユーザーネーム
  • password—データベースのパスワード

リクエストコードのサンプル

 

curl -v \
-X POST \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \ 
--data '{"dataSourceId": "DATASOURCE_ID", "user": "DB_USERNAME", "password": "DB_PASSWORD"}' \ 
https://app.datarobot.com/api/v2/projects/

 

リクエストのサンプル

 

API_KEY=YOUR_API_KEY
DATASOURCE_ID=YOUR_DATASOURCE_ID
DB_USERNAME=user
DB_PASSWORD=password
DR_ENDPOINT=YOUR_APP_URL/api/v2/projects/

curl -v \
-X POST \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \ 
--d "{\"dataSourceId\": \"$DATASOURCE_ID\", \"user\": \"$DB_USERNAME\", \"password\": \"$DB_PASSWORD\"}" \
$DR_ENDPOINT

 

Pythonを利用したデータの投入

ローカルファイル:

必要事項

  • API Key—DataRobotのGUIの開発者ツール画面に記載
  • DataRobotのパッケージのインポートとDataRobotへの接続 (詳細はこちら)
  • filepath—投入したいファイルのパス
  • project_name—利用したいプロジェクトの名前

コードのフォーマット

 

import datarobot as dr

dr.Client(token='YOUR_API_KEY', 
          endpoint='https://app.datarobot.com/api/v2')
project = dr.Project.create('<filepath>', project_name='<project name>') 

 

サンプル

(ファイルからインポートするPythonのサンプル)

 

import datarobot as dr

dr.Client(token='YOUR_API_KEY', 
          endpoint='https://app.datarobot.com/api/v2')

project = dr.Project.create('/Users/Desktop/10k_diabetes.csv', project_name='Diabetes') 

 

ラベル(1)
バージョン履歴
最終更新日:
‎07-31-2020 11:38 AM
更新者:
寄稿者