様々な方法でDataRobotへデータ投入ができます。curlコマンドを用いたREST API、またはDataRobotが提供しているPython SDKを利用してデータ投入ができます。
DataRobotでサポートしているデータソースのタイプは下記の3種類です。
データ投入したら次のステップはモデルの作成です。 こちらでどのようにモデルを作成するか学ぶことができます。Python Client ドキュメントはこちらにあります。
DataRobot Community Githubのワークフローとスニペットのサンプルコードは こちらにあります。
Import Data with REST API
ローカルファイル:
必要事項
- api_key—DataRobotのGUI開発ツール画面に記載
- file_path—インポートするファイルのパス
リクエストコードのフォーマット
curl \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-X POST \
-F 'file=@YOUR_FILE_PATH' \
https://app.datarobot.com/api/v2/projects/
リクエストコードのサンプル
(ファイルからのインポートの場合のcURLサンプル)
API_KEY=YOUR_KEY
FILE_PATH=~YOUR_PATH
DR_ENDPOINT=YOUR_DR_URL/api/v2/projects
curl -v \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: multipart/form-data" \
-X POST \
-F file=@$FILE_PATH \
$DR_ENDPOINT
URL:
必要事項
- api_key—DataRobotのGUI開発ツール画面に記載
- url—インポートしたいデータファイルのURL
リクエストコードのフォーマット
curl -v \
-X POST \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d "{\"url\": \"YOUR_DATA_FILE_URL\"}" \
https://app.datarobot.com/api/v2/projects
リクエストコードのサンプル
(URLからインポートするときの cURLのサンプル)
DATA_FILE_URL=https:/user/10k_diabetes_test.xlsx
API_KEY=YOUR_API_KEY
DR_ENDPOINT=YOUR_DR_URL/api/v2/projects/
curl -v \
-X POST \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \
-d "{\"url\": \"$DATA_FILE_URL\"}" \
$DR_ENDPOINT
JDBCコネクション
必要事項
- api_key—DataRobotのGUIの開発者ツール画面に記載
- datasourceId—データソースプロジェクトのID、またはオブジェクト
- user—データベースのユーザーネーム
- password—データベースのパスワード
リクエストコードのサンプル
curl -v \
-X POST \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
--data '{"dataSourceId": "DATASOURCE_ID", "user": "DB_USERNAME", "password": "DB_PASSWORD"}' \
https://app.datarobot.com/api/v2/projects/
リクエストのサンプル
API_KEY=YOUR_API_KEY
DATASOURCE_ID=YOUR_DATASOURCE_ID
DB_USERNAME=user
DB_PASSWORD=password
DR_ENDPOINT=YOUR_APP_URL/api/v2/projects/
curl -v \
-X POST \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \
--d "{\"dataSourceId\": \"$DATASOURCE_ID\", \"user\": \"$DB_USERNAME\", \"password\": \"$DB_PASSWORD\"}" \
$DR_ENDPOINT
Pythonを利用したデータの投入
ローカルファイル:
必要事項
- API Key—DataRobotのGUIの開発者ツール画面に記載
- DataRobotのパッケージのインポートとDataRobotへの接続 (詳細はこちら)
- filepath—投入したいファイルのパス
- project_name—利用したいプロジェクトの名前
コードのフォーマット
import datarobot as dr
dr.Client(token='YOUR_API_KEY',
endpoint='https://app.datarobot.com/api/v2')
project = dr.Project.create('<filepath>', project_name='<project name>')
サンプル
(ファイルからインポートするPythonのサンプル)
import datarobot as dr
dr.Client(token='YOUR_API_KEY',
endpoint='https://app.datarobot.com/api/v2')
project = dr.Project.create('/Users/Desktop/10k_diabetes.csv', project_name='Diabetes')