リファレンス

キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
コミュニティ開設ハーフアニバーサリー企画ハロウィンブログキャンペーン実施中

リファレンス

リファレンス
これらのオンデマンドリソースは、DataRobotプラットフォームの特定の機能について、ユーザーが学習し、よくある質問への回答を参照し、AIのベストプラクティスを学ぶのに役立つことを目的としています。

ナレッジベースの記事

書籍「DataRobotではじめるビジネスAI入門」では、基本的に二値分類問題のサンプルデータを使って解説しています。そのほかの機械学習問題を試してみたい場合は、下表のデータ列のリンクからサンプルデータをダウンロードしてください。 問題の種類 ユースケース 予測ターゲット列 データ 二値分類 消費者ローンの貸し倒れの予測 貸し倒れ P2PLendData_JP.zip 多値分類 通信業者のサービスのレコメンデーション 提案プラン Telco_Next_Best_Offer.zip 連続値 レストランの新店の売上予測 ※ターゲットリーケージも体験できます 売上 New_Restaurants.zip     トライアル版をお使いの場合   トライアル版には、お試しユースケース(データセット)が内蔵されています。下表を参照して、お好きなユースケースをお試しください。 ユースケース 問題の種類 業種 モデルの目的 予測ターゲット列 再入院 二値分類 ヘルスケア 再入院のリスクが高い糖尿病患者を識別する 再入院 夢の野球チームの予測 連続値 スポーツ分析 前年の成績に基づいて翌年の選手の価値の見積もる WOBA Weighted On-Base Average: 打者が1打席あたりにどれだけチームの得点増加に貢献したかを表す指標 Plant Disease Detection 多値分類 農業 植物の葉の画像から、その植物が病気でないか、病気の場合は、病気の種類を推定する Class 予防保全 二値分類 オイル・ガス 油田掘削装置の故障を検知する 故障 ローンの債務不履行リスクの理解 二値分類 銀行業 住宅ローンの債務不履行を予測する 貸し倒れ ローンの繰上支払いを予測 二値分類 銀行業 住宅ローンの返済が早期に終了する可能性があるかを予測する 解約 戦略的疑惑リスト 連続値 セキュリティ 要因分析:高いSSLスコアを算出する重要な要因を識別する SSLスコア SSL: Strategic Suspect List 鋼板の欠陥の予測 二値分類 製造 品質の低い鋼板を検知する 欠陥 ローンの債務不履行を予測 二値分類 フィンテック 融資希望者の債務不履行リスクを予測する   貸し倒れ 不正請求検知 二値分類 保険 自動車保険の保険金請求の不正を検知する 保険金詐欺 ターゲット化された顧客サービス 多値分類 テレコミュニケーション 各顧客に最適な製品を推定する 提案プラン マネーロンダリング防止アクティビティスコアリング 二値分類 銀行業 疑わしい取引(マネーロンダリング)を検知する 疑わしい取引 保険の統計的推測 連続値 保険 事故により傷害を受けた従業員に支払う保険金を予測する 発生保険金
記事全体を表示
  サポートに寄せられたよくある質問をご紹介します。 質問 APIキーはどこで見つけることが出来ますか? 回答   画面右上のアカウントアイコンをクリック後、表示される「Developer Tools」リンクをクリックして下さい。 すでに作成済みの場合は一覧がリストされますが、新規に作成する場合は、「新しいキーを作成」をクリックして任意の名前を入力後、「保存」を押すとキーが生成されます 参考:APIキー管理 質問 APIを使って、オートパイロットで、GUIの「実行時間の上限」と同等の設定を行うことはできますか? 回答 オートパイロット開始オプションにあるblueprint_thresholdで設定することができます。 質問 Python APIで以下のエラーが出力されました。どのように対応すれば良いでしょうか? SSLError: HTTPSConnectionPool(host='app.datarobot.com', port=443): Max retries exceeded with url: /api/v2/version/ (Caused by SSLError(SSLError("bad handshake: Error([('SSL routines', 'tls_process_server_certificate', 'certificate verify failed')],)",),)) 回答 SSL証明書の設定に不備・不足がある可能性がございます。御社環境にてWebフィルタリングを行なっているなど、SSL証明書の設定の必要性についてご確認下さい。一時的な回避策のため、あるいは、SSL認証を無効にした実行のためには、以下のように、「verify=False」を追記して実行して下さい。 auth=(USERNAME, API_TOKEN), data=data, headers=headers, verify=False)   質問 ホットスポット(RuleFit Classifier)のデータをAPIを介して、csvファイルとしてダウンロードする方法はありますか? 回答 残念ながら、現状、API経由でのcsvファイルのダウンロードはサポートされておりません。
記事全体を表示
サポートに寄せられたよくある質問をご紹介します。 質問 プロジェクトやデプロイはどのように共有出来ますか? 回答 プロジェクトの共有方法は2通りあります。1つは該当プロジェクトを選択後の画面右側の5つのアイコンのうち、一番左の共有アイコンをクリックいただき、こちらに共有したいユーザのアカウントを入力して「共有」ボタンをクリックしてください。 もう1つのやり方としてはプロジェクト管理の画面から該当のプロジェクトのアクションメニューから「プロジェクトを共有」をクリックし、上記と同様、共有したいユーザのアカウントを入力して「共有」ボタンをクリックしてください。 デプロイの共有方法としてはデプロイタブをクリック後、デプロイ一覧のリストから該当デプロイメントのアクションメニューをクリックし、「共有」から共有したいユーザのアカウントを入力して、「共有」ボタンをクリックしてください。 質問 複数のプロジェクトを同時に扱うことはできますか? 回答 可能です。複数のブラウザタブまたはウィンドウを開き、それぞれのプロジェクトを操作して下さい。   質問 プロジェクト内で、ターゲットと特徴量セットを定義した後、新しい特徴量セットと異なるターゲットで新しいモデルを実行できますか?   回答 ターゲットを定義した後、元のプロジェクトを「コピー」すると、データセットを新しいプロジェクトに素早く再アップロードし、新しいターゲットを選択できるようになります。 これを行うには、以下のようにします。 ページ右上のメニューのフォルダアイコンをクリックし、プロジェクトの管理を選択します。 プロジェクトメニューのアイコンをクリックし、「プロジェクトをコピー」を選択します。 元のプロジェクトのデータセットを使用した新しい無題プロジェクトが作成され、そのデータページが表示されます。
記事全体を表示
  サポートに寄せられたよくある質問をご紹介します。 質問 データをアップロードしようとした際にファイルサイズ超過のエラーが発生しました。どうすればよいですか? 回答 基本はお客様の契約されているファイルサイズ(例:5G)までファイルの大きさを下げていただき、再度アップロードをお試しいただければと思います。ファイルサイズの制限は、プロダクションにお客様データが取り込まれた際のCSV形式でのデータサイズですので、その他サポートしているファイルタイプによって変換時に大きさが大きく異なる場合が’あることをご留意ください。ファイルサイズの詳細情報はUS-portalサイトに情報掲載がございますのでそちらをご参照いただければ幸いです。   質問 HDFS上に格納されたファイルはどのように指定することが出来ますか? 回答 データのインポート画面より「HDFS」を指定後、基本的には以下のURLにてアクセス可能となります hdfs://<address>/<path> HA構成をご利用の場合は、アドレスをvirtual nameとして(例としてmyclusterというvirtual nameを持つ場合)以下のようにアクセスすることも可能です。 hdfs://mycluster/<path> この場合、myclusterは以下のような複数のNameNodeとして解釈されます。 * hdp-name1.rd2.hq.datarobot.com:8020 * hdp-name2.rd2.hq.datarobot.com:8020 なお、DataRobotの内部ストレージとしてHadoopをご利用の場合は、以下のように簡易的な記法でもアクセス可能となります。 * hdfs:///<path> * /<path>   質問 データセットのエンコーディングを確認することはできますか?   回答 弊社製品ではありませんが、例えばchardetなど、インターネットからダウンロードできるツールがあります。 https://pypi.python.org/pypi/chardet   質問 サポートされるファイルの種類は何ですか?   回答 DataRobotは、データ取り込みのために以下のフォーマットをサポートしています。 ファイル形式 .csv または .tsv* (推奨) データベーステーブル .xls .xlsx .sas7bdat *ファイルは、カンマ区切り、タブ区切り、セミコロン区切り、またはパイプ区切りのファイルで、データ列の数と一致するヘッダーを持つものでなければなりません。各行は同じ数のフィールドを持つ必要があります。 圧縮形式 .gz .bz2 アーカイブ形式 .tar 圧縮とアーカイブのフォーマット .zip .tar.gz/.tgz .tar.bz2 圧縮とアーカイブの両方が受け入れられます。しかし、DataRobotは圧縮されていないデータサイズを知ることができるため、データの取り込み時に効率的になるため、アーカイブの方が好ましいとされています。 エンコーディングと文字セット データセットは、以下のエンコーディング要件を守らなければなりません。 データファイルには、(URLからの)余計な文字やエスケープシーケンスを含めることはできません。 エンコーディングは、データセット全体を通して一貫していなければなりません。例えば、データファイルが最初の100 MBでUTF-8としてエンコードされていても、ファイルの後半にutf-8以外の文字がある場合、最初の100 MBからの検出が正しくないために失敗する可能性があります。 データは、以下のいずれかのエンコーディングに従う必要があります。 ascii cp1252 utf-8 utf-8-sig utf-16 utf-16-le utf-16-be utf-32 utf-32-le utf-32-be Shift-JIS ISO-2022-JP EUC-JP CP932 ISO-8859-1 ISO-8859-2 ISO-8859-5 ISO-8859-6 ISO-8859-7 ISO-8859-8 ISO-8859-9 windows-1251 windows-1256 KOI8-R GB18030 Big5 ISO-2022-KR IBM424 windows-1252 圧縮タイプ9(Deflate64)はサポートされていません。 PKWareはDeflate64を商標登録しており、独自の実装であると考えられています。Deflate64は、そのプロプライエタリな性質と、Deflateと比較した場合の限界的な性能差のため、zlibではサポートされていません。 windows explorerの圧縮オプションの代わりにwinzipやgzipなどの圧縮ツールを使ってみてください。
記事全体を表示
お知らせ
DataRobotコミュニティにようこそ!

AIとMLに関するあらゆることについて探求し、学び、コミュニティの仲間と交流しましょう。

クラスルーム形式のトレーニングをご希望の方は DataRobot University へどうぞ
トップ寄稿者