リファレンス

キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
日本語検索障害発生中 検索機能がご利用いただけません | 書籍「DataRobotではじめるビジネスAI入門」発売中

リファレンス

リファレンス
これらのオンデマンドリソースは、DataRobotプラットフォームの特定の機能について、ユーザーが学習し、よくある質問への回答を参照し、AIのベストプラクティスを学ぶのに役立つことを目的としています。

ナレッジベースの記事

サポートに寄せられたよくある質問をご紹介します。 質問 プロジェクトやデプロイはどのように共有出来ますか? 回答 プロジェクトの共有方法は2通りあります。1つは該当プロジェクトを選択後の画面右側の5つのアイコンのうち、一番左の共有アイコンをクリックいただき、こちらに共有したいユーザのアカウントを入力して「共有」ボタンをクリックしてください。 もう1つのやり方としてはプロジェクト管理の画面から該当のプロジェクトのアクションメニューから「プロジェクトを共有」をクリックし、上記と同様、共有したいユーザのアカウントを入力して「共有」ボタンをクリックしてください。 デプロイの共有方法としてはデプロイタブをクリック後、デプロイ一覧のリストから該当デプロイメントのアクションメニューをクリックし、「共有」から共有したいユーザのアカウントを入力して、「共有」ボタンをクリックしてください。 質問 複数のプロジェクトを同時に扱うことはできますか? 回答 可能です。複数のブラウザタブまたはウィンドウを開き、それぞれのプロジェクトを操作して下さい。   質問 プロジェクト内で、ターゲットと特徴量セットを定義した後、新しい特徴量セットと異なるターゲットで新しいモデルを実行できますか?   回答 ターゲットを定義した後、元のプロジェクトを「コピー」すると、データセットを新しいプロジェクトに素早く再アップロードし、新しいターゲットを選択できるようになります。 これを行うには、以下のようにします。 ページ右上のメニューのフォルダアイコンをクリックし、プロジェクトの管理を選択します。 プロジェクトメニューのアイコンをクリックし、「プロジェクトをコピー」を選択します。 元のプロジェクトのデータセットを使用した新しい無題プロジェクトが作成され、そのデータページが表示されます。
記事全体を表示
  サポートに寄せられたよくある質問をご紹介します。 質問 データをアップロードしようとした際にファイルサイズ超過のエラーが発生しました。どうすればよいですか? 回答 基本はお客様の契約されているファイルサイズ(例:5G)までファイルの大きさを下げていただき、再度アップロードをお試しいただければと思います。ファイルサイズの制限は、プロダクションにお客様データが取り込まれた際のCSV形式でのデータサイズですので、その他サポートしているファイルタイプによって変換時に大きさが大きく異なる場合が’あることをご留意ください。ファイルサイズの詳細情報はUS-portalサイトに情報掲載がございますのでそちらをご参照いただければ幸いです。   質問 HDFS上に格納されたファイルはどのように指定することが出来ますか? 回答 データのインポート画面より「HDFS」を指定後、基本的には以下のURLにてアクセス可能となります hdfs://<address>/<path> HA構成をご利用の場合は、アドレスをvirtual nameとして(例としてmyclusterというvirtual nameを持つ場合)以下のようにアクセスすることも可能です。 hdfs://mycluster/<path> この場合、myclusterは以下のような複数のNameNodeとして解釈されます。 * hdp-name1.rd2.hq.datarobot.com:8020 * hdp-name2.rd2.hq.datarobot.com:8020 なお、DataRobotの内部ストレージとしてHadoopをご利用の場合は、以下のように簡易的な記法でもアクセス可能となります。 * hdfs:///<path> * /<path>   質問 データセットのエンコーディングを確認することはできますか?   回答 弊社製品ではありませんが、例えばchardetなど、インターネットからダウンロードできるツールがあります。 https://pypi.python.org/pypi/chardet   質問 サポートされるファイルの種類は何ですか?   回答 DataRobotは、データ取り込みのために以下のフォーマットをサポートしています。 ファイル形式 .csv または .tsv* (推奨) データベーステーブル .xls .xlsx .sas7bdat *ファイルは、カンマ区切り、タブ区切り、セミコロン区切り、またはパイプ区切りのファイルで、データ列の数と一致するヘッダーを持つものでなければなりません。各行は同じ数のフィールドを持つ必要があります。 圧縮形式 .gz .bz2 アーカイブ形式 .tar 圧縮とアーカイブのフォーマット .zip .tar.gz/.tgz .tar.bz2 圧縮とアーカイブの両方が受け入れられます。しかし、DataRobotは圧縮されていないデータサイズを知ることができるため、データの取り込み時に効率的になるため、アーカイブの方が好ましいとされています。 エンコーディングと文字セット データセットは、以下のエンコーディング要件を守らなければなりません。 データファイルには、(URLからの)余計な文字やエスケープシーケンスを含めることはできません。 エンコーディングは、データセット全体を通して一貫していなければなりません。例えば、データファイルが最初の100 MBでUTF-8としてエンコードされていても、ファイルの後半にutf-8以外の文字がある場合、最初の100 MBからの検出が正しくないために失敗する可能性があります。 データは、以下のいずれかのエンコーディングに従う必要があります。 ascii cp1252 utf-8 utf-8-sig utf-16 utf-16-le utf-16-be utf-32 utf-32-le utf-32-be Shift-JIS ISO-2022-JP EUC-JP CP932 ISO-8859-1 ISO-8859-2 ISO-8859-5 ISO-8859-6 ISO-8859-7 ISO-8859-8 ISO-8859-9 windows-1251 windows-1256 KOI8-R GB18030 Big5 ISO-2022-KR IBM424 windows-1252 圧縮タイプ9(Deflate64)はサポートされていません。 PKWareはDeflate64を商標登録しており、独自の実装であると考えられています。Deflate64は、そのプロプライエタリな性質と、Deflateと比較した場合の限界的な性能差のため、zlibではサポートされていません。 windows explorerの圧縮オプションの代わりにwinzipやgzipなどの圧縮ツールを使ってみてください。
記事全体を表示
書籍「DataRobotではじめるビジネスAI入門」では、基本的に二値分類問題のサンプルデータを使って解説しています。そのほかの機械学習問題を試してみたい場合は、下表のデータ列のリンクからサンプルデータをダウンロードしてください。 問題の種類 ユースケース 予測ターゲット列 データ 二値分類 消費者ローンの貸し倒れの予測 貸し倒れ P2PLendData_JP.zip 多値分類 通信業者のサービスのレコメンデーション 提案プラン Telco_Next_Best_Offer.zip 連続値 レストランの新店の売上予測 ※ターゲットリーケージも体験できます 売上 New_Restaurants.zip     トライアル版をお使いの場合   トライアル版には、お試しユースケース(データセット)が内蔵されています。下表を参照して、お好きなユースケースをお試しください。 ユースケース 問題の種類 業種 モデルの目的 予測ターゲット列 再入院 二値分類 ヘルスケア 再入院のリスクが高い糖尿病患者を識別する 再入院 夢の野球チームの予測 連続値 スポーツ分析 前年の成績に基づいて翌年の選手の価値の見積もる WOBA Weighted On-Base Average: 打者が1打席あたりにどれだけチームの得点増加に貢献したかを表す指標 Plant Disease Detection 多値分類 農業 植物の葉の画像から、その植物が病気でないか、病気の場合は、病気の種類を推定する Class 予防保全 二値分類 オイル・ガス 油田掘削装置の故障を検知する 故障 ローンの債務不履行リスクの理解 二値分類 銀行業 住宅ローンの債務不履行を予測する 貸し倒れ ローンの繰上支払いを予測 二値分類 銀行業 住宅ローンの返済が早期に終了する可能性があるかを予測する 解約 戦略的疑惑リスト 連続値 セキュリティ 要因分析:高いSSLスコアを算出する重要な要因を識別する SSLスコア SSL: Strategic Suspect List 鋼板の欠陥の予測 二値分類 製造 品質の低い鋼板を検知する 欠陥 ローンの債務不履行を予測 二値分類 フィンテック 融資希望者の債務不履行リスクを予測する   貸し倒れ 不正請求検知 二値分類 保険 自動車保険の保険金請求の不正を検知する 保険金詐欺 ターゲット化された顧客サービス 多値分類 テレコミュニケーション 各顧客に最適な製品を推定する 提案プラン マネーロンダリング防止アクティビティスコアリング 二値分類 銀行業 疑わしい取引(マネーロンダリング)を検知する 疑わしい取引 保険の統計的推測 連続値 保険 事故により傷害を受けた従業員に支払う保険金を予測する 発生保険金
記事全体を表示
最新の情報は、 製品マニュアル をご確認ください。閲覧するには、DataRobotにログインする必要があります。 (この記事の最終更新日:2020年4月7日) アプリケーションの右側のパネルに表示される ワーカーキュー では、 EDA1およびEDA2 のステップのモニタ、ターゲットの選択、およびモデル構築に使用する ワーカーの数 の設定を行います。 モデリングが完了すると、 ホールドアウトのロックを解除 して オートパイロットを再実行 できます。 パネルは、マウスを操作して矢印を表示してクリックすることによって最小化および展開できます。   ワーカーを理解する DataRobotでは、以下に示すようなジョブのタイプに応じて異なるタイプのワーカーが使用されます。 データのアップロード EDAの計算 モデルのトレーニング インサイトの作成 データの管理およびEDAの計算を行うワーカーは、組織全体で共有されます。これらのワーカーは、全ての共有サービスの高可用性を実現するためのリソースプールです。一方、モデリングワーカーは、管理者によって各ユーザーに割り当てられます。次のセクションでは、モデリングおよび予測ワーカーのワーカーキューについて説明します。 構築処理の進行状況を監視する 構築を開始すると、ワーカーキューに実行中や保留中のモデルがすべて表示されます。タスク送信のメカニズムに基づいてキューはタスクを優先順位付けします。「有用性の高い」ジョブが最初に処理されます。オートパイロットによって送信されたすべてのタスクは低優先度(バックグラウンド)に割り当てられます。その他のすべてのタスク(オートパイロットによって開始されなかったタスク)にはデフォルトの優先度が割り当てられます。例えば、ユーザーが送信したタスク(特徴量のインパクトの比較など)は次の使用可能なワーカーによって処理されます。オートパイロットでモデルの構築が終了するのを待つ必要はありません。 ワーカーキューでは次の操作を行うことができます。 表示 説明 進捗の表示 各モデルの構築中にサマリーと詳細情報を表示します。 ワーカーの調整 現在の構築に使用されている同時ワーカー数を調整します。 処理の一時停止 キューを一時停止するとともに処理中のモデルを完了させます。 構築のキャンセル スケジュールされている構築をキューから削除します。 モデル実行の再開 別の構築条件でモデルを再度実行するためのオプションを選択します。 何らかの理由によってワーカーまたは構築が失敗したら、キューの一番下に エラー イベントとしてリスト表示し、記録します。 進捗の表示 ワーカーキューは、処理中のモデルとキュー内の—モデルの2つの部分に分けられます。実行中のモデルについては、CPUおよびRAM使用状況のライブレポートが表示されます。 キュー内モデルリストの表示を最大化または最小化するには、キュー名の隣にある矢印をクリックします。 ワーカー数の調整 DataRobotがモデル構築に使う作業者ワーカーの数を、管理者が設定した最大数まで調整できます。プロジェクトが自分と共有されていて、所有者に高次の割り当てがある場合、許可されたワーカーの合計数には、所有者の割り当てが表示されます(必ずしも自分に許可されている数であるとは限りません)。ワーカーの数を増減させるには、オレンジ色の矢印をクリックします。 ワーカーキューの一時停止 ワーカーキューを一時停止するには、キューの上にある一時停止マーク(縦の2本線)をクリックします。一時停止後は、マークが再生マーク(矢印)に変わります。 キューを一時停止しても実行中のモデルの処理は続けられます。これらのモデルが完成すると、ワーカーはキュー内の次のモデルの構築を始められる状態になります。キューの一時停止を解除するまで、この順番は空いたままになります。モデルの構築を再開するには再生矢印をクリックします。 ワーカーのキャンセル 処理中モデルまたはキュー内モデルを削除するには、モデル名の隣にあるX印をクリックします。実行中のモデルはただちにキャンセルされ、キュー内のモデルはキューから削除されます。 モデル構築の再開 構築が完了したとき、または一時停止したときに、同じデータを使用して新しい構築を開始することができます。次のいずれかからモデル作成を再開します。 データ ページの 特徴量セット タブ。 ワーカーキュー( オートパイロットを再実行 リンクを使用) リンクをクリックすると、使用する特徴量を選択できるダイアログボックスが開きます。セットの選択と再トレーニングを行う際は、 これらの注意事項 に留意してください。次に、 オートパイロットをリスタート をクリックして新しいモデル作成を開始します。  
記事全体を表示
お知らせ
DataRobotコミュニティにようこそ!

AIとMLに関するあらゆることについて探求し、学び、コミュニティの仲間と交流しましょう。

クラスルーム形式のトレーニングをご希望の方は DataRobot University へどうぞ
トップ寄稿者