リポジトリ

キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

リポジトリ

最新の情報は、製品マニュアルをご確認ください。閲覧するには、DataRobotにログインする必要があります。

(この記事の最終更新日:2020年4月9日)

リポジトリは、選択したプロジェクトで使用できるモデリングブループリントのライブラリです。これらのブループリントは、モデル自体ではなく、モデルの構築に使用されるアルゴリズムを表示します。リポジトリに一覧表示されるモデルは、必ずしも構築済みとは限りません。リストには、任意のモデリングモードで構築できるモデルが含まれます。手動モードでプロジェクトを作成し、特定のブループリントを選択して実行するには、リポジトリのDataRobotページから目的のブループリントにアクセスします。

標準で構築するモデルに加え、リポジトリには以下の内容も含まれます。

  • オートパイロットで実行されない計算負荷の高いモデル(Neural Net Classifierやディープラーニングモデルなど)。
  • Jupyter NotebookでRやPython IDEを使用して構築されたモデル。
  • エンタープライズHadoopユーザーのSparkおよびH2Oモデルの選択セット。

リポジトリにアクセスするには、一番上のメニューからリポジトリをクリックします。

repository-click-jp.png

モデルタイプの理解

リポジトリには以下の内容が含まれます。

  • DataRobotモデル
  • Jupyter Notebookで構築したカスタムモデル
  • オープンソースモデル

すべてのモデル(カスタムモデルおよびDataRobotで作成したモデル)は、同じ交差検定フレームワーク内に格納されるので、カスタムモデルもリーダーボード内の他のモデルに対してランク付けできます。

DataRobotモデル

DataRobotモデルは、大量の並列処理を使用して構築されており、主にオープンソースアルゴリズムをベースにした何千もの選択肢をトレーニングし、評価しています(オープンソースには最良のアルゴリズムがいくつかあります)。DataRobotは、アルゴリズム、前処理のステップ、特徴量、変換、チューニングパラメーターの数百万の可能な組み合わせを探索して、データセットと予測ターゲットに最適なモデルを提供します。可能な限り最良のモデルを生成するのは、この前処理とチューニングです。

これらのモデルのリストは、DataRobotタブ(リポジトリページ)から表示でき、モデルのブループリントのエンドツーエンドのモデル適合処理を確認できます。リーダーボードに表示されるDataRobotモデルにはDataRobotアイコンicon-dr.pngが表示されます。

repository-1-jp-1.png

カスタムモデル

リポジトリのマイタスクタブから、Jupyter Notebookで作成した独自のカスタムモデルにアクセス(および共有)します。

repository-2-jp.png

Jupyter Notebookで作成したモデルはDatarobotの予測ワークフローの一部になります。​自分のタスクページは、アカウントレベルのアクセスを提供します(すべてのプロジェクトのすべてのスクリプトを含む)。対照的に、DataRobotページはプロジェクトレベルのアクセスを提供します。一覧表示されるブループリントは現在のプロジェクトに帰属します。

DataRobotは、カスタムモデルのバージョン管理をサポートします。IDEを介してサブミットする際にモデルスクリプトに名前を付けます。後でスクリプトを変更し、同じ名前で再度サブミットすると、DataRobotがバージョン番号を追加し、すべてのバージョンを保存します。バージョン番号は、カタログリストの各モデルに対して表示されます。バージョン付けすることによって、前のバージョンのスクリプトでトレーニングされたモデルの下位互換性を提供します。

オープンソースモデル

DataRobotでは、オープンソースの既存の実装に機能を追加することが多いため、DataRobotで実行されるバージョンは、標準的なオープンソースインストールで利用可能なバージョンとは異なる場合があります。しかしながら、オートパイロット中に変更されていないオープンソースモデルを構築する場合もあります。そうしたモデルは、リーダーボードのリポジトリページのオープンソースタブから閲覧することができます。オープンソースのリーダーボード項目はモデル名の下にその旨の表示があります。

repository-leaderboard-jp.png

スケールアウトモデル

DataRobotのスケールアウトモデルは、GB単位のデータセットを操作する際の処理速度を向上させるために、H20およびSparkMLライブラリの分散モデリングアルゴリズムを使用します。プロジェクト用に構築された全てのスケールアウトモデルは、モデルリポジトリで使用できます。オートパイロット中にモデルのサブセットを構築するには、オートパイロット中にスケールアウトモデルを含めるフラグを高度なオプションリンクで設定します。スケールアウトモデルを構築する前にスケールアウトに関する注意事項を参照してください。

プロジェクト用に構築されるスケールアウトモデルは、問題のタイプおよび構築方法に依存します。

リポジトリにある回帰問題

回帰の問題では、リポジトリから以下が使用可能です。

  • Spark ML線形回帰
  • Spark MLランダムフォレストRegressor
  • H2O GLM Regressor
  • H2OディープラーニングRegressor
  • H2O Gradient Boosted Regressor
  • H2OランダムフォレストRegressor

回帰の問題では、オートパイロットから以下が使用可能です。

  • Spark MLランダムフォレストRegressor
  • H2OランダムフォレストRegressor

リポジトリにある二値分類問題

二値分類問題では、リポジトリから以下が使用可能です。

  • Spark ML Logistic Regression
  • Spark MLランダムフォレストClassifier
  • H2O GLM Classifier
  • H2Oディープラーニング Classifier
  • H2O Gradient Boosted Classifier
  • H2OランダムフォレストClassifier

二値分類問題では、オートパイロットから以下が使用可能です。

  • Spark MLランダムフォレストClassifier
  • H2OランダムフォレストClassifier
これらのモデルは、DataRobot 4.0以降向けに作成されたプロジェクトでのみ実行可能です。下位互換性はありません。

DataRobotタブの使用

DataRobotタブから以下のアクションにアクセスすることができます。

  • リストやグループをタイプ別に制限するための検索
  • モデルのブループリント表示をプレビューします。
  • 実行はモデルの実行のための新しいパラメーターを設定します。
  • バッチ処理実行は、モデルの実行のための新しいパラメーターを設定し、選択されたモデルに適用します。

リポジトリの検索

リポジトリで簡単にモデルを見つけたり、モデルタイプによって並べ替えたりするには、検索機能を使用します。

repository-3-jp.png

検索ボックスをクリックし、入力します。入力すると、検索条件を満たすモデルにリストが自動的に絞り込まれます。

完全なモデルリストに戻るには検索ボックスから文字をすべて消去します。

新しいモデルの作成

リポジトリから新しいモデルを作成できます。以下の手順を実行します。

  1. モデル名の横にあるチェックボックスをオンにするか、追加ボタンをクリックして、実行するモデルを選択します。repository-4-jp.png
  2. モデルを選択した後、表示されるダイアログボックスでフィールドを変更します。repository-5-jp.png
    • (1)特徴量セット:ドロップダウンメニューから新しい特徴量セットを選択します。オプションには、初期設定のセットとユーザーが作成したセットがあります。
    • (2)サンプルサイズ:サンプルサイズを変更し、デフォルトでオートパイロットが実行するサンプルサイズよりも大きくまたは小さくします。初期設定でフルオートパイロットが実行されたサンプルサイズを入力しないように気をつけてください。
    • (3)CV実行:交差検定で使用される分割数を設定します。
  3. パラメーター設定を確認した後、タスクを実行をクリックし、新しいモデルの実行を開始します。

バッチ処理実行の開始

バッチ処理実行機能により、モデル実行パラメーターを設定し、ユーザーのリポジトリから選択された個々のモデルに適用することができます。バッチ実行を開始するには、リポジトリタブを開き、実行するモデルの名前の横にあるボックスをクリックするか、モデル名と説明の横にあるボックスをクリックしてすべてのモデルを選択します。

select-batch-models-jp.png

選択したすべてのモデルの選択を解除するには、モデル名と説明の横にあるマイナス記号(-)をクリックします。

バッチに含まれるいずれかのモデルが同じサンプルサイズと特徴量セットを使用して既に構築されている場合、少なくとも1つのパラメーターに変更を加える必要があります(実行オプションを参照してください)。新しいモデルだけを含むバッチの場合、この操作は必要ありません。タスクを実行をクリックして構築を開始します。

repository-6-jp.png

マイタスクカタログを使用する

マイタスクでは、モデルソースコードのプレビュー、カスタムモデルの名前や説明の変更、他のユーザーとのモデルの共有、モデルの実行や削除を行うことができます。最初の実行の後、各カスタムモデルスクリプトは(ユーザーが削除するまで)マイタスクに恒久的に保存されます。これらのタスクスクリプトは、プロジェクトからプロジェクトへ引き継がれますので、ユーザー自身のリポジトリを蓄積していき、数多くのプロジェクトに対して実行することができます。タスクは、現在選択されているプロジェクトに対して実行されます。

カスタムモデルのプレビュー

カスタムモデルのコードをプレビューするには、プレビューリンクをクリックします。

repository-custom-model-preview-jp.png

カスタムモデルの共有

ユーザーのシステム上で、他の登録ユーザーとカスタムモデルを共有できます。(自分が共有しているモデルにアクセスするには、リポジトリ他の人からの共有タブを使用します。)

モデルを共有するには

  1. 共有するモデルを選択して、共有リンクをクリックします。

  2. システム上でカスタムモデルを共有するユーザーのEメールアドレスを入力して、共有タスクをクリックします:

    repository-share-custom-model-email-jp.png

そのユーザーのEメールアドレスが、カスタムモデルの現在、次と共有リストに表示されます。

  • モデルの共有を停止するには、ユーザーのEメールアドレスの隣にあるオレンジ色のXマークをクリックします。
  • モデルを別のユーザーと共有するには、目的のユーザーのEメールアドレスをほかのユーザーとタスクを共有ボックスに入力し、共有タスクをクリックします。

カスタムモデルの名前の変更および削除

カスタムモデルの名前の変更および削除を行うには、修正をクリックし、以下のオプションのいずれかを選択します。

  • 名前: カスタムモデル名を編集します。
  • 説明: カスタムモデルを説明するテキストを編集します。このテキストはモデル名の下に表示されます。
  • 削除: カスタムモデルをDataRobot—(リポジトリおよびプロジェクト)から恒久的に削除します。repository-modify-custom-model-jp.png

カスタムモデルの実行

カスタムモデルをマイタスクリストから実行するには、そのモデルの実行リンクをクリックします。マイタスクからのモデルの実行は、リポジトリからの実行と同様に機能します。

他の人からの共有オプションの使用

リポジトリの他の人からの共有タブでは、他のDataRobotユーザーと共有するモデリングスクリプトのカタログにアクセスできます。これらのモデリングスクリプトは、マイタスクタブで共有されたタスクです。このページは(プロジェクトベースではなく)ユーザーアカウントレベルで制御されます。

repository-shared-with-me-jp.png

共有されたタスクは、他の人からの共有タブからプレビューおよび実行を行うことができます。リストに含まれる各タスクには、RタスクかPythonモデルかを示すアイコンが表示されます。

オープンソースタブの使用

オープンソースタブから、標準的なオープンソースインストールで構築されたモデルへアクセスすることができます。これらモデルのコードを表示またはダウンロードし、モデリング処理について、より深く知ることができます。また、DataRobotモデルの実行と同様にリポジトリから実行することもできます。上記で説明されている検索バッチ処理実行機能も使用することができます。

repository-7-jp.png

  • プレビュー(1)をクリックし、モデルのコードを表示します。preview-os-models-jp.png
  • 追加(2)をクリックして、目的のパラメーターで実行するモデルを選択します。タスクを実行をクリックして構築を開始します。オープンソースモデルの実行は、リポジトリから他のモデルを実行するのと全く同じです。repository-7-jp-1.png
  • ダウンロード (3)タブをクリックして、モデルのコードをダウンロードします。ダウンロードが開始します。ダウンロードが完了すると、ブラウザのダウンロードバーにファイルが表示されます。
ラベル(1)
バージョン履歴
最終更新:
‎06-09-2020 04:43 PM
更新者: