キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
DataRobot コミュニティ

特徴量セットの管理について

ST
イメージセンサー

特徴量セットの管理について

表題の件、以下のような使い方を続けたとき、各プロジェクトに対してどの特徴量セットを選んだのか

わからなくなることがあります。管理する際の工夫などありましたら、ご教示ください。

1. 開始ボタンを押す前に特徴量セットをいくつか作る。

 (同じプロジェクトで違う特徴量セットを使用したいため。1つのセット内容を少し変えるだけの

  セットを作ることもあり、まとめて作成している。)
2. 解析を実行。

3. 解析終了後、冗長な特徴量を除外した特徴量セットを作成する。
4. 3のプロジェクトをコピーして冗長除外した特徴量セットで解析する。

…と繰り返していると、特徴量セットが増えてしまい、管理が難しくなってしまったというのが現状です。

 

以上、よろしくお願いいたします。

0 件の賞賛
6件の返信6
IJICHI_DR
データサイエンティスト
データサイエンティスト

@ST さん、ご質問ありがとうございます。

ご指摘のように、たくさんの特徴量セットを作成すると、だんだん分からなくなってくる、ということはありますね。

これが一番良い、という方法は人それぞれだと思いますが、私は「データ>特徴量セット」画面(下図)に行き、そこで特徴量セットに簡単な説明コメントを入力する、ということをやったりしています。特徴量セットの名前はシンプルに連番とかにして、説明をしっかり残しておく、という感じです。

IJICHI_DR_1-1598610680237.png

ご自身で作った特徴量セットの右側のオレンジ横三本線をクリックして、「編集」を選択すると、自由記述でコメントを加えることができます。

IJICHI_DR_2-1598610790558.png

IJICHI_DR_3-1598610841685.png

こんな感じで説明コメントを入れながら特徴量セットを作ると管理しやすくなるかなと思いますので、よかったら使ってみてください!

 

ST
イメージセンサー

@IJICHI_DR さん

 

ご回答ありがとうございます。

説明コメント欄確認できました。これから使ってみたいと思います。

 

ちなみに、モデルの列に数字が入っているものがモデル作成に使われた特徴量セットということで

合っていますか?下図を見ていると、モデルタブの横に書かれた数字とモデル列の総数が一致していないので追加でご質問させてください。

image.jpg

0 件の賞賛
IJICHI_DR
データサイエンティスト
データサイエンティスト

>ちなみに、モデルの列に数字が入っているものがモデル作成に使われた特徴量セットということで合っていますか?

ご理解の通りです。

>下図を見ていると、モデルタブの横に書かれた数字とモデル列の総数が一致していないので追加でご質問させてください。

モデル列の数字にはアンサンブルモデルの中で使われているモデルもカウントされています。そのためモデルタブの横に書かれた数字と、モデル列の総数が一致していません。

0 件の賞賛
ST
イメージセンサー

@IJICHI_DR さん

ご回答ありがとうございます。

>モデル列の数字にはアンサンブルモデルの中で使われているモデルもカウントされています。そのためモデルタブの横に書かれた数字と、モデル列の総数が一致していません。

→分かりました。アンサンブルのモデルの特徴量セットに「複数の特徴量セット」と書かれているものですね。用意した特徴量セットのうち何が使われているかということは知ることはできますか?

 

0 件の賞賛
IJICHI_DR
データサイエンティスト
データサイエンティスト

用意した特徴量セットのうち何が使われているかということは知ることはできますか?

1. リーダーボードでアンサンブルモデルの下の「M118+74+77」のように表示されているところにマウスオーバーしてクリックしてください。(マウスオーバーすると、Blended Model IDs 118,74,77 のように表示されます)

IJICHI_DR_0-1598880939786.png

2. すると下図のように、そのアンサンブルモデルに使われた単独モデルだけが表示されます(フィルターされる)ので、右側で各々の単独モデルでどの特徴量セットが使われているかを確認できます。

スクリーンショット 2020-08-31 22.45.53.png

 

3. リーダーボードの表示を元に戻すときには、下図のオレンジ色のXマークをクリックしてフィルターを解除してください。

スクリーンショット 2020-08-31 22.48.44.png

ST
イメージセンサー

@IJICHI_DR さん

詳しい手順をありがとうございます。

アンサンブルに使われた各特徴量セットについて確認できました。

ご回答いただきありがとうございました!

0 件の賞賛