表題の件、以下のような使い方を続けたとき、各プロジェクトに対してどの特徴量セットを選んだのか
わからなくなることがあります。管理する際の工夫などありましたら、ご教示ください。
1. 開始ボタンを押す前に特徴量セットをいくつか作る。
(同じプロジェクトで違う特徴量セットを使用したいため。1つのセット内容を少し変えるだけの
セットを作ることもあり、まとめて作成している。)
2. 解析を実行。
3. 解析終了後、冗長な特徴量を除外した特徴量セットを作成する。
4. 3のプロジェクトをコピーして冗長除外した特徴量セットで解析する。
…と繰り返していると、特徴量セットが増えてしまい、管理が難しくなってしまったというのが現状です。
以上、よろしくお願いいたします。
解決済! 解決策の投稿を見る。
@ST さん、ご質問ありがとうございます。
ご指摘のように、たくさんの特徴量セットを作成すると、だんだん分からなくなってくる、ということはありますね。
これが一番良い、という方法は人それぞれだと思いますが、私は「データ>特徴量セット」画面(下図)に行き、そこで特徴量セットに簡単な説明コメントを入力する、ということをやったりしています。特徴量セットの名前はシンプルに連番とかにして、説明をしっかり残しておく、という感じです。
ご自身で作った特徴量セットの右側のオレンジ横三本線をクリックして、「編集」を選択すると、自由記述でコメントを加えることができます。
こんな感じで説明コメントを入れながら特徴量セットを作ると管理しやすくなるかなと思いますので、よかったら使ってみてください!
@IJICHI_DR さん
ご回答ありがとうございます。
説明コメント欄確認できました。これから使ってみたいと思います。
ちなみに、モデルの列に数字が入っているものがモデル作成に使われた特徴量セットということで
合っていますか?下図を見ていると、モデルタブの横に書かれた数字とモデル列の総数が一致していないので追加でご質問させてください。
>ちなみに、モデルの列に数字が入っているものがモデル作成に使われた特徴量セットということで合っていますか?
ご理解の通りです。
>下図を見ていると、モデルタブの横に書かれた数字とモデル列の総数が一致していないので追加でご質問させてください。
モデル列の数字にはアンサンブルモデルの中で使われているモデルもカウントされています。そのためモデルタブの横に書かれた数字と、モデル列の総数が一致していません。
@IJICHI_DR さん
ご回答ありがとうございます。
>モデル列の数字にはアンサンブルモデルの中で使われているモデルもカウントされています。そのためモデルタブの横に書かれた数字と、モデル列の総数が一致していません。
→分かりました。アンサンブルのモデルの特徴量セットに「複数の特徴量セット」と書かれているものですね。用意した特徴量セットのうち何が使われているかということは知ることはできますか?
> 用意した特徴量セットのうち何が使われているかということは知ることはできますか?
1. リーダーボードでアンサンブルモデルの下の「M118+74+77」のように表示されているところにマウスオーバーしてクリックしてください。(マウスオーバーすると、Blended Model IDs 118,74,77 のように表示されます)
2. すると下図のように、そのアンサンブルモデルに使われた単独モデルだけが表示されます(フィルターされる)ので、右側で各々の単独モデルでどの特徴量セットが使われているかを確認できます。
3. リーダーボードの表示を元に戻すときには、下図のオレンジ色のXマークをクリックしてフィルターを解除してください。