キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
コミュニティラジオ「DataRobot充電中」5月のテーマ「データインジェスト」投稿

「with unsupervised learning features」が入っているモデルについての質問

lee seungyong
青色LED

【状況】
最近、DataRobotでモデルを作成する際に、
extreme gradient boosting classifier tree with with unsupervised learning featuresというモデルの方が精度が良く出ているので使おうと思いましたが、
もし、このモデルが教師なし学習したモデルかが心配で使えない状況です。
そのモデルのドキュメントページを見ても、extreme gradient boosting classifier treeに関する説明はありますが、
with with unsupervised feature learningの部分の説明がありませんでした。

【質問】
あの文言が付いているモデルは教師あり学習であってますでしょうか?
それだったら、with unsupervised learning featuresが入っているモデルが普段のモデルと何が違いますでしょうか?

0 件の賞賛
3件の返信3
Miogawa
データサイエンティスト
データサイエンティスト

@lee seungyong さん

Miogawa_0-1616510871756.png

こういうブループリントのことですね。

こちらのブループリントは前処理に教師なし学習を使っているだけで、最終的には教師あり学習でモデルを作成しているのでご安心いただければと思います。

学習データからクラスタリングなどの教師なし学習を実施し、どのクラスターに属するかという情報を付加した後に、教師あり学習にもかけるというステップを内部で自動化しているものとなっています。

精度が出ていたとしても一部でも教師なし学習のモデルを利用したものは利用できない理由はございますでしょうか?

lee seungyong
青色LED

ご回答ありがとうございます。

念のため、確認ですが、
頂いた以下の内容だと“学習データからクラスタリングなどの教師あり学習を実施し”は誤字で”
クラスタリングは教師なし学習で実施する”の認識であってますでしょうか?

「精度が出ていたとしても一部でも教師なし学習のモデルを利用したものは利用できない理由はございますでしょうか?」
 →いいえ、一部の利用であれば大丈夫と思っています。
  利用に懸念があった理由は、そもそも教師あり学習の想定でデータモデリングをしたので、
 もし、そのデータセットから教師なし学習のモデルが出来上がったら、どのような動きをするか、何を注意する必要があるかが私ではすぐに思いつかなかったので、モデルの利用に対しての判断が難しいかったためです。

でも、ご回答の通りに前処理の範囲で教師なし学習をしているのであれば、大丈夫そうです。

ありがとうございます!  

0 件の賞賛
Miogawa
データサイエンティスト
データサイエンティスト

@lee seungyong ご指摘ありがとうございます。

はい誤字でした。

誤 クラスタリングなどの教師あり学習

正 クラスタリングなどの教師なし学習

元の返信も編集で直させていただきました。

ご理解の通り、内部でおこなっている前処理ですので、モデルの利用に対して影響が出るものではございませんので、ご安心いただければと思います。