初歩的な質問で恐縮ですが,モデルの学習・予測時に利用される特徴量の個数についてご存じの方は教えていただければ幸いです。
アップロードした特徴量が仮に1,000個ある場合,「DataRobotで削減された特徴量」では特徴量が最大100個まで削減されるので,学習・予測時に使用される特徴量数は100になると思います。
この特性から,DataRobotで学習・予測する際に参照される特徴量の個数上限は100になると勝手に思い込んでいます。しかし,特徴量セットを「元の特徴量」にして学習・予測した場合は,1,000特徴量すべての情報が加味されたモデルが学習されるのでしょうか?
DataRobotで学習・予測を行う際に利用可能な特徴量の個数に上限があれば教えていただきたいです。
解決済! 解決策の投稿を見る。
@rhira 様
ご質問ありがとうございます。
DataRobotの畑です。
一般的な機能としては、ドキュメンに記載がありますように20000列まで学習・予測可能になります。
https://docs.datarobot.com/ja/docs/data/import-data/file-types.html#general-requirements
> しかし,特徴量セットを「元の特徴量」にして学習・予測した場合は,1,000特徴量すべての情報が加味されたモデルが学習されるのでしょうか?
こちらはその通りです。その情報が加味されたモデルが作成され、予測としても利用可能です。
機能としてはそうなのですが、本質問の意図を考えると、非常に多くの列をもったデータを使って学習・利用をお考えなのでしょうか?もしご利用時に気になることがございましたら弊社担当者にぜひお問い合わせください。
Hata様
ご回答いただきありがとうございます。
回答いただけたことでDataRobotで利用可能な最大列数及び,学習時の列の扱いについて非常にクリアになりました。
機能としてはそうなのですが、本質問の意図を考えると、非常に多くの列をもったデータを使って学習・利用をお考えなのでしょうか?もしご利用時に気になることがございましたら弊社担当者にぜひお問い合わせください。
今回は機能面で気になったので質問させていただいた次第です。過度に列数が多い事態に対処する必要がある場合は,また相談させていただけると幸いです。