DataRobotの以下ページの「発展的な手法」の項目にある「Stratified Group k-Fold」はDataRobotの機能上で実装可能なのでしょうか?
(もしくは分類問題であれば自動で採用されていたりするのでしょうか?)
https://www.datarobot.com/jp/blog/summary-of-ml-partitioning-part-2/
分類問題でかつユーザーID重複が存在するケースを扱うことが少なくないため、もし上記実装可能なのであれば有効かと思い質問させていただきました。
※現在はグループパーティションで交差検定を選択して行っています
解決済! 解決策の投稿を見る。
ご質問ありがとうございます。
ご参考にいただいたブログを書いたデータサイエンティストの佐藤です。
ご回答させていただきます。
ブログに記載があるような層化抽出とGroup k-FoldをDataRobotで直接実施いただくことは現状できません。
これはStratified-GroupKFoldには多くのGroup数がなくては意味がなく(Groupを跨がないように各Foldへの割り当てを決めるので層化抽出を実現できるほど細かい必要があるため)、実ビジネスにおいて適用するべきシーンが少ないためです。