キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
DataRobot コミュニティ

サンプルサイズについて

Giyu_Tom
NiCdバッテリー

サンプルサイズについて

DataRobotにアップロード可能なデータ量の上限は5GBと伺いましたが、通常利用する際には足かせにならないのでしょうか?保持している全件データは数テラバイトになるケースがあります。全件データを入れて分析するのではなく、ある程度サンプリングし、ピックアップしたデータをDataRobotにアップロードしてモデル作成するのが主流なのでしょうか? よろしくお願いいたします。

0 件の賞賛
1件の返信1
Kei
データサイエンティスト
データサイエンティスト

DataRobotについて申し上げると、実運用フェーズでモデルによる予測スコアリングを行う場合にはデータ制約はございません。5GB制約 (契約によっては10GB制約) はあくまで予測モデリングを行うための学習データに関する制約とご理解ください。予測モデリングにおいては、通常数GBを学習に使えば精度的にはサチる(上限に達し、それ以上向上しない)ことが多いので、心配になることは少ないかと思います。

DataRobotでは「学習曲線」を見て判断していただくことが可能となっております。それ以上データを入れて精度が上がりそうかどうかをみていただくことが可能となっております。