キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 
DataRobot コミュニティ

データ品質評価の外れ値について

murakami
青色LED

データ品質評価の外れ値について

表題の件について、下記2点ほどご確認いただけますでしょうか。

①外れ値をDRのUI上で除外することは可能か

外れ値が存在する特徴量一覧はソートできそうですが、各特徴量内の外れ値をデータのみを除外することが管理画面上でできるのかご教示いただきたいです。

 

②DR上で判別してる外れ値の条件について

不可能な場合、外れ値算出の条件をご教示いただきたいです。四分位範囲(IQR)を利用したものでしょうか。

有用性の高い特徴量に関してはモデル作成前に外れ値を除外してモデリングしようと思い確認です。

0 件の賞賛
2件の返信2
Xavier_Fontaine
データロボット同窓生

@murakami 
こんばんは!ご質問ありがとうございます!

①に関しましては、DataRobotの外で処理を行う必要があります。

②に関しましては、外れ値の検出を行うために、Ueda's Algorithmを使用しています。

Ueda's Algorithmに関する参考情報も共有します(英語になりますが):https://jsdajournal.springeropen.com/articles/10.1186/s40488-015-0031-y

よろしくお願いいたします。

こちらご回答ありがとうございます!助かりました!

 

0 件の賞賛