キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

データクレンジングについての質問

1040727
NiCdバッテリー

初歩的な質問ですみません。
データ投入後、データの型を変えたいのですがAutoML上ではどこまで出来ましたでしょうか。以下の例は可能でしょうか、それとも前処理でこちら側でデータ型を定義しておく必要がありますでしょうか。

(例)IDが「数値」扱いになっておりカテゴリ(?)にしたい、生年月日日付が「数値」認識しているため日付認識させて年齢を出したい

ラベル(1)
1件の返信1
Isao
データサイエンティスト
データサイエンティスト

ご質問ありがとうございます。

>IDが「数値」扱いになっており「カテゴリ」扱いにしたい

ID特徴量をモデリングに使うべきかは一考の余地がありますが、ご回答としてはAutoML内のデータ投入後に対象の特徴量を選んだのちに「特徴量の型変換」のタブに移動頂き、数値カテゴリで変換を実行することで対応できます。詳細はSaaSのお客様であればこちらにドキュメントがございます。(オンプレのお客様であれば「特徴量の変換」をDR内のヘルプドキュメント内で検索ください。)

Isao_0-1614576579687.png

>生年月日日付が「数値」認識しているため日付認識させて年齢を出したい

こちらについては残念ながらお客様の方で年齢を算出する作業が必要です。予測したい目的変数に合致するタイミング(イベント発生時点)に注意しながら、ご年齢の算出をして頂く必要があります。

DataRobotで日付として認識させたいだけでしたらこちらのフォーマット(左記はSaaS版のリンクです。オンプレ版のお客様は「データセットの要件」で検索下さい)でデータを入れて頂ければ実現はできます。しかし、この場合はあくまで生年月日の年・月・日などが考慮されるだけで、イベント発生時の年齢とは別の意味になる点をご注意頂ければと思います。

上記、ご参考になりましたら幸いです。