いつもお世話になっております。
時系列機能を使ってモデル作成を行おうとして、機能を触っています。
モデル作成時に特徴量の派生ウィンドウを「35日」に設定したにもかかわらず、テスト予測を行う際に利用する履歴行が「42日」になっています。
どうしてこのような差が生まれるのでしょうか?
解決済! 解決策の投稿を見る。
DataRobotのデータサイエンティストの畑です。ご質問ありがとうございます。
ご指摘のように「予測を作成」で表示される「履歴行」は特徴量の派生ウィンドウとは必ずしも一致せず、周期性が検出されている場合、特徴量の派生ウィンドウに「検出された最も長い周期性」を足した値となります。
いただいているケースは「履歴行:-42~0 日」となっていますが、このプロジェクトの特徴量の派生ウィンドウは「-35から0 日」で、別途7日間の周期性が検出されているとプロジェクトの派生ログから分かります。
周期性を足す理由ですが、周期ごとの集計値の差分を取るような派生特徴量を作成したいからということになります。具体的には「売上 (7 day diff) (35 day min)」などです。これは7日前の値との差を取り、その差の35日分から最小値を取る派生特徴量です。これだと42日分必要になります。
ありがとうございます。理解できました。