DataRobotコミュニティでは、コミュニティラジオ「DataRobot充電中」を月末の最終木曜日に放送しております。
ラジオ初回放送の書き起こし記事でラジオの雰囲気をチェック。
「AIニュース」では、気になるAI関連のニュースをお届け。「DataRobot Dock」では、DataRobotのベーシックな機能を振り返って便利な使い方を紹介。
「コミュニティテーマ」では、毎月のデータサイエンス・トークテーマを設定し、メンバーの皆様からの様々な「投稿」をお待ちしております。生放送にて、パーソナリティが投稿を読み上げ、そのテーマのトピックについてお話をしたり、ゲストをお迎えしたりする予定です。
7月のトークテーマは「特徴量エンジニアリング」です。こちらの投稿への返信というかたちで、ぜひお気軽に「投稿」お願いします。
過去の放送もご視聴いただけます。
connpass のイベント登録すると放送開始時にリマインダーが送信されます。
解決済! 解決策の投稿を見る。
7月のゲストはDataRobot社内から最近データパートナー戦略を主導している漆原さんです。
今回の投稿テーマは特徴量エンジニアリングですが、DataRobotのデータパートナーに対しての質問などでも大丈夫ですので、投稿お待ちしております!
https://www.datarobot.com/jp/partners/data-partner/
2021/07/09時点のデータパートナーは
となっております。
DataRobotにおける派生特徴量の自動生成について、今実現していること、将来考えていることをざっくり教えてもらえると嬉しいです(1hotとか正規・標準化などML下準備でなく、ビジネス知見につながる方です)
AutoTSが出たとき、ラグ変数を自動生成・試してくれるのを知って感動したものですが、AutoMLの方はあまり知らなくて。個々のブループリントの中でやってることと、その前にデータの分布見てやってることがあるのかと思います。
あと個人的に、「小売業・製造業・金融業とかのドメイン固有で、特徴量のメタ分類?のラベルセットが用意してあって、手持ちの特徴量にラベル貼っとくと、ドメイン知識に根差した特徴量エンジニアリングしてくれる」なんてのがあると素敵だと思うんですが、考えてたりしないでしょうか?(簡単ではないとは思いますが)