個々の案件を個別にしっかり見ていかなくても、出来合いのデータマートのユーザプロファイル情報を使って、シードとなるカスタマのIDと類似したユーザを探し出せればそれでOKというユースケースは結構あるように思います。
そのようなlook-alikeモデリングをDRでやろうとした場合、どのようにやるのがベストでしょうか。何かおすすめの方法はありますか?
解決済! 解決策の投稿を見る。
@kyosuke さん、
現時点だと2つのアプローチが個人的にはあるかなと思います。
一つはDataRobotの異常検知アルゴリズムを利用して、Look-alikeを正常とした異常検知モデルを作成し、異常値スコアが小さいものはLook-alikeと判定する
もう一つはシンプルに教師あり学習に放り込む形で、半教師ありで回していくというアプローチがあるかと思います。こちらのほうが、手がかかるのと、イテレーションの回数に感覚が必要ですが、うまく分離できやすいという特徴はあります。
手軽さなら異常検知アルゴリズム、手間をかけるなら半強師ありというアプローチが良いかと思います。
なるほど、反教師ありしか考えられていませんでしたが、確かに異常検知も使えそうですね。参考になりました、ありがとうございます!