製造業です。
現在、ベテラン作業者に頼っている判断を、
機械学習の予測判断に置き換えれないかと検討しております。
ただ、現在の人の判断というのはベストな判断とは言い切れず、
他の指標を作って、人の判断よりもそちらを予測ターゲットにした方が良いとも思います。
少し具体的な話をすると、理想は
・OEE(設備総合効率)が高く
・全ての製品物流のリードタイムが同じ
になることなのですが、2つの条件を予測ターゲットにすることはできないし、
何かこれらを組み合わせた指標を作って予測ターゲットにしないといけないと思っています。
参考までに何か事例は無いでしょうか。
考え方など、検討を進めていく上で参考となる情報があれば頂きたいです。
解決済! 解決策の投稿を見る。
DataRobot Japanで主に製造業のお客様を担当しておりますデータサイエンティストの山本です。ご質問有難うございます。
頂いたご質問は物流に関する業務判断を予測に基づいてより良いものにしたいという趣旨かと思います。その上で、以下の2つのポイントについてお答えしたいと思います。
1. 現在の人の判断というのはベストな判断とは言い切れず
仮に現在の判断内容をターゲットに予測モデルを構築する場合、非常にラベルがnoisyとなる点が問題として挙げられるかと思います。確かにベテラン作業者の判断が常にベストとは言えないかもしれませんが、これをターゲットに予測を行い、予実の乖離を検証・考察することで現在のベテラン作業者の判断についての問題点、あるいはモデリングするために不足している特徴量などが浮かび上がってくるなど有用なインサイトが得られる可能性があります。
2. 2つの条件を予測ターゲットにすることはできないし、何かこれらを組み合わせた指標を作って予測ターゲットにしないといけないと思っています。
後半で触れられている点はおそらくは物流に関する条件から複数のキーとなる指標を予測するモデルを構築し、それらを同時に満足する条件を逆に求める多目的最適化を想定されているかと思います。これにはいくつかのやり方があります。一つはおっしゃられているようにそれらのターゲットからなる合成変数を作成し、それを予測・最適化するアプローチです。もう一つは、それらを個別に予測するモデルを構築し、API経由でoptunaなどの外部ソルバーと連携することでそれらのモデルを同時に用いて入力条件の最適化を行うアプローチです。いずれの場合も操作自体はそう難しいものではなく、事例としては材料の配合検討などでは例えば良好な引張り強度と降伏強度と伸び率を同時に得られる配合を求める、エネルギー使用量ととある素材の消費量を節減できる操業条件を求めるなどに用いるなどが挙げられます。一方で、いずれのアプローチをとる場合でも複数のターゲットをどのように優先順位付けして定式化するかという点が必要になってきます。
@YuyaYamamoto さま
ご回答ありがとうございます。
「個別に予測するモデルを構築し、API経由でoptunaなどの外部ソルバーと連携」
というところが面白いなと思いました。
具体的な事例が載っている資料、サイト等をご存じではないでしょうか。
DataRobotのPath Finderにもしかしたら、類似の事例もあるかもしれませんので是非チェックしてみてください