Hot-spotに書いてある「特徴量-mi>0.5」とはどういう意味でしょうか
解決済! 解決策の投稿を見る。
miはmissing value、つまり欠損値であることを表しています。
Hotspotでは、行がある特徴量の値をもつことを表す際、計算の都合上[特徴量]-[値]>=0.5と表現します。これは機械学習アルゴリズムが数値以外を扱えないため、ルールの作成に際して「カテゴリ特徴量がある値であるかどうか」という特徴量を作成し、該当すれば1、異なれば0をわりふって扱っていることに起因します。
同様に、数値などの特徴量であっても、欠損値である、に1がついているものを[特徴量]-mi>=0.5と表現します。