キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

Hot-spotの記載について

DRCommunityJP
モデレータ
モデレータ

Hot-spotに書いてある「特徴量-mi>0.5」とはどういう意味でしょうか

0 件の賞賛
1件の返信1
Isao
データサイエンティスト
データサイエンティスト

miはmissing value、つまり欠損値であることを表しています。

Hotspotでは、行がある特徴量の値をもつことを表す際、計算の都合上[特徴量]-[値]>=0.5と表現します。これは機械学習アルゴリズムが数値以外を扱えないため、ルールの作成に際して「カテゴリ特徴量がある値であるかどうか」という特徴量を作成し、該当すれば1、異なれば0をわりふって扱っていることに起因します。

同様に、数値などの特徴量であっても、欠損値である、に1がついているものを[特徴量]-mi>=0.5と表現します。