キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

機械学習とディープラーニングの違い

ryuji
青色LED

ディープラーニングは機械学習の一部だという資料を先日拝見しました。 しかし、それならば、なぜディープラーニングがブームになっているのでしょうか。 何か従来の機械学習と違う点があるのですか?

0 件の賞賛
3件の返信3
SeijiH
イメージセンサー

ほとんどの機械学習アルゴリズムは、特徴量または列の数が最大で数百のデータセットで適切に動作します。ただし、画像からのような非構造化データセットには、非常に数多くの特徴量が含まれているため、このプロセスが複雑または完全に実行不可能になります。RGB カラーの 800 x 1000 ピクセルの画像 1 枚だけで 240 万の特徴量を含んでいます。従来の機械学習アルゴリズムで処理するにはあまりにも多すぎます。 ディープラーニングアルゴリズムは、ニューラルネットワークと呼ばれるアルゴリズムで、複数の「レイヤー」を通じてデータを実行します。各レイヤーは表現が簡略化されたデータを次のレイヤーに渡します。 ディープラーニングアルゴリズムは、各ニュートラルネットワークレイヤーを通過しながら、画像に関して徐々に多くを学習していきます。早期のレイヤーは、エッジのような低レベルの特徴量を検出する方法を学習し、後続のレイヤーは、それまでのレイヤーからの特徴量をより全体的な表現へと組み合わせます。たとえば、中間レイヤーは、エッジを識別して脚や枝のような写真内のオブジェクトの一部を検出する場合があります。一方、深いレイヤーは、犬や木などのオブジェクト全体を検出します。多数の特徴量を処理できるディープラーニングは、非構造化データを扱う場合に非常に強力です。 専門的になってしまいましたが、こうした理由から特に画像や音声の領域で精度が高く、こういった領域では欠かせない技術となってきたのだと思います。

Miogawa
データサイエンティスト
データサイエンティスト

大量の次元をまとめて処理したりすることに長けているので、画像のピクセルのように高次元かつそれぞれの本質的な意味は同じものに効果を高く発揮する傾向にありますね。ほかにも文章(それぞれは文字や単語という本質的には同じもの)であったり、センサーデータなどでも良い精度が出る傾向にあるかと思います。

逆にそれぞれが本質的にバラバラな顧客データ、行動データ、商品データなどでは普通にツリー系のアルゴリズムのほうがはるかに良い精度になることも多々あります。

ShinichiroOhno
リニアアクチュエータ

下記の絵が何となく役立つと思い投稿させていただきました。
役立たなかったら、ゴメンナサイ。。

  • Deep Learningは、多層パーセプトロンとも呼ばれ、それ単品では技術的な面で、ロジスティック回帰と大きく変わりません。
  • 一方で、パーセプトロンを多層に(Deepに)積み上げることで、「わかりやすさ」を犠牲に、「順応性や予測性能」を獲得しています。

つまり、ベースとなる技術に差は無いのですが、「わかりやすさ」vs「(特に画像や音声において)順応性や予測性能」のどちらを優先するか。という差なのだと思います。

ディープラーニングか否かという議論というよりは、

  • 線形モデル(ロジスティック回帰、線形回帰、lasso、ridge、ElasticNet) が一番解釈しやすく
  • GAMやGA2Mが次に解釈しやすい
  • LightGBMやXGBになると、解釈性を犠牲に、予測性能が高くなり
  • DeepLearningになると、解釈性が厳しくなる。

と徐々に変わっていくので、何を求めるか。次第な気がしました。

一方で、解釈性が高いモデルで、正しく解釈しようとすると、多重共線性・バックドア基準・変数の直交化と言われる概念を気にする必要が出てくるのでモデルを正しく解釈するというのも、その領域特有の難しさがあると思います。
(が、この点については、DataRobotさんのブログで多く解説があるので、そちらを参照いただければと思います。)

https://blog.fiddler.ai/2019/06/a-gentle-introduction-to-ga2ms-a-white-box-model/

model_spectrum-2-1024x293.png