機械学習と深層学習: 主な違いについて説明
公開: 2024-11-20機械学習と深層学習はしばしば同じ意味で使用されますが、これらは人工知能の 2 つのサブドメインを指します。これらは、データ分析に対する異なる (ただし関連する) アプローチを表しています。ディープラーニングは機械学習のサブセットです。これらの区別は重要であり、データ分析ツールやサービスを評価するとき、データ問題を解決するためにどのアプローチを取るかを決定するとき、またはエンジニアやドメインの専門家と深い会話をするときなど、技術的なトピックについてコミュニケーションするときに特に重要になります。
目次:
- 機械学習とは何ですか?
- ディープラーニングとは何ですか?
- 機械学習と深層学習
- ML とディープラーニングの応用
- ML とディープラーニングの利点
- ML とディープラーニングの課題
- 結論
機械学習とは何ですか?
機械学習 (ML) は人工知能 (AI) のサブセットです。この名前は、マシン (通常はコンピューターまたはコンピューターの組み合わせ) が自動的な数学的および統計的手法を適用して、データからパターンを発見または学習するすべてのシステムを指します。
ML は、インテリジェントで独立したシステムを構築することを目的としています。つまり、ハードコードされたコンポーネントを少なくし、人間とのやり取りを減らすことを目指して、データからパターンを学習して改善します。機械学習の分野は 1960 年代から存在しており、それ以来開発および研究されてきた多数のアルゴリズムと技術があります。
機械学習の種類
さまざまなタイプのシステムが ML として認定されます。最も一般的なものは次のとおりです。
- 教師なし学習モデルでは、人間による指導がほとんどまたはまったく行われずに非構造化データが使用されます。
- 教師あり学習モデルにはガイダンスが必要で、データ形式や構造に関する入力など、人間の入力に依存します。
- 半教師ありモデルは、少量の構造化データからガイダンスを受け取り、そのデータからの洞察を使用して、より大きな非構造化データのプールでの精度を調整します。
- 強化モデルは、環境と対話することで意思決定を学習します。これらのモデルはアクションを実行し、肯定的または否定的なフィードバックを受け取り、望ましい目標を達成するために動作を調整します。
- 自己教師ありモデルは、生の非構造化データを使用して独自のラベルを作成します。
ディープラーニングとは何ですか?
ML の最近の進歩は、主にディープ ラーニングとして知られる ML の特殊なサブセットによってもたらされました。ディープ ラーニングは、ディープ ニューラル ネットワークと呼ばれるニューラル ネットワークのサブセット上に実装される ML システムのサブセットを指します。ディープ ニューラル ネットワークは、大規模で高度に相互接続され、処理に使用できるニューロンの層が多数あるニューラル ネットワークです。
深層学習ネットワークの種類
他の高度な ML 技術と同様に、深層学習システムは教師ありまたは教師なしの方法で学習できます。これらは、1 つだけを使用して構築することも、2 つ以上の高度なニューラル ネットワーク アーキテクチャを組み合わせて構築することもできます。フィードフォワード ニューラル ネットワーク (FNN) などの一部のネットワークは、ニューロン層間でデータを一方向にのみ移動します。対照的に、リカレント ニューラル ネットワーク (RNN) などの他のネットワークは内部ループを形成し、副作用としてメモリがあるかのように動作する可能性があります。
畳み込みニューラル ネットワーク (CNN) などの高度なアーキテクチャは、NN の入力でデータの一部がいつどのように繰り返されるかを構造化します。これにより、ネットワークがデータ内のどこで関係を検索する必要があるかについてのヒントが得られます。
複数のニューラル ネットワークを並行して開発でき、各サブネットワークは問題空間のサブセットに特化します。たとえば、敵対的生成ネットワーク (GAN) は、互いに競合しようとするモデルをトレーニングする傾向があり (1 つはデータセットに属するはずの新しいデータを偽装し、もう 1 つは不正行為を検出するためにトレーニングする)、2 つのタワー アーキテクチャが連携して学習します。データセットの、深く相互接続されているが異なる 2 つの部分についてです。
深層学習システムを構築する際には、より複雑なアーキテクチャの組み合わせも一般的に一緒に使用されます。これらのアーキテクチャは、変圧器や整流器ユニットなどの特殊なニューロン構造を使用して拡張したり、デシジョン ツリーなどの他の機械学習システムをエミュレート、実装、強化したりするために使用できます。
機械学習と深層学習: 主な違い
ディープラーニングは機械学習のサブセットであり、いくつかの特定の制約と利点が組み込まれています。機械学習は一般的な用語であり、データを分析し、データ内のパターンを検出するための幅広いオプションとトレードオフをカバーします。この表は違いを強調しています。詳細については以下をご覧ください。
機械学習 (ML) | ディープラーニング(DL) | |
柔軟性 | 一般的な;データから学習するためのさまざまな手法を包含する AI のサブセットであり、実装には多くのオプションがあります。 | ニューラル ネットワークのみを使用して実装されています。深く多層のニューラル ネットワークとそれに適した技術に焦点を当てた、ML の特殊なサブセット。 |
人間の関与 | 構造化データを処理し、人間による大幅な前処理を必要とするアルゴリズムから、完全に独立して動作できるアルゴリズムまで、あらゆる範囲のアルゴリズムをカバーします。 | 通常は、非常に大規模なデータ セットに適用されます。モデルは主に非構造化データを操作し、人間による処理やキュレーションへの依存度が低くなります。 |
範囲 | 線形回帰、デシジョン ツリー、クラスタリングなどの従来のアルゴリズムを含む、より広い範囲。 | ML 内で焦点を絞り、大規模なデータと複雑なタスクの処理に特化します。 |
テクノロジーの基礎 | デシジョン ツリー、サポート ベクター マシン、アンサンブル法などのさまざまなアルゴリズムを採用します。 | 多くの層を備えたディープ ニューラル ネットワークと、強化学習やバックプロパゲーションなど、ニューラル ネットワークでの動作を特に目的とした技術を利用します。 |
応用分野 | アルゴリズムとコンピューターを使用してデータ内のパターンを自動的に検出できるあらゆるアプリケーション分野。 | 汎用テキストや画像の分析、現実世界の問題解決、生成タスクなど、大量の非構造化データからの複雑なパターン認識に依存するタスクに特化しています。 |
解釈可能性 | 人間にとって理解しやすく解釈しやすい方法で構築できます。はるかに長い間研究されており、よく知られた特性があります。 | 通常は非常に正確ですが、人間が追跡したり説明したりするのははるかに困難なアクションを実行します。 |
例 | スパム検出、推奨システム、顧客のセグメンテーション。 | 自動運転車、仮想アシスタント (Siri など)、顔認識システム。 |
深層学習は大規模なデータセットに依存します
深層学習技術は多くの場合、非常に大規模なデータセットへのアクセスに依存しますが、ML システムは利用可能なデータがほとんど、またはまったくない場合に役立ちます。また、熟練した専門化された人間の入力が利用可能な場合、ML はどの深層学習システムよりも明示的にそれを活用できます。
一般に、ML システムはより広範囲の技術をカバーし、より柔軟な実装範囲を特徴とします。ディープ ラーニングは、ディープ ニューラル ネットワークやそのサポート アルゴリズムなど、大規模なデータ セットの操作に適した手法のみに焦点を当てています。
ML は最適化と理解が容易になる
ML はその範囲がはるかに広いため、デシジョン ツリー、クラスタリング、さまざまな種類の回帰など、データ処理に対する従来のよく研究されたアプローチを数多くカバーしています。何十年も研究に費やされてきたこれらのアプローチの多くには、パフォーマンスやその他のトレードオフが組み込まれていることがよく知られています。
これらは、ニューラル ネットワークに依存した深層学習システムよりも柔軟な実装を提供し、リソースとコストの効率が高くなります。ディープ ラーニングは通常、リソースを大量に消費し、コスト スケールの上限に位置します。
ディープラーニングはより強力ですが、一般的ではありません
深層学習システムは、より狭い範囲と焦点を当てたアプリケーションに最適です。たとえば、利用可能な関連データの大規模なデータ群の問題、ニューラル ネットワークの長時間のトレーニングに十分な時間が必要な場合、トレース機能よりも実行の精度が優先される場合などです。システムが何をしているのか、そしてその理由を正確に説明します。
ML システムは、利用可能なデータが少ない場合、システムが人間にとって理解しやすい場合、高精度がそれほど重要ではない場合など、機械が自動的にデータ内のパターンを見つけて適用できるあらゆる問題に適用できます。
ML とディープラーニングの応用
ML ベースの深層学習システムとアプリケーションは、私たちの生活のさまざまな側面に継続的に組み込まれています。以下によく知られた例をいくつか示します。
スパム検出
最も初期の大規模な機械学習アプリケーションの 1 つは、スパム電子メール メッセージを検出してフィルタリングすることでした。この問題は、応用機械学習にとって理想的な問題です。
大量の電子メールがあり、それらは明確に定義された構造を持っています。不要な電子メールをスパムとしてマークするのは簡単なので、「スパム」または「ハム」(ハムはスパムの反対です)としてマークされた電子メールの大規模なデータ セットを作成することは難しくありません。このデータに基づいて分類システムを簡単に構築でき、インターネット規模でスパムメールを迅速にフィルタリングするために使用できます。
スパム検出は、深層学習システムが(まだ)従来の ML 技術ほど解決に適していない一例です。大幅な改善にもかかわらず、スパムの最新の進歩に合わせて深層学習システムを最新の状態に保つのに必要な時間とコストは、まだその精度の向上に見合うものではありません。深層学習システムは一般に ML パイプラインを最適化するために使用でき、大規模なスパム検出 ML トレーニング システムはその目的のためにそれらを統合する場合があります。
レコメンドシステム
電子商取引ストア、メディア ストリーミング サービス、オンライン マーケットプレイスは、ユーザーがどこにお金を使うべきかを推奨できるかどうかに依存するサービスの例のほんの一部です。レコメンデーション システムは、機械学習に適した問題のもう 1 つの典型的な例です。
ユーザーがメディアを消費したりオンラインで購入したりすると、基盤となるシステムは明確なシグナル (ユーザーが消費したのか、ユーザーが消費しなかったのか) を持つ大規模なデータ セットを構築できます。この問題には、深層学習とより伝統的な ML 技術の両方を適用できます。大規模なレコメンダー システムでは、両方のアルゴリズム タイプを賢く組み合わせて使用します。
経路探索と自動運転車
ダイクストラのアルゴリズムや A* アルゴリズムなどのよく知られたルート検索手法に基づいて構築された従来の教師なし ML アルゴリズムは、道路地図上の 2 点間の最適なパスを見つけるのに最適です。これらのアルゴリズムは、地図、交通量、その他のデータを事前に調査し、パターンを発見し、現実世界の状況に基づいてリアルタイムで調整することができ、非常にうまく機能します。
ただし、実際に 2 点間を車で移動する場合、処理する情報の量と複雑さは従来の ML 技術では対応できないほど多すぎます。自動運転システムは、ほぼ独占的にディープラーニング技術を使用して構築されています。
ML とディープラーニングの利点
機械学習と特殊な深層学習システムは、うまく使用すると変革をもたらします。人間の専門家を増強して、出力をより速く、より影響力があり、より低コストで、より高品質に、または上記すべてを組み合わせたものにすることができます。
ML による速度、スケール、コストの向上
ML システムは専門家の作業とプロセスの一部またはすべてを置き換えることができ、タスクを完了するために必要な時間と注意力を削減できます。その結果、彼らの研究は以前よりもはるかに高い規模で適用できるようになりました。
たとえば、MRI スキャンの異常を評価する技術者のチームは、それぞれ 1 時間に 6 回、または 1 週間に約 200 回のスキャンを評価できる可能性があります。同じチームが代わりに、分析の最も日常的な部分を実行する一連の機械学習アルゴリズムのトレーニングに集中した場合、アルゴリズムは数分の 1 のコストで週に数千件の MRI スキャンを評価できるようになります。
ディープラーニングによるより高い効果と品質
深層学習システムが適している問題に適用すると、ML を組み込んだシステムを強化し、全体的な品質と影響力を高めることができます。
上記の例を続けると、深層学習システムは、十分な量の MRI スキャンがある状況に適用される可能性があります。スキャンの量が十分であり、深層学習システムの構築に十分な時間とリソースを費やした後であれば、識別するように訓練された狭い範囲の異常を識別する点で、専門家よりも優れた仕事をする可能性があります。
これらのシステムは、最大限の効果を得るために大規模に導入でき、無視できるコストで個々の MRI スキャンを処理できます。 MRI 技師やその他の専門家の分析により、異常または例外的なケースに対する深層学習システムの出力が強化され、さらに高い総合品質が達成されます。
ML とディープラーニングの課題
多くの種類の作業は、応用 ML や深層学習から多大な恩恵を受けることができますが、このような AI をシステムに組み込むのは難しい場合があります。ここでは、最も一般的な課題や障害をいくつか紹介します。
コストと精度のトレードオフ
より大規模で高価なコンピューター システムでは、より高度な ML および深層学習アルゴリズムをより高速かつ大規模に実行できます。その結果、システムに費やされる金額と、ハードウェアおよびそれを組み立てるためにより有能な専門家を雇用するという点での効果との間には、トレードオフが生じます。 ML および深層学習システムの限られたリソースを効果的に利用するには、細心の注意が必要です。
大規模なデータセットへの依存
一般に ML、特に深層学習は、トレーニング段階で継続的に更新される大規模なデータセットにアクセスできることに依存します。アルゴリズムの良さは、トレーニングに使用されるデータの品質と量によって決まります。大規模なデータ セットを効果的に管理することは難しく、特定のデータ セットに ML を最も効果的に適用するには時間と創意工夫が必要です。
正確さと明瞭さのトレードオフ
深層学習システムは、同等のパラメーターを使用して構築された他の ML システムよりもはるかに正確になるようにトレーニングできます。精度には代償が伴います。システムは大規模なデータを操作し、現実的な時間枠では人間が理解することが不可能な高度なアルゴリズムを使用します。
従来の ML アルゴリズムは、はるかに長い間研究されており、より明確に定義された特性を備えており、人間が理解しやすい方法で動作するように誘導できます。 ML と深層学習の実装では、正確さと明瞭さの間の理想的なトレードオフを見つける必要があります。
技術的なバイアスと分散の間のトレードオフ
ML システムは、アルゴリズムの複雑さ、トレーニング専用のリソース、トレーニングに使用されるデータの量が増加するにつれて、トレーニング データの特性についてますます学習できるようになります。この現象は(技術的)バイアスと呼ばれます。非常に偏ったシステムは、トレーニングに使用したものと同様のデータを表示する場合、非常に正確になります。
バイアスが高いと、分散が低すぎるという代償として、システムはトレーニングで見たものと大きく異なる新しいデータにはあまり反応しなくなることがよくあります。偏りも分散も低い理想的なシステムを構築するのは困難です。特定のアプリケーションのバイアスと分散の間の正しいバランスを見つけることは、よく研究され確立された従来の ML アルゴリズムほど簡単です。より複雑な深層学習アルゴリズムではこれを達成するのが難しい場合があります。
結論
ディープ ラーニング システムは、深い多層ニューラル ネットワークを活用して大規模なデータ セットの複雑な問題に取り組む、ML の特殊なサブセットです。優れた精度と処理能力を提供しますが、解釈可能性の低下、広範なデータへの依存、最適化の柔軟性の制限などのトレードオフが伴います。
対照的に、従来の ML 手法は多くの場合、コスト効率が高く、導入が容易で、より透明性が高く予測可能な結果を提供します。また、特定のタスクに合わせて微調整するのも簡単です。どちらのアプローチにも明確な長所と短所があり、現実世界のシナリオで効果的に実装するには、その用途と制限を理解することが重要です。