監視あり vs. 教師なし学習: 違いは何ですか?
監督あり と 教師なし学習 は 2 つの関連するタイプです 機械学習. 監視ありと監視について知っておくべきことはすべてここにあります。 教師なし学習には、それらがどのように関連するか、どのように異なるか、それぞれの利点と制限が含まれます。
全体的な調査結果
教師あり学習
人間による厳しい監視が必要です。
データを分類し、予測を行うために使用されます。
インプットとアウトプットは人間が決めるものです。
R や Python などのプログラムを使用して計算されます。
教師なし学習
人間の関与は最小限で済みます。
データセット内の基礎となる関係を見つけるために使用されます。
出力は未知であり、多くの場合予測不可能です。
アルゴリズムは計算的により複雑です。
人工知能 (AI) プログラムは機械学習に依存しています アルゴリズム 新しい情報を取り入れながら新しいタスクを実行します。 教師あり学習では、人間がラベルを付けたデータのセットを使用して AI をトレーニングします。 教師なし学習では、AI にはラベルのない生のデータが供給され、パターンを識別するために独自にデータを分類する必要があります。
教師あり学習では、誰か (スーパーバイザー) がトレーニング データにラベルを付けてアルゴリズムをテストする必要があるため、より多くの人的労力が必要になります。 したがって、人的ミスが発生するリスクが高くなります。
教師なし学習はより多くのコンピューティング能力と時間がかかりますが、人間の関与が最小限で済むため、教師あり学習よりもコストが低くなります。 とはいえ、出力の精度を人間が検証するのは難しい場合があります。
両方のアプローチが一緒に使用されることもあります。 たとえば、半教師あり学習では、最初のトレーニング セットにはラベル付きデータとラベルなしデータが含まれます。
教師あり学習と教師なしアルゴリズムを組み合わせることができます。 ニューラルネットワーク 達成する ディープラーニング、または独立して学習し、決定を下す能力。
教師あり学習の長所と短所
利点
精度が高い。
教師なし学習よりも透明性が高い。
起こり得る結果はすでに知られています。
短所
新しいデータを独自に分類することはできません。
トレーニングには多くの時間がかかります。
ヒューマンデータの専門家が必要です。
教師あり学習では、AI アルゴリズムにはまず明確なラベル (出力) が付いたトレーニング データ (入力) が与えられます。 次に、AI はトレーニング セットからのラベルのないデータの今後の入力にラベルを付ける方法を学習します。 たとえば、形状を分類するように AI をトレーニングしたい場合は、円、四角形、三角形などのラベル付きの画像を表示することから始めます。
教師あり学習は、どのような入力と出力が予想されるかが分かっている場合に最適です。 これまで見たことのないラベルのない形状が提示された場合、AI はそれをどう処理すればよいのかわかりません。そのため、望ましい結果を得るには、正確にラベル付けされた大量のデータが必要になります。 トレーニング データは、現実世界の設定で確実に機能するように、多様であり、テスト データとは十分に異なっている必要があります。
教師あり学習は、音声、手書き、物体を認識し、詐欺やスパムを検出するように AI をトレーニングするために使用されます。 その他の実用的な用途には、地理地図作成、ニュースのキュレーション、マーケティング、不動産価値の予測などがあります。
教師なし学習の長所と短所
利点
教師あり学習よりも安価です。
人間にはできないパターンを識別できる。
新しい入力はリアルタイムで分析できます。
短所
より多くの計算時間と電力が必要になります。
精度のテストは困難です。
考えられる出力に対する人間による制御が少なくなります。
教師なし学習アルゴリズムは、ラベルのないデータのセット内のパターンを探します。 これらの AI アルゴリズムは、異なるデータ ポイント間の類似点と相違点を比較することで学習します。
たとえば、さまざまな形のラベルのない画像が与えられた場合、教師なし学習アルゴリズムはそれらをサイズまたは色で並べ替える可能性があります。 次に、辺の数に基づいて形状を並べ替えるなど、より具体的な処理が可能になる場合があります。
教師なし学習の出力は予測が難しい場合があり、その精度を検証することも難しい場合があります。 アルゴリズムが具体的すぎる場合、または十分に具体的でない場合、カテゴリが多すぎたり少なすぎたりして役に立たなくなる可能性があります。
教師なし学習は、人間が分類して分析するのに長い時間がかかる生データが大量にある場合に最も役立ちます。 AI へのこのアプローチは、サイバーセキュリティ、コンピュータ ビジョン、品質保証、さらにはヘルスケアにも実際に応用できます。
教師あり学習と教師なし学習をいつ使用するか
教師あり学習は、明確に定義された問題があり、それに対して起こり得る結果がわかっている場合に最も効果を発揮します。 たとえば、教師あり学習アルゴリズムは、メッセージがスパムであるか否かの 2 つの可能性しかないため、スパムの検出に優れています。 出力が数値になることがわかっているため、気温、価格、在庫ニーズの予測にも同じことが当てはまります。
教師なし学習アルゴリズムは、どのような出力が期待されるかわからない場合に役立ちます。 異常は予測できないため、品質保証のための異常の検出が良い例です。 もう 1 つの例は、新しいコンテンツが常に追加されるため、ストリーミング サービスの推奨エンジンです。
半教師あり学習は、問題が明確に定義されているものの、扱うラベル付きデータが限られている場合に適した妥協策です。
よくある質問
-
自己教師あり学習とは何ですか?
自己教師あり学習では、人がエラーを修正しなくても、モデルは独立して機能します。 人間は子供の頃、遊びの時間にこれを行います。 私たちの多くは、木のブロックを使って小さな構造物を建て、その構造物が倒壊する前にどの程度の強度があるかを確認しました。 AI はデータに対して同様のことを行うことができますが、コンピューターは通常、ブロックをブームにするものではなくパターンを探します。
-
教師なし学習を使用するニューラル ネットワークの例は何ですか?
クレジット カード会社は、不正行為の検出や支出習慣を検出するために教師なし学習を使用している可能性があります。 単一の詐欺事件を検出するのは非常に困難ですが、パターンがある場合は検出するのがはるかに簡単です。 人間はパターンを認識することに非常に優れていますが、非常に大規模なスケールではコンピューターの方がより速くそれを実行できます。