転移学習とは何ですか?

機械学習、転移学習は、既存の アルゴリズム 別の(しかし似たような)仕事を引き受けます。 ここでは、転移学習の概要、その利点、および応用について説明します。

転移学習の定義

転移学習では、開発者は特定の目的のために設計されたアルゴリズムを別のタスクに再利用します。 新しいアルゴリズムは、新しい作業を実行するためにすでに知っていることを適用します。

たとえば、犬の写真を識別できるアルゴリズムがある場合、猫も識別できるように簡単に調整できます。 さらにアルゴリズムを構築して、あらゆる動物を識別できるアルゴリズムを作成することもできます。

人工知能 (AI) プログラムは、目的のタスクをより良く、より速く実行するために、さまざまな機械学習アルゴリズムに依存しています。 転移学習は実際には機械学習の一種ではなく、むしろ現場で使用される手法です。 転移学習には機械学習以外にも応用できるものがあります。

機械学習 vs. ディープラーニング: 違いは何ですか?
脳に代表される機械学習

イマジニマ/istock/Getty Images

転移学習の応用

転移学習の最も興味深い展望の 1 つは、 ディープラーニング. の一環として ニューラルネットワーク、転移学習を使用すると、利用可能なデータが非常に少ない場合でも、新しい問題を解決する方法を AI にトレーニングできます。

現実世界の状況は必ずしもデータ ポイントに分解できるわけではないため、 強いAI 過去の経験に基づいて推論を行うことができなければなりません。 転移学習により、汎用人工知能 (AGI)、つまり人間が実行できるあらゆるタスクを実行できる AI の可能性が現実に近づきました。

転移学習の利点

転移学習は、新しいアルゴリズムを最初から作成するよりも魅力的です。 ニューラル ネットワークをトレーニングするには、多くの時間、データ、計算能力が必要になる場合があります。 時間を節約するだけでなく、事前トレーニングされたモデルに基づいて構築することで結果を向上させることができます。

転移学習のおかげで、AI プログラムをトレーニングして、他の方法では実行できないタスクを実行できるようになります。 目的のジョブ用にニューラル ネットワークをトレーニングするのに十分なデータがない場合は、データが豊富にある同様のタスクを実行するようにネットワークをトレーニングできます。 次に、そのモデルに基づいて構築し、限られたデータを使用して新しいタスクに向けてネットワークを正常にトレーニングできます。

転移学習モデルの種類

AI エンジニアが構築できるように、事前にトレーニングされたアルゴリズムが数十種類公開されています。 既存のモデルの一部のみを使用することも、全体を使用することもできます。 あるいは、独自のアルゴリズムを構築して再利用することもできます。

画像分類、物体認識、およびコンピューター ビジョンは、転移学習の一般的なアプリケーションです。 画像認識に使用される転移学習モデルには次のものがあります。 Googleの始まりMicrosoft ResNet. これらのモデルは、 オープンソース そして誰でも利用できるようになります。

転移学習のもう 1 つの有望なアプリケーションは、自然言語処理、特にテキストから音声への翻訳 (またはその逆) です。 GoogleのWord2vecスタンフォードのグローブ は、深層学習言語プロジェクトに適合できる 2 つの公開モデルです。

カフェモデル動物園 は、転移学習プロジェクト用の事前トレーニング済みモデルのリポジトリとその使用方法に関するチュートリアルを備えたコミュニティ運営の Web サイトです。

よくある質問

  • CNN における転移学習とは何ですか?

    畳み込みニューラル ネットワーク (CNN) における転移学習は、機械学習の他の分野と同じプロセスです。 既存のアルゴリズムは、その「知識」を新しい作業に適用するために移行します。 CNN は他の機械学習システムとは構造が異なる場合がありますが、このプロセスは同じように機能します。

  • 転移学習はいつ使用する必要がありますか?

    機械学習プロジェクトのさまざまなポイントで転移学習を使用する必要があります。 1 つは、現在のモデルができることはすべて「学習」したと確信しており、その機能を拡張したい場合です。 もう 1 つの有効な用途は、プロジェクトの範囲や目的が変更された場合です。 転移学習は、完全にやり直すことなくピボットするのに役立ちます。