AIシステムが人間の創造性を模倣する方法

December 02, 2021
にニュースソフトウェアとアプリ

重要なポイント

DALL・Eは、テキストに基づいて画像を描画できる新しいニューラルネットワークです。
このネットワークは、人間の創造的な成果を模倣できるAIプロジェクトの数が増えている1つです。
専門家によると、AIによって描かれた画像はオリジナルの作品ではありません。

2019年のサラバンド財団のAI-Daロボット。ティム・マーロウへのインタビューと作品の展示。 — アイダ

ピカソ、上に移動します。新しいニューラルネットワークは、テキストに基づいて画像を描画できます。

DALL・E、アーティストのサルバドールダリとピクサーのウォーリーの名前のかばん語は、任意のテキストを取得して、そこから画像を作成できます。このシステムは、何十億もの写真やテキストの例でトレーニングされたニューラルネットワークを使用しています。これは、人間の創造的な成果を模倣することはできますが、複製することはできない、増え続けるAIプロジェクトの1つです。

「自然言語は絶えず進化しており、文脈のニュアンスに大きく依存しているため、絵を描くのに十分な言語を理解するように機械を教えることは非常に重要な成果です。」タマラシュワルツ、ペンシルベニア州ヨークカレッジのサイバーセキュリティ教授は、電子メールのインタビューで述べた。「目撃者の説明に基づいて写真を作成する能力を持っている、珍しい才能の警察のスケッチアーティストを想像してみてください。」

ビッグデータを使用した画像の作成

DALL-Eはによって作成されました AI研究会社OpenAI インターネットから大量のデータを蓄積することで機能します。次に、データは自然言語モデルによって処理され、テキストから画像を生成するようにトレーニングされます。 DALL-Eは、最近リリースされたGPT-3、OpenAIによって作成された言語モデルで、元のテキストパッセージを生成するように求めることができます。 GPT-3は、5兆語のインターネットテキストを使用してトレーニングされており、驚くほどリアルなテキストを作成できます。

「絵を描くのに十分な言語を理解するように機械を教えることは、非常に重要な成果です。」

Michael Yurushkin、創設者兼CTO データサイエンス企業のBroutonLab、電子メールのインタビューで、DALL-Eは「私たちの創造性と想像力をエミュレートすることで人類が成功した数少ないジャブの1つ」であると述べました。彼はさらに、「どのように理解するのが簡単です。 AIは関連データを調べて何かを予測しますが、これまで「聞いたことのない」ものから図面を生成する方法を理解することは、さらに重要です。難しい。"

Schwartzは、AIが情報を作成するのではなく、言語データを取得して画像に変換することに注意してください。

「最初の創造性は、タスクを構築した人間から来ています」とシュワルツは言いました。「AIにはさまざまなデータの組み合わせを試し、いくつかの潜在的な出力から選択するため、AIには「創造性」があります。しかし、人間は出力を調べて、AIに多くの組み合わせから選択する方法を教えています。」

ロボット刑事の仕事？

マシンは、人間のアーティストよりもはるかに高速にこのデータとオブジェクトの組み合わせを試すことができます。シュワルツ氏は、DALL-Eはいつの日か、目撃者の証言に基づいて、スケッチを通じて犯罪現場を再構築しようとしている探偵と提携する可能性があると述べました。

「目撃者が彼らの声明を提供するとき、コンピューターはその話された自然言語情報を取り、シーンの絵、またはシーンの多くの絵を作成することができます」と彼女は言いました。「これらの視覚化を統合して、失われた証拠のより正確な画像を作成することができます。この視覚化は、犯罪前の場所の以前の画像を統合することで強化できます。」

他のいくつかのAI主導のプログラムは芸術を生み出すことができます。例えば、アイダロボットアームシステムと顔認識技術を人工知能と組み合わせて使用し、アートを作成します。システムは、機械の前に置かれた画像を分析できます。この画像は、ロボットの腕の動きを生成するアルゴリズムに入力されます。

ただし、人間の芸術家は、ロボットの大君主が彼らに取って代わることを心配するべきではないと、ラトガーズ大学の芸術人工知能研究所の所長であるアーメドエルガマルは主張しました。ニューヨークタイムズで去年。

「芸術の定義は進化し続けていますが、その核心は人間間のコミュニケーションの一形態です」と彼は書いています。「機械の背後に人間の芸術家がいなければ、AIは、画面上のピクセルや音楽元帳の音符を操作することを意味するかどうかにかかわらず、フォームで遊ぶ以上のことはできません。これらの活動は魅力的で知覚的に興味をそそる可能性がありますが、アーティストと聴衆の間の相互作用なしでは意味がありません。」

DALL-Eの作品を見てみると、AIで作成された画像はアートではないというElgammalの指摘を理解しています。一方で、私が作成できるどのアートよりも優れています。それで、本当に、違いは何ですか？