幻覚がAIがあなたをよりよく理解するのにどのように役立つか
- 新しい機械学習モデルは、翻訳を支援するために、ある言語での文の外観の画像を幻覚化します。
- VALHALLAと呼ばれるAIシステムは、人間が言語を知覚する方法を模倣するように設計されました。
- 新しいシステムは、AIを使用して言語を理解する動きの一部です。
単語を翻訳しながら写真を視覚化する人間の方法は、人工知能(AI)があなたをよりよく理解するのに役立つ可能性があります。
新しい機械学習モデルは、ある言語で文がどのように見えるかのイメージを幻覚化します。 最近によると 研究論文、この手法では、視覚化やその他の手がかりを使用して翻訳を支援します。 AIを使用して言語を理解することは成長している動きの一部です。
「私たち全員がわずかに異なるトーンとスタイルを持っているので、人々が話したり書いたりする方法はユニークです。」 ベス・カドニー研究に関与していなかったメアリービル大学のデータ分析の教授は、電子メールのインタビューでライフワイヤーに語った。 「非構造化データを扱うようなものであるため、コンテキストを理解することは困難です。 ここで自然言語処理(NLP)が役立ちます。 NLPは、機械の読解を使用したコミュニケーション方法の違いに対処するAIのブランチです。 AIのブランチとしてのNLPの主な違いは、私たちが話したり書いたりする単語の文字通りの意味だけに焦点を当てているわけではありません。 意味を見ている」と語った。
アリスに聞いてください
新しいAIシステム、 ヴァルハラと呼ばれるMIT、IBM、カリフォルニア大学サンディエゴ校の研究者によって作成された、人間が言語を知覚する方法を模倣するように設計されました。 科学者によると、マルチメディアなどの感覚情報を、画像付きのフラッシュカードなどの新しくてなじみのない単語と組み合わせて使用すると、言語の習得と保持が向上します。
これらのシステムは、現在トレーニングを受けており、特定の会話が可能なチャットボットの能力を高めています...
チームは、彼らの方法がテキストのみの翻訳よりも機械翻訳の精度を向上させると主張しています。 科学者たちは、ニューラルネットワークモデルの一種である2つの変圧器を備えたエンコーダ-デコーダアーキテクチャを使用しました 言語など、キーワードやセマンティクスに注意を払うことができるシーケンス依存データに適しています 文。 一方のトランスフォーマーは視覚的な幻覚を生成し、もう一方のトランスフォーマーは最初のトランスフォーマーからの出力を使用してマルチモーダル変換を実行します。
「実際のシナリオでは、ソースセンテンスに関するイメージがない可能性があります。」 ラメスワルパンダ、研究チームのメンバーの一人は、 ニュースリリース. 「つまり、私たちの動機は基本的に次のとおりです。推論中に外部画像を入力として使用する代わりに、 機械翻訳を改善するために、視覚的な幻覚(視覚的なシーンを想像する能力)を使用します システム?」
AIの理解
かなりの研究がNLPの進歩に焦点を合わせている、とCudneyは指摘しました。 たとえば、ElonMuskは共同設立しました GPT-3に取り組んでいるOpenAI、人間と会話でき、PythonとJavaでソフトウェアコードを生成するのに十分な知識があるモデル。
GoogleとMetaは、システムとの会話型AIの開発にも取り組んでいます LAMDAと呼ばれる. 「これらのシステムは、現在トレーニングを受けており、 特定の会話。これにより、カスタマーサポートやヘルプデスクの顔が変わる可能性があります。」 言った。
アーロン・スロマンAI技術会社である共同創設者のCLIPrは、GPT-3のような大規模な言語モデルは、人間のフィードバックに基づいてテキストの要約を改善するために、ごくわずかなトレーニング例から学ぶことができると電子メールで述べました。 たとえば、大規模な言語モデルに数学の問題を与え、AIに段階的に考えるように依頼することができると彼は言いました。
「大規模な言語モデルの能力と制限についてさらに学ぶにつれて、より多くの洞察と推論が大規模な言語モデルから抽出されることが期待できます」とSloman氏は付け加えました。 「また、モデラーが関心のある特定のタスクのためにモデルを微調整するためのより良い方法を開発するにつれて、これらの言語モデルがより人間らしいプロセスを作成することを期待しています。」
ジョージアテックコンピューティング教授 ディイヤン 電子メールのインタビューで、私たちの日常生活で自然言語処理(NLP)システムの使用が増えると予測されました。 NLPベースのパーソナライズされたアシスタントは、電子メールや電話、旅行中の情報探索のための知識豊富な対話システム、または 健康管理。 「タスクを実行し、責任を持って偏見のない方法で人間を支援できる公正なAIシステムと同様に」とYang氏は付け加えました。
GPT-3やDeepTextなどの数兆のパラメーターを使用する巨大なAIモデルは、すべての言語アプリケーションの単一モデルに向けて引き続き機能すると予測されています スティーブン・ヘイジ、Dialexaの機械学習エンジニア、電子メールインタビュー。 彼はまた、音声コマンドによるオンラインショッピングなど、特定の用途向けに作成された新しいタイプのモデルもあると述べました。
「例としては、「このアイシャドウを真夜中の青でハローを増やして見せて」と言っている買い物客が、その適用方法をある程度制御して、人の目の色合いを示すことができます」とHage氏は付け加えました。