新しい技術はガジェットにあなたの会話を理解させることができます

重要なポイント

  • 新しいテクノロジーは、人間の発話をよりよく理解するコンピューターにつながる可能性があります。
  • MicrosoftとNVIDIA 最近発表された 言語を解釈するための新しいAI主導の方法。
  • 量子コンピューティングは、言語処理の分野を進歩させる別の方法かもしれません。
人々のグループと話しているヒューマノイドロボット。

グレムリン/ゲッティイメージズ

最近では、コマンドを実行するためのスマートガジェットがたくさんありますが、会話音声を理解するコンピューターからはまだ遠いです。

MicrosoftとNVIDIA 最近発表された 電子機器とのチャット方法を変える可能性のある音声を解釈するための新しいAI主導の方法。 これは、自然言語処理(NLP)とも呼ばれる、コンピューターが音声を理解する方法を変える動きの一部です。

「NLPを動かすモデルはますます大きくなり、より高度になり、人間の理解に近づいています」とAIの専門家 ハミッシュオギルビー メールインタビューでLifewireに語った。

「大きな進歩の1つは、NLPが単純なキーワードを超えていることです。 今日では、検索結果を取得するために1つまたは2つのキーワードを入力または話すことに慣れているかもしれませんが、新しい自然言語処理モデルでは、コンテキストを使用してより豊富な結果を提供します。」

チャットボット

NVIDIAとMicrosoftは協力して、 Megatron-Turing自然言語生成モデル (MTNLG)は、デュオが「これまでにトレーニングされた最も強力なモノリシックトランスフォーマー言語モデル」であると主張しています。 AIモデルはスーパーコンピューターで実行されます。

しかし、研究者は、MTNLGモデルが人間の音声サンプルの山をくまなく通過するときに人間のバイアスを拾い上げたことを発見しました。

「巨大な言語モデルは言語生成の最先端を進んでいますが、バイアスや毒性などの問題にも苦しんでいます」と研究者たちは次のように書いています。 ブログ投稿. 「MT-NLGでの私たちの観察は、モデルがそれが訓練されたデータからステレオタイプとバイアスを拾い上げるということです。」

スピーチをよりよく理解するコンピューターは、Alexaのようなスマートスピーカーを改善するだけではない、とOgilvyは主張します。 アマゾンのようなテキストベースの検索ウェブサイトも、入力されたクエリをよりよく理解します。

「グーグルはここで明らかなリードを持っているが、NLP技術はどこにでもあるだろう」とオグルヴィは言った。 「テキストベースおよび音声ベースの検索の場合、NLPはテキストだけでなくそれ以上のことを理解するため、ユーザーはより説明的になる可能性があります。 より良い結果を返すためにあなたが探しているものの文脈を理解しています。」

量子チャット?

量子コンピューティングは、NLPの分野を前進させる1つの方法かもしれません。 水曜日に、会社は CambridgeQuantumがlambeqを発表、それはNLPの最初の量子ツールキットであると主張しています。

「... NLPはテキスト以上のものを理解します。 より良い結果を返すためにあなたが探しているものの文脈を理解しています。」

同社によれば、このツールを使用すると、量子コンピューターで実行される量子回路を使用して、自然な言語で文章を翻訳できます。 量子コンピューティングは、重ね合わせ、干渉、エンタングルメントなどの量子状態の異常な特性を使用して計算を実行するタイプの計算です。

「量子コンピューターがNLPを処理する方法は、従来のマシンとは大きく異なります。 実際、NLPは「量子ネイティブ」です。」 ボブ・クックケンブリッジクォンタムのチーフサイエンティストは、電子メールのインタビューでライフワイヤーに語った。 「これは、数年前に私たちが発見したことによるものです。文と意味を支配する文法は、量子コンピューターのプログラミングに使用される数学と非常によく似た構造をとっています。」

Coecke氏は、量子NLPは、より優れた音声アシスタントと翻訳ツールにつながる可能性があると述べました。

音声認識を改善するための別の有望なアプローチは、 データ中心のAIは、今年初めに発売されました. データ中心のAIは、アルゴリズムを改善するのではなく、モデルのトレーニングに使用されるデータの品質に重点を置いています。

「データ中心のアプローチは、AIタスク機能の向上という点で、従来のモデル中心のアプローチよりも効率的であることが証明されています。」 データサイエンティスト、Zac Liu Hypergiant社で、Lifewireに電子メールのインタビューで語った。 「要するに、データサイエンティストがNLPデータを改善するとき、それは彼らがより良いNLPモデルとより良いNLP機能を持つことをほぼ保証します。」

ロボットと対話する子供。

ウォンリー/ゲッティイメージズ

次のステップは、ビデオを視聴してそのビデオのテキスト要約を作成するようにAIモデルをトレーニングするなど、コンピュータービジョンモデルをNLPと統合することです。

「この進歩の応用は、ヘルスケアから、放射線フィルムを読むことまで、無限である可能性があります。 家、衣服、宝飾品、または同様のアイテムを設計するための予備診断を提供します」と彼は言いました。 追加した。 「顧客は要件を口頭または書面で説明することができ、この説明はより良い視覚化のために画像またはビデオに自動的に変換されます。」