Ny teknologi kan lade gadgets forstå dine samtaler

December 02, 2021
ISmart Og Forbundet Liv Nyheder

Nøgle takeaways

Nye teknologier kan føre til computere, der bedre forstår menneskelig tale.
Microsoft og NVIDIA for nylig annonceret en ny AI-drevet metode til at fortolke sprog.
Quantum computing kan være en anden måde at fremme sprogbehandlingsområdet.

Humanoid robot taler med en gruppe mennesker. — gremlin / Getty Images

Der er masser af smarte gadgets at give kommandoer til i disse dage, men vi er stadig langt væk fra computere, der forstår samtaletale.

Microsoft og NVIDIA for nylig annonceret en ny AI-drevet metode til at fortolke tale, der kan transformere, hvordan vi chatter med vores elektronik. Det er en del af en voksende bevægelse, der ændrer, hvordan computere forstår tale, også kaldet Natural Language Processing (NLP).

"Modellerne, der driver NLP, bliver større og mere avancerede og kommer tættere på menneskelig forståelse," AI-ekspert Hamish Ogilvy fortalte Lifewire i et e-mailinterview.

"Et af de store fremskridt er, at NLP går ud over simple søgeord. Du er måske i dag vant til at skrive eller tale et eller to søgeord for at få søgeresultater, men nyere modeller for behandling af naturligt sprog bruger kontekst til at give rigere resultater."

Chat-bots

NVIDIA og Microsoft er gået sammen om at skabe Megatron-Turing Natural Language Generation model (MTNLG), som duoen hævder er den "mest kraftfulde monolitiske transformatorsprogmodel, der er trænet til dato." AI-modellen kører på supercomputere.

Men forskere fandt ud af, at MTNLG-modellen opfangede menneskelige skævheder, da den finkæmmede bjerge af menneskelige taleprøver.

"Mens gigantiske sprogmodeller fremmer det nyeste inden for sproggenerering, lider de også af problemer som bias og toksicitet," skrev forskerne i en blogindlæg. "Vores observationer med MT-NLG er, at modellen opfanger stereotyper og skævheder fra de data, som den er trænet på."

Computere, der bedre forstår tale, vil ikke bare forbedre smarte højttalere som Alexa, hævder Ogilvy. Tekstbaserede søgewebsteder som Amazon vil også bedre forstå forespørgsler, der indtastes.

"Google har haft det åbenlyse forspring her, men NLP-teknologien vil være overalt," sagde Ogilvy. "Til tekst- og stemmebaserede søgninger kan brugere være mere beskrivende, fordi NLP forstår mere end blot teksten; den forstår konteksten af, hvad du leder efter for at give bedre resultater."

Quantum Chats?

Quantum computing kan være en måde at fremme NLP-området. Onsdag har virksomheden Cambridge Quantum annoncerede lambeq, som det hævder er det første kvanteværktøjssæt til NLP.

"...NLP forstår mere end blot teksten; den forstår konteksten af, hvad du leder efter for at give bedre resultater."

Virksomheden siger, at værktøjet tillader oversættelse af sætninger på naturlige sprog ved hjælp af kvantekredsløb, der køres på kvantecomputere. Kvanteberegning er en type beregning, der bruger de usædvanlige egenskaber ved kvantetilstande, såsom superposition, interferens og sammenfiltring, til at udføre beregninger.

"Måden kvantecomputere håndterer NLP på er meget forskellig fra klassiske maskiner. Faktisk er NLP 'quantum native'." Bob Coecke, fortalte chefforskeren ved Cambridge Quantum til Lifewire i et e-mailinterview. "Dette skyldes en opdagelse, vi gjorde for nogle år siden, at grammatikken, der styrer sætninger og betydning, har en meget lignende struktur som den matematik, der bruges til at programmere kvantecomputere."

Coecke sagde, at kvante-NLP kunne føre til bedre stemmeassistenter og oversættelsesværktøjer.

En anden lovende tilgang til at forbedre talegenkendelse, kaldet datacentreret AI, blev lanceret tidligere på året. Datacentreret AI fokuserer på kvaliteten af data, der bruges til at træne en model i stedet for at forbedre algoritmerne.

"Den datacentrerede tilgang har vist sig at være mere effektiv end den traditionelle modelcentrerede tilgang med hensyn til forbedring af AI-opgavekapaciteten," Zac Liu, en dataforsker hos virksomheden Hypergiant, fortalte Lifewire i et e-mailinterview. "Kort sagt, når dataforskere forbedrer NLP-dataene, garanterer det næsten, at de vil have en bedre NLP-model og bedre NLP-kapacitet."

Et barn, der interagerer med en robot. — wonry / Getty Images

Det næste trin er at integrere computervisionsmodeller med NLP, såsom at træne en AI-model til at se videoer og producere et tekstresumé af den video, sagde Liu.

"Anvendelsen af dette fremskridt kan være ubegrænset, lige fra sundhedspleje, læsning af radiologiske film og at stille en foreløbig diagnose til at designe hjem, tøj, smykker eller lignende ting," han tilføjet. "Kunden kunne forklare kravene mundtligt eller skriftligt, og denne beskrivelse kan automatisk konverteres til billeder eller videoer for bedre visualisering."