Nieuwe technologie kan gadgets uw gesprekken laten begrijpen

December 02, 2021
InSlim & Verbonden Leven Nieuws

Belangrijkste leerpunten

Nieuwe technologieën kunnen leiden tot computers die menselijke spraak beter begrijpen.
Microsoft en NVIDIA onlangs aangekondigd een nieuwe AI-gestuurde methode om taal te interpreteren.
Quantum computing kan een andere manier zijn om het gebied van taalverwerking vooruit te helpen.

Humanoïde robot in gesprek met een groep mensen. — gremlin / Getty Images

Er zijn tegenwoordig tal van slimme gadgets om commando's te geven, maar we zijn nog ver verwijderd van computers die conversatie-spraak begrijpen.

Microsoft en NVIDIA onlangs aangekondigd een nieuwe AI-gestuurde methode om spraak te interpreteren die de manier waarop we chatten met onze elektronica zou kunnen veranderen. Het maakt deel uit van een groeiende beweging die verandert hoe computers spraak begrijpen, ook wel Natural Language Processing (NLP) genoemd.

"De modellen die NLP mogelijk maken, worden groter en geavanceerder en komen steeds dichter bij het menselijk begrip", zegt AI-expert Hamish Ogilvy vertelde Lifewire in een e-mailinterview.

"Een van de grote vooruitgangen is dat NLP verder gaat dan simpele trefwoorden. Tegenwoordig ben je misschien gewend aan het typen of uitspreken van een of twee trefwoorden om zoekresultaten te krijgen, maar nieuwere modellen voor natuurlijke taalverwerking gebruiken context om rijkere resultaten te bieden."

Chatbots

NVIDIA en Microsoft hebben de handen ineen geslagen om de Megatron-Turing Natural Language Generation-model (MTNLG), waarvan het duo beweert dat het het "krachtigste monolithische transformatortaalmodel is dat tot nu toe is getraind". Het AI-model draait op supercomputers.

Maar onderzoekers ontdekten dat het MTNLG-model menselijke vooroordelen oppikte terwijl het door bergen menselijke spraakmonsters kamde.

"Terwijl gigantische taalmodellen de stand van de techniek op het gebied van taalgeneratie bevorderen, hebben ze ook last van problemen zoals vooringenomenheid en toxiciteit", schreven de onderzoekers in een blogpost. "Onze observaties met MT-NLG zijn dat het model stereotypen en vooroordelen oppikt uit de gegevens waarop het is getraind."

Computers die spraak beter begrijpen, zullen niet alleen slimme luidsprekers zoals Alexa verbeteren, stelt Ogilvy. Op tekst gebaseerde zoekwebsites zoals Amazon zullen zoekopdrachten die worden ingetypt ook beter begrijpen.

"Google heeft hier duidelijk de leiding gehad, maar NLP-technologie zal overal zijn", zei Ogilvy. "Voor op tekst en spraak gebaseerde zoekopdrachten kunnen gebruikers meer beschrijvend zijn omdat NLP meer begrijpt dan alleen de tekst; het begrijpt de context van wat u zoekt om betere resultaten te krijgen."

Quantum-chats?

Quantum computing zou een manier kunnen zijn om het gebied van NLP vooruit te helpen. Op woensdag heeft het bedrijf Cambridge Quantum aangekondigd lambeq, waarvan het beweert dat het de eerste kwantumtoolkit voor NLP is.

"...NLP begrijpt meer dan alleen de tekst; het begrijpt de context van wat u zoekt om betere resultaten te krijgen."

Het bedrijf zegt dat de tool de vertaling van zinnen in natuurlijke talen mogelijk maakt met behulp van kwantumcircuits die op kwantumcomputers worden uitgevoerd. Quantum computing is een type berekening dat de ongebruikelijke eigenschappen van kwantumtoestanden, zoals superpositie, interferentie en verstrengeling, gebruikt om berekeningen uit te voeren.

"De manier waarop kwantumcomputers omgaan met NLP is heel anders dan klassieke machines. In feite is NLP 'quantum native'" Bob Coecke, vertelde de hoofdwetenschapper van Cambridge Quantum aan Lifewire in een e-mailinterview. "Dit is te wijten aan een ontdekking die we enkele jaren geleden hebben gedaan, dat de grammatica die zinnen en betekenis regelt een zeer vergelijkbare structuur heeft als de wiskunde die wordt gebruikt om kwantumcomputers te programmeren."

Coecke zei dat quantum NLP zou kunnen leiden tot betere stemassistenten en vertaalhulpmiddelen.

Een andere veelbelovende benadering voor het verbeteren van spraakherkenning, genaamd data-centric AI, werd eerder dit jaar gelanceerd. Datacentrische AI richt zich op de kwaliteit van gegevens die worden gebruikt om een model te trainen in plaats van op het verbeteren van de algoritmen.

"Het is bewezen dat de datacentrische benadering efficiënter is dan de traditionele modelgerichte benadering, in termen van verbetering van de AI-taakcapaciteiten," Zac Liu, een datawetenschapper bij het bedrijf Hypergiant, vertelde Lifewire in een e-mailinterview. "Kortom, wanneer datawetenschappers de NLP-gegevens verbeteren, garandeert dit bijna dat ze een beter NLP-model en betere NLP-mogelijkheden zullen hebben."

Een kind interactie met een robot. — wonry / Getty Images

De volgende stap is het integreren van computervisiemodellen met NLP, zoals het trainen van een AI-model om video's te bekijken en een tekstsamenvatting van die video te maken, zei Liu.

"De toepassing van deze vooruitgang kan grenzeloos zijn, van gezondheidszorg, het lezen van radiologische films en het verstrekken van een voorlopige diagnose, bij het ontwerpen van huizen, kleding, sieraden of soortgelijke artikelen," zei hij toegevoegd. "De klant kan de eisen mondeling of schriftelijk uitleggen, en deze beschrijving kan automatisch worden omgezet in afbeeldingen of video's voor een betere visualisatie."