Netrukus galbūt nežinosite, kad kalbate su kompiuteriu
Key Takeaways
- Greitai artėja diena, kai negalėsite atskirti kompiuteriu sukurtos kalbos nuo tikrosios.
- „Google“ neseniai pristatė „LaMDA“ – modelį, kuris leistų palaikyti natūralesnius pokalbius.
- Žmogaus tipo kalbai sukurti taip pat reikia daug apdorojimo galios.

Devrimb / Getty Images
Šiuo metu lengva pasakyti, kai kalbate su kompiuteriu, tačiau tai gali greitai pasikeisti dėl naujausių dirbtinio intelekto pažangos.
„Google“ neseniai pristatė „LaMDA“., eksperimentinis modelis, kuris, bendrovės teigimu, galėtų pagerinti jos pokalbio AI padėjėjų gebėjimus ir sudaryti sąlygas natūralesniams pokalbiams. LaMDA siekia galų gale normaliai kalbėtis apie beveik bet ką, be jokio išankstinio mokymo.
Tai vienas iš augančio AI projektų skaičiaus, kuris gali priversti jus susimąstyti, ar kalbate su žmogumi.
„Mano apskaičiavimais, per ateinančius 12 mėnesių vartotojai pradės susidurti su šiais naujais, emocingesniais balsais ir prie jų pripras“, – sakė Jamesas Kaplanas, bendrovės generalinis direktorius. „MeetKai“, pokalbio AI virtualus balso asistentas ir paieškos variklis, sakė interviu el.
„Kai tai įvyks, sintezuota šiandieninė kalba vartotojams skambės taip, kaip mums šiandien skamba 2000-ųjų pradžios kalba.
Balso asistentai su personažu
„Google“ LaMDA sukurta naudojant „Transformer“ – neuroninio tinklo architektūrą, kurią išrado „Google Research“. Skirtingai nuo kitų kalbų modelių, „Google“ LaMDA buvo apmokytas tikro dialogo.
„Google Eli Collins“ teigia, kad viena iš iššūkių norint sukurti natūraliai skambančią AI kalbą yra atviras pokalbių pobūdis. rašė dienoraščio įraše.

gremlin / Getty Images
„Pokalbis su draugu apie televizijos laidą gali peraugti į diskusiją apie šalį, kurioje buvo filmuojama laida, prieš pradedant diskutuoti apie geriausią tos šalies regioninę virtuvę“, – pridūrė jis.
Roboto kalba viskas juda greitai. Ericas Rosenblumas, įmonės vadovaujantis partneris Tsingyuan Ventures, kuri investuoja į pokalbio AI, teigė, kad kai kurios svarbiausios kompiuterinės kalbos problemos yra praktiškai išspręstos.
Pavyzdžiui, kalbos supratimo tikslumas jau itin aukštas teikiant paslaugas, tokias kaip transkripcijos, kurias atlieka programinė įranga Otter.ai arba paimtus medicininius užrašus DeepScribe.
„Tačiau kita siena yra daug sunkesnė“, – pridūrė jis.
„Išlaikyti supratimą apie kontekstą, o tai yra problema, kuri gerokai viršija natūralios kalbos apdorojimą, ir empatija, pvz., kompiuteriai, sąveikaujantys su žmonėmis, turi suprasti nusivylimą, pyktį, nekantrumą, ir tt Abu šie klausimai yra sprendžiami, tačiau abu toli gražu nėra patenkinami“.
Neuroniniai tinklai yra raktas
Norėdamos generuoti gyvenimiškus balsus, įmonės naudoja tokias technologijas kaip gilieji neuroniniai tinklai – mašininio mokymosi forma, kuri klasifikuoja duomenis per sluoksnius, sako Mattas Muldoonas, Šiaurės Amerikos prezidentas. ReadSpeaker, įmonė, kurianti teksto į kalbą programinę įrangą, sakė interviu el.
„Šie sluoksniai patobulina signalą, suskirstydami jį į sudėtingesnes klasifikacijas“, – pridūrė jis. "Rezultatas yra sintetinė kalba, kuri skamba neįtikėtinai kaip žmogus."
Kita kuriama technologija yra Prozodijos perkėlimas, kuris apima vieno teksto į kalbą balso garso derinimą su kito kalbėjimo stiliumi, sakė Muldoonas. Taip pat yra mokymosi perkėlimas, dėl kurio sumažėja mokymo duomenų, reikalingų naujam nerviniam balsui iš teksto į kalbą sukurti, kiekis.
Kaplanas teigė, kad žmogaus kalbos kūrimas taip pat reikalauja milžiniškos apdorojimo galios. Įmonės kuria neuroninius greitintuvo lustus, kurie yra pasirinktiniai moduliai, veikiantys kartu su įprastais procesoriais.
„Kitas etapas bus šių lustų įdėjimas į mažesnę aparatinę įrangą, kaip šiuo metu tai jau daroma fotoaparatams, kai reikalingas AI regėjimui“, – pridūrė jis. „Netrukus tokio tipo skaičiavimo galimybės bus pasiekiamos pačiose ausinėse.
Vienas iš iššūkių kuriant dirbtinio intelekto pagrįstą kalbą yra tai, kad visi kalba skirtingai, todėl kompiuteriams paprastai sunku mus suprasti.
„Pagalvokite, kad Gruzija vs. Bostonas vs. Šiaurės Dakotos akcentai ir ar anglų kalba yra jūsų pagrindinė kalba, ar ne“, – Monica Dema, kuri dirba su balso paieškos analize. MDinc, sakoma el. „Žvelgiant globaliai, tai brangu padaryti visuose Vokietijos, Kinijos ir Indijos regionuose, tačiau tai nereiškia, kad to negalima padaryti ar negalima padaryti.