Kaip haliucinacijos gali padėti AI geriau jus suprasti

  • Naujas mašininio mokymosi modelis haliucinuoja sakinio išvaizdą kalba, kad būtų lengviau išversti.
  • AI sistema, vadinama VALHALLA, buvo sukurta imituoti žmonių kalbos suvokimą.
  • Naujoji sistema yra dalis augančio judėjimo naudoti AI kalbai suprasti.
Asmuo, kuris naudojasi balso asistentu išmaniajame telefone, stovėdamas po skėčiu lietingą dieną.

Oscar Wong / Getty Images

Žmogaus metodas vizualizuoti paveikslėlius verčiant žodžius gali padėti dirbtiniam intelektui (AI) geriau jus suprasti.

Naujas mašininio mokymosi modelis haliucinuoja vaizdą, kaip sakinys atrodo kalba. Pagal neseniai tiriamasis darbas, tada technika naudoja vizualizaciją ir kitus įkalčius, kad padėtų vertimui. Tai dalis augančio judėjimo naudoti AI kalbai suprasti.

„Kaip žmonės kalba ir rašo, yra unikalu, nes visi turime šiek tiek skirtingus tonus ir stilius. Beth Cudney, Maryville universiteto duomenų analitikos profesorius, kuris nedalyvavo tyrime, sakė Lifewire interviu el. paštu. „Suprasti kontekstą sunku, nes tai tarsi tvarkymasis su nestruktūrizuotais duomenimis. Čia naudingas natūralios kalbos apdorojimas (NLP). NLP yra AI šaka, sprendžianti skirtumus, kaip bendraujame naudojant mašininio skaitymo supratimą. Pagrindinis NLP, kaip AI šakos, skirtumas nėra sutelktas tik į tiesiogines žodžių, kuriuos kalbame ar rašome, reikšmes. Tai žiūri į prasmę“.

Eik Paklausk Alisos

Naujoji AI sistema, vadinamas VALHALLAMIT, IBM ir Kalifornijos universiteto San Diege mokslininkų sukurtas būdas imituoti žmonių kalbos suvokimą. Pasak mokslininkų, naudojant jutiminę informaciją, pavyzdžiui, daugialypės terpės, suporavus su naujais ir nepažįstamais žodžiais, pavyzdžiui, kortelėmis su vaizdais, pagerėja kalbos įsisavinimas ir išlaikymas.

Šios sistemos padidina pokalbių robotų, kurie šiuo metu yra tik apmokyti ir gali palaikyti konkrečius pokalbius, galią...

Komanda teigia, kad jų metodas pagerina mašininio vertimo tikslumą, palyginti su tik teksto vertimu. Mokslininkai naudojo kodavimo-dekoderio architektūrą su dviem transformatoriais, neuroninio tinklo modelio tipą tinka nuo sekos priklausomiems duomenims, pvz., kalbai, kurie gali atkreipti dėmesį į raktinius žodžius ir a semantiką sakinys. Vienas transformatorius sukuria regimąją haliucinaciją, o kitas atlieka multimodalinį vertimą naudodamas pirmojo transformatoriaus išvestis.

„Realus scenarijus gali neturėti atvaizdo, palyginti su šaltinio sakiniu“, Rameswar Panda, vienas iš tyrimo grupės narių, sakė a spaudos pranešimas. „Taigi, mūsų motyvacija iš esmės buvo tokia: užuot naudoję išorinį vaizdą darant išvadas kaip įvestį, gali mes naudojame vizualines haliucinacijas – gebėjimą įsivaizduoti vaizdines scenas – siekdami pagerinti mašininį vertimą sistemos?"

AI supratimas

Cudney pažymėjo, kad daug tyrimų yra nukreipti į NLP tobulinimą. Pavyzdžiui, Elonas Muskas buvo vienas iš įkūrėjų Atidarykite AI, kuri dirba su GPT-3, modelis, galintis bendrauti su žmogumi ir yra pakankamai išprusęs, kad sukurtų programinės įrangos kodą Python ir Java.

„Google“ ir „Meta“ taip pat kuria pokalbio AI su savo sistema paskambino LAMDA. „Šios sistemos padidina pokalbių robotų, kurie šiuo metu yra tik apmokyti ir gali, galią konkrečių pokalbių, kurie greičiausiai pakeis klientų aptarnavimo ir pagalbos tarnybų veidą“, – sakė Cudney sakė.

Aaronas Slomanas, dirbtinio intelekto technologijų įmonės CLIPr vienas iš įkūrėjų el. laiške teigė, kad dideli kalbų modeliai, tokie kaip GPT-3, gali pasimokyti iš labai nedaug mokymo pavyzdžių, kad patobulintų teksto santraukas, pagrįstas žmonių atsiliepimais. Pavyzdžiui, jis sakė, kad dideliam kalbos modeliui galite pateikti matematikos uždavinį ir paprašyti AI mąstyti žingsnis po žingsnio.

„Galime tikėtis, kad iš didelių kalbų modelių bus gauta daugiau įžvalgų ir samprotavimų, kai sužinosime daugiau apie jų gebėjimus ir apribojimus“, – pridūrė Slomanas. "Taip pat tikiuosi, kad šie kalbos modeliai sukurs labiau į žmones panašius procesus, nes modeliuotojai kuria geresnius būdus, kaip tiksliai suderinti modelius konkrečioms dominančioms užduotims."

Georgia Tech skaičiavimo profesorius Diyi Yang interviu el. paštu prognozavo, kad mūsų kasdieniame gyvenime dažniau bus naudojamos natūralios kalbos apdorojimo (NLP) sistemos, pradedant nuo NLP pagrįsti asmeniniai asistentai, padedantys el. paštu ir telefono skambučiais, išmanančiomis dialogo sistemomis ieškant informacijos kelionėse arba sveikatos apsauga. „Taip pat sąžiningos AI sistemos, galinčios atsakingai ir be šališkumo atlikti užduotis ir padėti žmonėms“, – pridūrė Yangas.

Prognozuojama, kad didžiuliai AI modeliai, naudojantys trilijonus parametrų, tokių kaip GPT-3 ir DeepText, toliau dirbs kuriant vieną modelį visoms kalbų programoms. Steponas Hage'as, „Dialexa“ mašininio mokymosi inžinierius, interviu el. paštu. Jis teigė, kad taip pat bus naujų tipų modelių, sukurtų tam tikroms reikmėms, pavyzdžiui, balso komandoms apsipirkti internetu.

„Pavyzdys gali būti pirkėjo pasakymas: „Parodyk man šiuos vidurnakčio mėlynos spalvos šešėlius su daugiau aureolės“, kad parodytų tą atspalvį ant žmogaus akių, kiek galima kontroliuoti, kaip jie naudojami“, – pridūrė Hage.