Linux balss atpazīšanas stāvoklis

Runas atpazīšana operētājsistēmā Linux atpaliek no Windows un Mac platformām, jo ​​gan Microsoft, gan Apple ir ieguldījuši līdzekļus ievērojams laiks un izdevumi, lai pievienotu balss komandu vai balss asistenta programmatūru to pamatdarbībai sistēmas.

Lai gan Linux situācija nav drūma, tāpat kā ar daudzām jaunākajām tehnoloģijām, bezmaksas un atvērtā pirmkoda visums joprojām ir soli atpalicis, jo īpaši ar balss komandu rīkiem.

Linux runas atpazīšana

Linux izplatīšana koncentrējas uz runas atpazīšanu. Tomēr lietotnes, kas atbalsta runas atpazīšanas iespējas, balstās uz dažām atvērtā pirmkoda bibliotēkām, tostarp Sphinx, Kaldi, Julius un Mozilla Deepspeech.

Vīrietis skatās ekrānā
Negatīvā atstarpe / makets. Fotogrāfijas 

Šīs bibliotēkas paļaujas uz runas korpusu, lai piedāvātu skaņu variācijas, lai apmācītu AI un tādējādi pareizi tulkotu runu tekstā. Tomēr atvērtā pirmkoda projekti ir mazāk sarežģīti (jo tiem ir mazāks ieguldījums AI apmācībā), kas nozīmē, ka lielākā daļa Linux lietotņu teksta pārveidei runā bieži traucē konvertēšanu. Parasti viņi to sabojā tik pamatīgi, ka nav skaidrs, kāda varēja būt sākotnējā runa.

Opcijas Linux runai par tekstu

Izmantojiet vienu no pieciem risinājuma veidiem.

  • Paļaujieties uz Linux lietotnēm, kas pieejamas jūsu izplatīšanas krātuvēs, ja tādas parādās.
  • Amazon izgatavots Alexa ir pieejama operētājsistēmai Linux, tostarp Raspberry Pi. Lai šī vienošanās darbotos, jums būs jāveic daudz pielāgotu pielāgojumu, taču tas darbosies.
  • Piekļūstiet Google Speech API savā pārlūkprogrammā, izmantojot DiktācijaIO. Šis pakalpojums darbojas tikai diktēšanai; jūs to nevarat izmantot balss komandām. To darbina Google AI, tāpēc kvalitāte ir laba.
Google asistents parāda pārbaudīto zvanu atšifrējumu.
  • Izmantojiet tādu pakalpojumu kā Alexa vai Google Assistant kā balss komandu utilītu operētājsistēmai Linux, izmantojot pakalpojumu Triggercmd. Triggercmd darbojas jūsu datorā; izmantojiet to, lai izsauktu Alexa vai Google Assistant un ļaujiet šiem rīkiem izpildīt noteiktus Bash skriptus, pamatojoties uz jūsu komandu. Sakiet kaut ko līdzīgu: "Labi, Google, jautājiet trigera komandai, lai atvērtu kalkulatoru." Google palīgs apkalpo kā starpnieks ar Triggercmd, lai palaistu Bash skriptu, kas norādīts ar frāzi "open the kalkulators."
  • Izmantojiet Wine vai virtuālo mašīnu ar Windows programmatūru, piemēram, Dragon NaturallySpeaking. Pareizi pielāgojot, varat izmantot Dragon dzinēju transkripcijai, lai gan šis risinājums nedarbojas balss komandu lietojumprogrammās.