Linux Ses Tanıma Durumu

Linux'ta konuşma tanıma, hem Microsoft hem de Apple yatırım yaptığı için Windows ve Mac platformlarını takip ediyor. temel işletimlerine sesli komut veya sesli yardım yazılımı eklemek için önemli ölçüde zaman ve masraf sistemler.

Pek çok son teknolojide olduğu gibi Linux için durum kasvetli olmasa da, özgür ve açık kaynak evreni, özellikle sesli komut araçlarıyla bir adım geride kalıyor.

Linux Konuşma Tanıma

Numara Linux dağıtım, konuşma tanımaya odaklanır. Bununla birlikte, konuşma tanıma özelliğini destekleyen uygulamalar, Sphinx, Kaldi, Julius ve Mozilla Deepspeech dahil olmak üzere bir avuç açık kaynak kitaplığına güvenir.

Ekrana bakan adam
Negatif alan / Mockup. Fotoğraflar 

Bu kitaplıklar, yapay zekayı eğitmek ve dolayısıyla konuşmayı metne doğru bir şekilde çevirmek için ses çeşitleri sunmak için bir konuşma bütününe güvenir. Bununla birlikte, açık kaynaklı projeler daha az karmaşıktır (çünkü AI'yı eğitmek için daha küçük katkılardan yararlanırlar), bu da Linux için çoğu metinden konuşmaya uygulamasının dönüşümü sık sık beceremediği anlamına gelir. Genellikle, o kadar berbat ederler ki, orijinal konuşmanın ne olabileceği belli olmaz.

Linux Konuşmadan Metne Seçenekler

Beş çözüm yolundan birini kullanın.

  • Varsa, dağıtımınızın depolarında bulunan Linux uygulamalarına güvenin.
  • Amazon yapımı Alexa, Linux için kullanılabilirAhududu Pi dahil. Bu düzenlemenin çalışması için çok sayıda özel ince ayar yapmanız gerekecek, ancak işe yarayacak.
  • Tarayıcınızda Google Speech API'ye şu yollarla erişin: DikteIO. Bu hizmet yalnızca dikte için çalışır; sesli komut için kullanamazsınız. Google'ın AI tarafından desteklenmektedir, bu nedenle kalite iyidir.
Google Asistan, taranan aramalar için bir konuşma metni görüntüler.
  • Triggercmd hizmeti aracılığıyla Linux için sesli komut aracı olarak Alexa veya Google Asistan gibi bir hizmet kullanın. Triggercmd bilgisayarınızda çalışır; çağırmak için kullan Alexa veya Google Assistant ve bu araçların komutunuza göre belirli Bash komut dosyalarını yürütmesini sağlayın. "Tamam Google, hesap makinesini açmak için tetik komutu iste" gibi bir şey söyleyin. Google Asistan hizmet veriyor "açın" ifadesiyle belirtilen Bash betiğini çalıştırmak için Triggercmd ile hesap makinesi."
  • Dragon NaturallySpeaking gibi Windows için yazılım içeren Wine veya sanal bir makine kullanın. Doğru ince ayar ile, bu çözüm sesli komut uygulamalarında çalışmasa da, yazıya dönüştürme için Dragon motorunu kullanabilirsiniz.