これらの超印象的なAIオーディオブックの声は良いですか悪いですか?
重要なポイント
- DeepZenは、AI(人工知能)を使用して、テキストから驚くほどリアルなオーディオブックを作成します。
- 技術者は、実際の人間の声優を使用して構成要素を提供します。
- AmazonとAudibleは現在、コンピューターで生成されたオーディオブックを受け入れていません。
DeepZen は、人間の俳優の実際の声に基づいて、オーディオブックで使用されるコンピューターの声を作成する会社です。 品質は怖いです—一度に何時間も聞くのに十分簡単です。 ここでの仕掛けはAI(人工知能)コンポーネントであり、テキストを読んで、コンテキストに基づいて正しい感情的反応を推測することができます。 次に、その感情を声に入れます。
印象的でとても便利です。 しかし、私たちは本当に均質化されたオーディオブック体験を望んでいますか? そして、それらの声優はどうですか?
「インディーズ出版社の観点からすると、オーディオブックの制作コストを削減するものは何でも 非常に興味深い」と語った。独立系出版社のCarlileMediaのオーナーであるRickCarlileは、Lifewireに次のように語った。 Eメール。
「しかし、その魅力は、製品が従来のナレーションと同等の品質であることを前提としています。 私たちはまだ100パーセントそこにいるとは思いません。 誤解しないでください、DeepZenは驚くほど良いです。 それは途方もない進歩であり、その作成者は計り知れない賞賛と成功に値します。 しかし、それはまだ完璧ではありません。」
オーディオそれは「十分」です
DeepZenの品質を理解するための最良の方法は、 サンプルを聞く. それらがコンピューターで生成されたものであることを知らなかったとしたら、気付かないかもしれません。 とにかくしばらくの間ではありません。 DeepZenのAIは完璧であり、ヒットするはずの感情的な音を誤解することはないと仮定しましょう。
それでも、人間はより微妙な、そしてしばしばより驚くべき解釈を提供することができます。 俳優は、コンピューターが決して考えない言葉に予想外のひねりを加えるかもしれません。 そして実際には、AIの解釈は確かにプロの声優の解釈ほど良くはありません。
「映画に取り組んでいる人として、そして最近ではオーディオナレーションの世界で働いている人として、私は感銘を受けています AI—機械が解釈できない深い意味があることを私は知っています」とプロの声 俳優
「それを使用している未知の作者の急増はありますか? 「十分に良い」ので、そうなることを保証します。」
利便性とコスト削減を組み合わせて十分に優れていることは、インディーパブリッシャーをサービスに駆り立てるのに十分かもしれません。
「オーディオブックは、オーディオの完成時間あたり最大500ドルの費用がかかる可能性があり(有名人の声の場合はさらに多く)、管理と管理の時間費用は含まれていません」とCarlile氏は言います。 「DeepZenのようなプロバイダーに原稿をアップロードするだけでそのコストを半分にできることは非常に魅力的です。」
話すトラブル
声優を解雇して原稿をDeepZenにアップロードするほど簡単ではありません。 現在、オーディオブックのAIの簡単な説明には、1つの障壁があり、それはAmazonによるものです。
「現在、AudibleとAmazonオーディオブックの配布への自費出版のルートであるACXは、人間が録音しなかったオーディオブックを受け入れません」とCarlile氏は言います。
どうして? 品質。 これがFAQエントリです ウェブサイトから:
「音声合成またはその他の自動録音は許可されていません。 可聴リスナーは、ストーリーだけでなく、素材のパフォーマンスのためにオーディオブックを選択します。 その期待に応えるには、オーディオブックを人間が録音する必要があります。」
これは、DeepZenで生成されたオーディオブックが出ていることを意味します—少なくとも今のところは。 これは純粋な憶測ですが、DeepZenはAmazonにとってかなり良い買収のように思われ、サービスを販売し、Audibleの本のためだけにそれを維持することができます。 そして、それが起こらなくても、コンピューターで生成されたオーディオブックの品質がこれと同じくらい良ければ、この規則に例外を設けない理由はほとんどないようです。
このように作られたオーディオブックを聞いて幸せですか? それが起こったとき、ほとんどの人は疑うことさえしません。 コンピューターで生成された音声の完璧さを好む人もいるかもしれません。なぜなら、彼らは時々気を散らす可能性のある声のチックや習慣がないからです。 このテクノロジーは、ビデオゲーム、テレビやラジオの広告、および声優を雇うその他のシナリオにも適しています。
DeepZenの技術は、書かれた記事からニュースポッドキャストを自動的に作成するための優れた方法にもなります。これは通勤に便利です。
そして、それらの声優はどうですか? まあ、少なくとも1つの機会があります:彼らは行くことができ、 DeepZenで働く.