2024/03/19 / 社内業務効率化
AI音声合成ソフトでは、機械的な音声にならないように抑揚調整や感情表現を可能にするなど、多様なニーズに応える機能を備えています。
本記事では、弊社(エーアイ株式会社)が提供するAI音声合成ソフト「AITalk®」の抑揚調整など様々な機能について紹介します。
「AITalk®」とは、従来の「波形接続合成方式」と、深層学習技術を活用した「新DNN音声合成方式」を組み合わせた高品質なAI音声合成ソフトです。
この技術により、人間らしい自然な音声の実現と話者の感情や抑揚を豊かに表現することが可能になります。
「AITalk®」は、様々な用途での音声ニーズに応えるため、総勢100名以上の話者や60種類以上の言語、感情表現の調整機能を備えています。
AITalk®では、人間の声と区別がつかないほど自然な音声の生成が可能です。
音声デモでナレーションを試すこともできるため、ぜひ試してみてください。
AITalk®では、抑揚、話速、音高の細かい調整が可能です。
ナレーションはIVRの音声ガイダンスや美術館の音声ガイドなど、シーンに応じた音声の調整が可能です。
各パラメーターの調整により、表現の幅も広がります。
感情表現も特徴の一つです。
怒り、悲しみ、喜びなど、様々な感情を声に反映させることが可能。
聞き手の感情に訴えかけるような、よりリアルなコミュニケーションが実現します。
AITalk®は、日本語だけでなく、英語、中国語、韓国語など、最大64言語に対応しています。
多言語対応により、世界中の様々な言語でナレーションや音声ガイダンスを作成することができます。
J:COMカスタマーセンターでは、IVRの音声に「AITalk®」を活用しています。
導入前、アナウンサーや社内担当者といった異なる声を利用していることや音質・話す速度に違いがあった結果、ガイダンス音声に統一感がなく、お客様からは聞き取りにくいとの声がありました。
「AITalk®」の導入により、これらの課題が解決しました。
同じ声の種類・音質・速度でIVR音声の統一化を実現し、お客様からの聞き取りづらいという声はなくなったようです。
横浜国立大学では、広報動画や教材のナレーションに「AITalk®」の活用事例があります。
導入の背景には、ダイバーシティの観点から動画に字幕やナレーションを加えることで、情報のアクセシビリティを高めたいという考えがありました。
さらに、ナレーションにおけるプロのナレーター依存の問題を解決したいというニーズもありました。
「AITalk®」の導入により、プロのナレーターと遜色ない音質のナレーションを自在に作成することができます。
また、大学特有の特殊な読み方にも、辞書登録機能を使って対応可能です。
辞書登録機能を活用することで、想定通りの読み方を設定でき、アクセントや感情表現、部分的なスピード調整なども柔軟に行えています。
株式会社アコーディア・ゴルフが運営するゴルフ場では、館内放送に「AITalk®」を導入しました。
AITalk®の導入前、快適にプレーしてもらうための案内を対面で行っていましたが、人員の都合で十分に出来ないことや館内放送の質が担当者のスキルによって変わる課題がありました。
「AITalk®」の導入により、これらの課題を解決しました。
AITalk®による館内放送では、プレー時の注意点、併設施設の営業時間、コース内の作業案内、バスの送迎時間、イベントの案内など、様々な案内を放送します。
また、定型放送文は予め音声を作成しておき、定期的に放送できるようになりました。
「将棋アプリ将皇」では、「AITalk®」を用いて棋譜の読み上げを行っています。
このアプリでは、棋譜読み上げ特有のイントネーションや声質を一貫して維持する必要があり、ナレーターにお願いすると音量や声質に微妙なブレが生じてしまい、それらの調整や取り直しに手間がかかりすぎることが課題でした。
AITalk®では、人間の読み上げと同レベルの高品質な音声であることと、イントネーションの微調整が可能であることが導入の決め手になりました。
本記事では、AI音声合成ソフト「AITalk®」の抑揚調整など、様々な機能をお伝えしました。
以下のポイントを踏まえ、「AITalk®」の利用をご検討ください。
・自然な音声:AI音声合成ソフトは、人間の声と区別がつかないほど自然で様々な用途で利用可能。
・抑揚、話速、音高の調整:抑揚・話速・音高の調整はパラメーターを変更することで調整可能。
・豊かな感情表現:ナレーションや音声ガイダンスで音声の感情調整も可能。
・外国語対応:日本語だけでなく、英語、中国語、韓国語など、最大64言語に対応。