音声合成システムで抑揚調整はできる?

2024/03/19 / 社内業務効率化

音声合成システムでは、機械的な音声にならないように抑揚調整や感情表現を可能にするなど、多様なニーズに応える機能を備えています。

本記事では、弊社(エーアイ株式会社)が提供する音声合成システム「AITalk®」の抑揚調整など様々な機能について紹介します。

音声合成システム「AITalk®」とは

「AITalk®」とは、従来の「波形接続合成方式」と、深層学習技術を活用した「新DNN音声合成方式」を組み合わせた高品質な音声合成システムです。

この技術により、人間らしい自然な音声の実現と話者の感情や抑揚を豊かに表現することが可能になります。

「AITalk®」は、様々な用途での音声ニーズに応えるため、総勢100名以上の話者や60種類以上の言語、感情表現の調整機能を備えています。

音声合成 AITalk® とは?

音声合成システム「AITalk®」でできること

人間的な自然な音声

AITalk®では、人間の声と区別がつかないほど自然な音声合成が可能です。

音声合成デモでナレーションを試すこともできるため、ぜひ試してみてください。

AITalk®音声合成デモを試してみる

抑揚調整・話速調整・音高調整

AITalk®では、抑揚、話速、音高の細かい調整が可能です。

ナレーションはIVRの音声ガイダンスや美術館の音声ガイドなど、シーンに応じた音声の調整が可能です。

各パラメーターの調整により、表現の幅も広がります。

怒り・悲しみ・喜びの感情も声にできる

感情表現も特徴の一つです。

怒り、悲しみ、喜びなど、様々な感情を声に反映させることが可能。

聞き手の感情に訴えかけるような、よりリアルなコミュニケーションが実現します。

多言語対応

AITalk®は、日本語だけでなく、英語、中国語、韓国語など、最大64言語に対応しています。

多言語対応により、世界中の様々な言語でナレーションや音声ガイダンスを作成することができます。

AITalk®:外国語対応の製品紹介

音声合成システム「AITalk®」の活用事例

IVR(自動音声応答システム)

J:COMカスタマーセンターでは、IVRの音声に「AITalk®」を活用しています。

導入前、アナウンサーや社内担当者といった異なる声を利用していることや音質・話す速度に違いがあった結果、ガイダンス音声に統一感がなく、お客様からは聞き取りにくいとの声がありました。

「AITalk®」の導入により、これらの課題が解決しました。

同じ声の種類・音質・速度でIVR音声の統一化を実現し、お客様からの聞き取りづらいという声はなくなったようです。

JCOM株式会社様の活用事例を見る

動画ナレーション

横浜国立大学では、広報動画や教材のナレーションに「AITalk®」の活用事例があります。

導入の背景には、ダイバーシティの観点から動画に字幕やナレーションを加えることで、情報のアクセシビリティを高めたいという考えがありました。

さらに、ナレーションにおけるプロのナレーター依存の問題を解決したいというニーズもありました。

「AITalk®」の導入により、プロのナレーターと遜色ない音質のナレーションを自在に作成することができます。

また、大学特有の特殊な読み方にも、辞書登録機能を使って対応可能です。

辞書登録機能を活用することで、想定通りの読み方を設定でき、アクセントや感情表現、部分的なスピード調整なども柔軟に行えています。

横浜国立大学様の活用事例を見る

館内放送

株式会社アコーディア・ゴルフが運営するゴルフ場では、館内放送に「AITalk®」を導入しました。 

AITalk®の導入前、快適にプレーしてもらうための案内を対面で行っていましたが、人員の都合で十分に出来ないことや館内放送の質が担当者のスキルによって変わる課題がありました。

「AITalk®」の導入により、これらの課題を解決しました。

音声合成による館内放送では、プレー時の注意点、併設施設の営業時間、コース内の作業案内、バスの送迎時間、イベントの案内など、様々な案内を合成音声で放送します。

また、定型放送文は予め音声を作成しておき、定期的に放送できるようになりました。

株式会社アコーディア・ゴルフ様の活用事例を見る

ゲームのナレーション

「将棋アプリ将皇」では、「AITalk®」を用いて棋譜の読み上げを行っています。

このアプリでは、棋譜読み上げ特有のイントネーションや声質を一貫して維持する必要があり、ナレーターにお願いすると音量や声質に微妙なブレが生じてしまい、それらの調整や取り直しに手間がかかりすぎることが課題でした。

AITalk®では、人間の読み上げと同レベルの高品質な音声であることと、イントネーションの微調整が可能であることが導入の決め手になりました。

株式会社S-Works様の活用事例を見る

まとめ

本記事では、音声合成システム「AITalk®」の抑揚調整など、様々な機能をお伝えしました。

以下のポイントを踏まえ、「AITalk®」の利用をご検討ください。

・自然な音声合成:人間の声と区別がつかないほど自然で、様々な用途で利用可能。

・抑揚、話速、音高の調整:抑揚・話速・音高の調整はパラメーターを変更することで調整可能。

・豊かな感情表現:ナレーションや音声ガイダンスで音声の感情調整も可能。

・外国語対応:日本語だけでなく、英語、中国語、韓国語など、最大64言語に対応。

関連情報