次世代型音声合成 AITalk5|株式会社 エーアイ

次世代型音声合成 AITalk5

AITalk5の特徴

深層学習技術による、さらなる人間的で自然な音声合成

深層学習技術による、さらなる人間的で自然な音声合成

さらに詳しく

短時間の音声収録でも感情表現はなめらか

短時間の音声収録でも
感情表現はなめらか

さらに詳しく

活用シーンに合わせた選べる音声合成方式

活用シーンに合わせた
選べる音声合成方式

さらに詳しく

従来のAITalkとの違い

深層学習技術を新規導入した
DNN音声合成方式

最先端の深層学習技術を導入したDNN音声合成方式で、音質・肉質感の向上、多様な発話表現を実現。

感情表現のなめらかさ向上

従来の「AITalk4」で課題のあった不連続で急な感情変化を、深層学習技術によって人間らしいなめらかな感情遷移を実現

感情用カスタム音声合成辞書の
作成時間を短縮

従来型AITalkに比べ、より少量の収録音声から感情音声辞書を作成可能。収録時間と音声辞書作成時間の短縮

誤読・アクセント間違いを低減

日本語解析方式の変更により、入力されたテキストの読み間違いやアクセント間違いの発生率を低減。

音声サンプル

電話自動応答

サンプル(のぞみ)従来型波形接続
お電話ありがとうございます。こちらは株式会社エーアイ、お客様サポートセンターです。製品に関するお問い合わせは「1」を、お支払いに関するお問い合わせは「2」を、その他のお問い合わせは「3」を押してください。

音声対話

スマートフォン / AIスピーカー / ロボット
サンプル(のぞみ)DNN波形接続
はい、ご用件はなんですか? 分かりました。アラームを午前6時にセットしました。
サンプル(のぞみ)DNN波形接続
ごめんなさい。よく聞き取れませんでした。もう一度言ってください。
家電
サンプル(のぞみ)DNNパラメトリック
冷蔵庫の中に、キャベツと茄子とピーマンがあります。帰りに豚肉を買ってきて、オイスター炒めにしてはどうでしょうか?

放送

防災行政無線
サンプル(のぞみ)DNN波形接続
こちらは防災エーアイです。当地域に、大雨特別警報が発表されました。周囲の状況をみて、避難行動をとってください。
施設内
サンプル(のぞみ)従来型波形接続
ご来店中のお客様にご案内申し上げます。ただいま、7階、イベントスペースにおきまして、秋の味覚フェアを開催中です。皆様お気軽にご来場ください。
車内
サンプル(のぞみ)DNN波形接続
ご乗車、ありがとうございました。次は春日駅、春日駅です。お降りの際は、お忘れ物ないようご注意ください。
メディア
サンプル(のぞみ)従来型波形接続
今日の全国の天気をお伝えします。西日本、東日本では晴れて、日差しがよく届きます。北日本、日本海側では、冬型の気圧配置で雨や雪が降りやすくなります。 特に北海道では、沿岸で風が強くなります。吹雪などにご注意ください。

機器組み込み

異常検知
サンプル(のぞみ)DNN波形接続
水位が上昇しています。水位が上昇しています。水防団待機水位。水防団へ待機指示をおこなってください。
ガイダンス
サンプル(のぞみ)DNNパラメトリック
料金は、700円です。お金を入れてください。ご利用ありがとうございました。お釣りの取り忘れにご注意ください。

車載

サンプル(のぞみ)DNNパラメトリック
およそ500メートル先、左方向です。その先、700メートル先、右方向です。

教材ナレーション

サンプル(のぞみ)従来型波形接続
企業における、個人情報の取り扱いに関して、以下の例の中から、コンプライアンス違反に該当する事例を3つ選択してください。

豊富な話者と言語

日本語話者19名の豊富な音声ラインナップ
日本語話者(標準語)

のぞみ

爽やかで若々しい声が特徴です。ナレーション、電話自動応答、防災無線、エンタメ等、様々な用途で広くお使いいただけます。

すみれ

大人っぽく艶やかな印象の声です。様々なシーンに応用可能です。

かほ

明瞭性に長けているのが特徴です。電話自動応答(CTI・IVR)や、動画作成時のナレーションなど、幅広くお使いいただけます。

まき

アニメやゲーム等のキャラクターやエンターテイメントでの利用に最適です。

あかり

明るく元気な声が特徴です。製品案内やプロモーションの用途に最適です。

ななこ

おちついた声が特徴です。ニュースの読み上げや音声ガイダンスの用途に 適しています。

れいな

可愛いらしく、ふんわりとした優しい声が特徴です。アニメキャラや、アプリや玩具、ゲーム等での利用にぴったりです。

しおり

素直で親しみやすく、みずみずしい声色が特徴です。

せいじ

誠実なトーンが特徴です。 説得力や注意をうながす場面に適しています。

おさむ

汎用性にすぐれた声が特徴です。様々な場面で応用が可能です。

ひろし

朴訥とした声が特徴です。朗読等に最適です。

たいち

若々しく、個性的な声が特徴です。エンターテイメント分野での利用に最適です。

けんた

優しく聡明で謙虚さが感じられる声色が特徴です。

あんず

優しく一生懸命さが伝わる話し方が特徴です。

ちひろ

鼻にかかった愛らしい女の子の声です。

こうたろう

可愛くゆっくりとした話し方が特徴です。

ゆうと

ハキハキとした賢そうな男の子の声です。

日本語話者(関西風)
c1

みやび

ゆったりとした優しい話し方が特徴の女性話者です。

c1

やまと

明朗快活で、若々しい話し方が特徴の男性話者です。

MORE DETAIL更に詳しく

AITalk5の感情表現

AITalk5の感情表現には、DNNによるコーパスベース音声合成方式を採用。
平静の音素片辞書からDNNにより各感情を予測し、音声を合成します。

従来型音声合成AITalk4
矢印矢印
次世代型音声合成AITalk5

AITalk5仕組み

AITalk5仕組み

AITalk5活用シーン

音声対話ソリューション

双方向の対話が必要な、コミュニケーションロボットやスマートスピーカー、音声対話アプリの発話音声、カーナビ、家電など様々な機器を操作するための音声対話UIに、 AITalk5を搭載することにより、まるで人間のような感情表現豊かな声を搭載することができます。

芸能人・声優の声によるコンテンツ・サービス

WEBキャンペーン、スマートフォンアプリ、ゲーム等様々な音声コンテンツを、芸能人や声優の感情つきの音声合成でより手軽に実現することができます。

情報配信サービス

天気予報やニュース、道路交通情報などの日々更新される情報においても、AITalk5によりリアルタイムで正しく音声変換し、配信することができます。

放送システム

防災行政無線や館内放送システムなどの広域に音声放送する場面で、AITalk5による聴き取りやすい高品質な合成音声で放送することができます。

ガイダンス音声作成

電話自動応答や各種機器のガイダンス音声を、AITalk5により高品質な合成音声で作成することができます。

MORE DETAIL更に詳しく

外国語にも対応!

英語、中国語、韓国語等、40言語・54方言・123話者の様々な言語で、手軽にナレーション音声を合成することができます。

MORE DETAIL更に詳しく

製品に関するお問い合わせはこちら

製品・サービスについてのご質問や音声合成活用全般に関してのご相談を受け付けています。お気軽にお問い合わせください。

個人向け製品サイト