AITalk® WebAPI[AICloud]

WEBサービスに最適!手軽に音声合成を利用

AITalk® WebAPI[AICloud]

WEBサービスなどから、高品質音声合成エンジンAITalk®をSaaS型で利用できるサービスです。自社で音声合成用のServer構築や運用をする必要がないため、WEBサービスやスマートフォンアプリ、キャンペーン他、様々なサービスで手軽に音声合成を利用したサービスを開始することができます。感情も表現することができるため、単調な音声合成のイメージを覆す表情豊かな音声読み上げが実現できます。

※一部の話者のみ対応しています

AITalk® WebAPI[AICloud]

主な用途

音声対話/情報配信・メディア/WEBキャンペーン・サービス

提供形態

クラウド / API / SaaS

AITalk® WebAPIは
こんな方におすすめです

音声合成をつかったサービスを
開発・運用コストを最小限にして開始したい

音声合成Serverの構築は不要、運用は当社にお任せください。自社で構築・運用を行う必要がないので省エネ運用が可能です。

音声合成を使ったサービスを
マルチデバイスで展開したい

Android、iOS、WindowsCE、Windows、Mac他・・・それぞれに対応した音声合成エンジンを組込むには手間がかかります。AITalk® WebAPIを使えば簡単にマルチデバイス対応が可能になります。

AITalk® WebAPIの特徴

  • 感情表現を実現*

    シチュエーションや用途に合わせた感情表現を実現しました。

    ※一部の話者のみ対応しています

  • 人間の声に近い自然な音声

    AITalk®WebAPIは従来の機械音的な音声合成ではなく、人間の肉声に近い自然な音声を実現しました。

  • 豊富な話者のラインナップ

    子供~大人まで、多彩な標準語話者でシーンにあった用途にご利用いただけます。

  • オリジナル話者の利用も可能

    オリジナル音声辞書作成サービス「AITalk CustomVoice」で作成したタレント、声優、キャラクター等のオリジナルの音声辞書を利用することも可能です。*別途音声辞書作成費用が必要です。

  • スタートアップから大規模サービスまで多彩なプランをご用意

    月額5000円のミニマムスタート用プランから専用環境構築の大規模サービス用プランまで、様々な規模のサービスにご利用いただけます。

  • シンプルで使いやすいAPI

    音声合成の知識がなくてもシンプルで使いやすいAPIでサービスの構築をスムーズに行うことができます。

  • 開発言語を選ばない提供形態

    ネットワークによる通信(REST形式でのデータ送受信)さえ可能であれば開発言語は問いません。

  • チューニング機能を搭載

    固有名詞や、専門用語の読み方・イントネーション等をユーザー辞書登録画面より簡単に登録し、合成結果に反映することができます。
    ※有料オプションです

AITalk® WebAPI 話者紹介

のぞみ

のぞみ

爽やかで若々しい声が特徴です。ナレーション、電話自動応答、防災無線、エンタメ等、様々な用途で広くお使いいただけます。

  • 新DNN対応
  • 感情表現対応
  • 通常
かほ

かほ

明瞭性に長けているのが特徴です。電話自動応答(CTI・IVR)や、動画作成時のナレーションなど、幅広くお使いいただけます。

  • 新DNN対応
  • 感情表現対応
  • 通常
ゆみこ

ゆみこ

大人っぽく、落ち着いた印象のある声です。

  • 新DNN対応
  • 感情表現対応
  • 通常
かのん

かのん

甘くて、かわいらしい声が特徴です。

  • 新DNN対応
  • 感情表現対応
  • 通常
つばさ

つばさ

芯の強さや実直さを感じる声です。

  • 新DNN対応
  • 感情表現対応
  • 通常
あかり

あかり

明るく元気な声が特徴です。製品案内やプロモーションの用途に最適です。

  • 新DNN対応
  • 感情表現対応
  • 通常
ななこ

ななこ

おちついた声が特徴です。ニュースの読み上げや音声ガイダンスの用途に 適しています。

  • 新DNN対応
  • 感情表現対応
  • 通常
しおり

しおり

素直で親しみやすく、みずみずしい声色が特徴です。

  • 新DNN対応
  • 感情表現対応
  • 通常
せいじ

せいじ

誠実なトーンが特徴です。 説得力や注意をうながす場面に適しています。

  • 新DNN対応
  • 感情表現対応
  • 通常
おさむ

おさむ

汎用性にすぐれた声が特徴です。様々な場面で応用が可能です。

  • 新DNN対応
  • 感情表現対応
  • 通常
たいち

たいち

若々しく、個性的な声が特徴です。エンターテイメント分野での利用に最適です。

  • 新DNN対応
  • 感情表現対応
  • 通常
けんた

けんた

優しく聡明で謙虚さが感じられる声色が特徴です。

  • 新DNN対応
  • 感情表現対応
  • 通常
あんず

あんず

優しく一生懸命さが伝わる話し方が特徴です。

  • 新DNN対応
  • 感情表現対応
  • 通常
ちひろ

ちひろ

鼻にかかった愛らしい女の子の声です。

  • 新DNN対応
  • 感情表現対応
  • 通常
こうたろう

こうたろう

可愛くゆっくりとした話し方が特徴です。

  • 新DNN対応
  • 感情表現対応
  • 通常
ゆうと

ゆうと

ハキハキとした賢そうな男の子の声です。

  • 新DNN対応
  • 感情表現対応
  • 通常

音声デモンストレーション

  • 話速

    1

  • 音高

    1

  • 抑揚

    1

  • 怒り

    0

  • 悲しみ

    0

  • 喜び

    0

合成する 合成中 再生中 停止する

音声合成デモで正しく読み上げなかった場合はこちらからご報告下さい

※音声合成デモンストレーションの利用について

本サイト上にて提供している音声合成デモンストレーションコンテンツの2次利用は許可しておりません。
また、本サイト上でのデモンストレーション以外でのご利用は禁止いたします。
本サイトの利用規約についてはこちらもご確認ください。

機能紹介

感情調整機能

感情調整機能

シチュエーションや用途に合わせた感情表現を実現しました。

※一部の話者のみ利用可能です。

テキスト文音声合成変換

テキスト文音声合成変換

テキストから、音声を取得することができます。

話速変換

話速変換

0.5~4.0倍の範囲でスピードの調整が可能です。

イントネーション調整

イントネーション調整

アクセントマークを移動するだけで、最適なイントネーションに調整することが可能です。音量・話速・抑揚等の細かい調整をアクセント句単位で行う事や、調整したイントネーションを登録しておくことができます。

※有料オプションです

ピッチ調整

ピッチ調整

0.5~2.0倍の範囲でピッチ(声の高さ)の調整が可能です。

単語辞書登録

単語辞書登録

特殊な読み方をする単語を辞書として登録・保存することが可能です。

※有料オプションです

ボリューム調整

ボリューム調整

0.0-2.0の音量設定が可能。

話者指定

話者指定

標準語女性8名、男性4名、女の子2名、男の子2の中からお好きな音声を選ぶ事ができます。

*単語登録機能・イントネーション調整機能は関西弁話者には対応しておりません。ご了承ください。

具体的な活用シーン

Webキャンペーン

斬新でおもしろいWebキャンペーンを企画したい
タレントや声優の声を使ったユーザー参加型キャンペーンがやりたい

<AITalk WebAPI×CustomVoiceを使えば・・・>

ユーザーが文字入力をすると本人そっくりの声で喋るキャンペーンの仕組みが実現可能です。

Webキャンペーン

ニュース読上げアプリケーション

収録をせず、旬なニュースをリアルタイムに音声読上げ配信を行いたい
ユーザーが手軽に好きな声を選んでニュースを聞くアプリを作りたい

<AITalk WebAPIを使えば・・・>

アナウンサー不在でもニュースをリアルタイムに読み上げることができます。
男性4名、女性7名、子供4名総勢15名の話者から好きな話者を使用することができます。

ニュース読上げアプリケーション

音声対話

初期構築コスト・運用コストを抑えて手軽に音声合成を使いたい
様々なキャラクターと会話ができるアプリケーションを実現したい

<AITalk WebAPI×CustomVoiceを使えば・・・>

初期の開発コスト、Serverのメンテナンスや監視などの運用コストを抑え音声合成サービスを始める事が可能です。
CustomVoiceを使えばキャラクターなどオリジナルの音声で会話をするアプリケーションが実現可能です。

*音声対話は別途音声認識・意図解釈の仕組みが必要です。

音声対話

電話自動応答(IVR)

可変情報も自動応答で読上げさせたい
初期・運用コストを抑えて手軽に電話自動応答音声に音声合成を使いたい

<AITalk WebAPIを使えば・・・>

オペレーター不在の際でも可変情報をリアルタイムに音声で回答することができます。
初期の開発コスト、Serverのメンテナンスや監視などの運用コストを抑えIVRに音声合成を連携することが可能です

電話自動応答(IVR)

カーナビ

地点名以外の情報も音声で案内したい
どれくらいニーズがあるのかわからないのでまずは試験的にスモールスタートで始めたい

<AITalkを使えば・・・>

予め音声の収録をしていない情報も音声読上げをすることができます。
月額5,000円からスタートすることができるので、試験的にサービスを開始することができます。

カーナビ

電子書籍

書籍の内容を音声化して書籍の付加価値を向上させたい
書籍の内容にあった声を選んで読上げさせたい

<AITalk WebAPIを使えば・・・>

文字情報を投げるだけで書籍の内容を音声として返す仕組みが簡単に構築することができます。
男性4名、女性7名、男の子2名、女の子2名(全て日本語)話者から雰囲気にあう好きな話者を選んで使用することができます。

電子書籍
  • ※本サービスでは音声ファイル単体での再販ならびに第三者への譲渡・貸与は禁止されています。
  • ※本サービスではテレビ・ラジオ等のマス媒体を経由しての宣伝用途での使用は禁止されています。
  • ※AITalkは株式会社エーアイの登録商標です。

当製品に関するお問い合わせはこちら

仕様

プロトコル形式

HTTP、HTTPS(REST)

リクエスト POST/GET(合成文字列をUTF-8でエンコードし送信)
レスポンス

REST(音声データをバイナリデータとして返却)

入力形態

漢字仮名混じり文
韻律記号付き文字列(エーアイ独自形式)
SSML

出力ファイル
フォーマット

OGG/vorbis, AAC, MP3

  • ・サンプリングレート
    8, 16, 22.05, 32, 44.1, 48 [kHz]
  • ・ビットレート
    128 [kbps]
  • ・チャンネル数
    1, 2

WAV

  • ・サンプリングレート
    8, 16, 22.05, 32, 44.1, 48 [kHz]
  • ・ビットレート
    8, 16 [bit]
  • ・チャンネル数
    1, 2

μ-Law, A-Law

  • ・サンプリングレート
    8 kHz
  • ・ビットレート
    8 [bit]
  • ・チャンネル数
    1
設定可能パラメータ

話者、音量、話速、ピッチ、抑揚、ポーズ長

  • ※本サービスでは音声ファイル単体での再販ならびに第三者への譲渡・貸与は禁止されています。
  • ※本サービスではテレビ・ラジオ等のマス媒体を経由しての宣伝用途での使用は禁止されています。
  • ※AITalkは株式会社エーアイの登録商標です。

価格

ミニプラン ベーシックプラン プレミアムプラン
月間最大リクエスト数 300リクエストまで 5000リクエストまで お問合せください
基本料金(消費税別) 5,000円/月 50,000円/月
追加料金*1 5,000円/200リクエスト 3,000円/250リクエスト
合成文字列上限 500文字/1リクエスト 1000文字/1リクエスト

【オプション価格】

チューニング機能(単語・フレーズ編集) 20,000円(初回のみ)

※チューニング機能は関西弁話者には対応しておりません。ご了承ください。

*1:基本合成回数を超えた場合には、追加合成回数に応じて追加料金(別途消費税)が発生します。
※単語登録機能・イントネーション調整機能は関西弁話者には対応しておりません。ご了承ください。
※お支払い方法は、よくあるご質問のお支払方法についてをご確認ください。
※ベーシックプラン以上のプランご利用期間中に限り、本サービスで作成した音声ファイルを固定音声として、または動画等に挿入し再利用することができます。

ご利用開始までの流れ

1お問い合わせ

お問い合わせフォームよりお問い合わせください。

2エーアイからご連絡

担当営業より2営業日以内に折り返しご連絡いたします。

※ご用途やプランなどをヒアリングさせていただき ます

3ID・パスワードご案内

当社よりID・PWを発行しメールにてお送りいたします。

4ご利用開始

お申込みプランの内容に基づきご利用を開始頂けます。ご不明な点はお問い合わせください。

【お知らせ】
・必要事項をご入力のうえ、お問い合わせください。
・お申込み後、担当者から折り返し、ご連絡致します。
・メールの受信設定にご注意ください。

 

AITalk® WebAPI[AICloud]の
主な導入先

すべての事例を見る

その他の製品・サービス

すべての製品・サービスを見る

お問い合わせ・ご相談