シンプルなAPIで自然な音声合成を実現(外国語にも対応)

AITalk® SDK

AITalk® SDKは、人間らしく自然な音声で自由に音声合成をする事ができ、
ライブラリ(dllまたはso)で提供する音声合成SDK(ソフトウェア開発キット)です。
最新バージョンのAITalk®6では、活用シーンや、機器スペックにより、
音声合成方式を選択することで、お客様の理想の音声を実現できます。

AITalk® SDK

主な用途

ロボット/機器への組込み/パッケージソフトへの組込み/接客・店舗支援

提供形態

ライブラリ(dll、so)

機能紹介

60種類以上の言語に対応

60種類以上の言語に対応

英語、中国語、韓国語をはじめとした様々な国や地域64種類の言語に対応。
セレンス社(Cerence Inc.)が提供するCerence TTSを活用した高品質な音声です。

感情調整

感情調整

シチュエーションや用途に合わせた感情表現を実現しました。

※一部の話者のみ利用可能です。

イントネーション調整

イントネーション調整

最適なイントネーションに調整することが可能です。

単語登録

単語登録

業界や分野特有の専門用語や略語、製品名などの固有名詞の読み方を予め登録することが可能です。

ライブラリ(dllまたはso)でのご提供

ライブラリ(dllまたはso)でのご提供

Windows用、Linux用それぞれの環境に適した、利便の良いライブラリーをご提供致します

マルチスレッド対応

マルチスレッド対応

並列での音声合成に対応。高いパフォーマンスを実現します。

外国語音声サンプル

英語(アメリカ)

Evan(男性)
サンプル
Allison(女性)
サンプル
Nathan(男性)
サンプル
Zoe(女性)
サンプル

中国語(北京語)

Bobo(男性)
サンプル
Shasha(女性)
サンプル

韓国語

Minsu(男性)
サンプル
Yuna(女性)
サンプル

スペイン語(メキシコ)

Juan(男性)
サンプル
Paulina(女性)
サンプル

ポルトガル語(ブラジル)

Felipe(男性)
サンプル
Luciana(女性)
サンプル

タイ語

Kanya(女性)
サンプル

ベトナム語

Linh(女性)
サンプル

インドネシア語

Damayanti(女性)
サンプル

その他にも幅広い言語に対応しております。詳細はお問い合わせください。

英語(イギリス・オーストラリア)、中国語(台湾)、広東語(香港)、マレー語、イタリア語、オランダ語、スロバキア語、スウェーデン語、ノルウェー語、ルーマニア語、ドイツ語、フランス語、ロシア語など

具体的な活用シーン

来客通知・番号呼び出しシステム

病院の受付等で、カルテに入力した名前を、リアルタイムで音声呼び出すシステムを実現できます。
画像認識技術等と連携することで、画像と顧客情報を照合し、来客を音声で通知できるシステムを実現できます。

来客通知・番号呼び出しシステム

自動放送システム

防災行政無線や、館内放送などの放送システムにAITalk® SDKを実装し、可変的な情報でもリアルタイムで音声合成し、放送することができます。

自動放送システム

作業指示システム

生産現場において、作業内容の音声指示をおこない、ハンズフリー・アイズフリーによる作業指示を実現することができます。
新製品や、作業内容の変更も、AITalk® SDKのリアルタイム音声合成により即対応することができます。

作業指示システム

開発時のシステム構成イメージ

防災システム・STB

中間言語(テキストデータ)の送信により通信データ量を軽減・運用側で放送音声を合成/確認・STBへ送信する中間言語を生成

来客通知・番号呼び出しシステム

名前読みに特化した言語辞書のカスタマイズが可能(別途カスタマイズ費用が発生)

作業指示システム

チューニングツールAITalk 声の職人で作成したユーザー辞書により、製品名・作業内容の読み方を正しく登録

ソフトウェア・アプリケーション

開発時に作成したプログラムをそのまま配布可能

AITalk SDK 動作環境

OS (Windows)

Windows 11 日本語版 (64 bit)
Windows 10 日本語版 (64 bit)
Windows Server 2022 日本語版 (64 bit)
Windows Server 2019 日本語版 (64 bit)
Windows Server 2016 日本語版 (64 bit)

OS (Linux)

Red Hat Enterprice Linux 9
Red Hat Enterprice Linux 8
Debian 12
Debian 11
Ubuntu 22.04 LTS
Ubuntu 20.04 LTS

CPU

日本語(波形接続合成方式): Intel Core i3 または AMD 同等以上のプロセッサ
日本語(新DNN音声合成方式): Intel Core i7-8700 または AMD 同等以上のプロセッサ
外国語: Intel Core i3 または AMD 同等以上のプロセッサ

※ 新DNN方式の話者を使用してストリーミング再生を行う場合、指定未満の環境では音飛びが発生いたします。ご注意ください。
※ AVX拡張子命令対応のプロセッサが必要です。

メモリ

日本語(波形接続合成方式):約 250 MB
日本語(新DNN音声合成方式): 約 1,100 MB
外国語: 約 100 MB

※利用する話者やマルチスレッド利用等によって使用量は増減す可能性がございます。あらかじめご注意ください。

HDD/SSD

製品単体: 約 450 MB
日本語 1 話者:
 波形接続合成方式: 約 900 MB
 新DNN音声合成方式: 約 200 MB
外国語 1 話者: 約 250 MB

開発環境

Windows :Microsoft Visual Studio 2015 Update 3 以降
Linux :gcc-8 以降

開発言語

C/C++

※他の開発言語を使用する場合は、FFI を作成していただく必要がございます。

ファイル
フォーマット

16 bit リニア PCM 形式

サンプリング
周波数

日本語:
 48kHz
外国語:
 22kHz

※その他のサンプリング周波数 (22 kHz, 16kHz など) については別途お問い合わせください。

対応中間言語
(入力のみ)

日本語:
 JEITA TT-6004 規格

  • ※ 当製品は OSS を利用しています。製品同梱のライセンス情報をご確認ください。
  • ※ 記載以外の開発環境は別途お問い合わせください。

価格

AITalk® SDK は、開発時に必要な基本ライセンス+商用利用時に必要な商用ライセンスとなります。

価格についてのご質問や音声合成活用全般に関してのご相談を受け付けています。
ライセンス形態や価格などご不明な点についてお気軽にお問い合わせください。

お問い合わせはこちら

2024/1/17 リニューアル!
リニューアル内容はこちらからご確認ください。

※一部話者に用途制限があります

AITalk® SDKの
主な導入先

すべての事例を見る

その他の製品・サービス

すべての製品・サービスを見る

資料ダウンロード

お問合せはこちら

お電話でのお問合せ

TEL.03-6801-8461

営業時間
10:00〜17:00
(土日・祝休)

お困りですか?

よくいただくご質問にお答えしています。

導入のきっかけや活用方法・導入後の効果などを、
インタビュー形式でご紹介します。