シンプルなAPIで自然な音声合成を実現(外国語にも対応)
AITalk® SDKは、人間らしく自然な音声で自由に音声合成をする事ができ、
ライブラリ(dllまたはso)で提供する音声合成SDK(ソフトウェア開発キット)です。
最新バージョンのAITalk®6では、活用シーンや、機器スペックにより、
音声合成方式を選択することで、お客様の理想の音声を実現できます。
ロボット/機器への組込み/パッケージソフトへの組込み/接客・店舗支援
英語、中国語、韓国語をはじめとした様々な国や地域64種類の言語に対応。
セレンス社(Cerence Inc.)が提供するCerence TTSを活用した高品質な音声です。
シチュエーションや用途に合わせた感情表現を実現しました。
※一部の話者のみ利用可能です。
最適なイントネーションに調整することが可能です。
業界や分野特有の専門用語や略語、製品名などの固有名詞の読み方を予め登録することが可能です。
Windows用、Linux用それぞれの環境に適した、利便の良いライブラリーをご提供致します
並列での音声合成に対応。高いパフォーマンスを実現します。
その他にも幅広い言語に対応しております。詳細はお問い合わせください。
英語(イギリス・オーストラリア)、中国語(台湾)、広東語(香港)、マレー語、イタリア語、オランダ語、スロバキア語、スウェーデン語、ノルウェー語、ルーマニア語、ドイツ語、フランス語、ロシア語など
病院の受付等で、カルテに入力した名前を、リアルタイムで音声呼び出すシステムを実現できます。
画像認識技術等と連携することで、画像と顧客情報を照合し、来客を音声で通知できるシステムを実現できます。
防災行政無線や、館内放送などの放送システムにAITalk® SDKを実装し、可変的な情報でもリアルタイムで音声合成し、放送することができます。
生産現場において、作業内容の音声指示をおこない、ハンズフリー・アイズフリーによる作業指示を実現することができます。
新製品や、作業内容の変更も、AITalk® SDKのリアルタイム音声合成により即対応することができます。
OS (Windows) |
Windows 11 日本語版 (64 bit) |
---|---|
OS (Linux) |
Red Hat Enterprice Linux 9 |
CPU |
日本語(波形接続合成方式): Intel Core i3 または AMD 同等以上のプロセッサ ※ 新DNN方式の話者を使用してストリーミング再生を行う場合、指定未満の環境では音飛びが発生いたします。ご注意ください。 |
メモリ |
日本語(波形接続合成方式):約 250 MB ※利用する話者やマルチスレッド利用等によって使用量は増減す可能性がございます。あらかじめご注意ください。 |
HDD/SSD |
製品単体: 約 450 MB |
開発環境 |
Windows :Microsoft Visual Studio 2015 Update 3 以降 |
開発言語 |
C/C++ ※他の開発言語を使用する場合は、FFI を作成していただく必要がございます。 |
ファイル フォーマット |
16 bit リニア PCM 形式 |
サンプリング 周波数 |
日本語: ※その他のサンプリング周波数 (22 kHz, 16kHz など) については別途お問い合わせください。 |
対応中間言語 (入力のみ) |
日本語: |
AITalk® SDK は、開発時に必要な基本ライセンス+商用利用時に必要な商用ライセンスとなります。
価格についてのご質問や音声合成活用全般に関してのご相談を受け付けています。
ライセンス形態や価格などご不明な点についてお気軽にお問い合わせください。
※一部話者に用途制限があります