サーバー設置型音声合成 AITalk(R) Server

サーバー設置型音声合成 AITalk(R) Serverの製品概要

AITalk(R)は、コーパスベース音声合成方式を採用し、より人間らしく自然な音声で自由に音声合成をすることができます。そして、そのAITalk(R)方式を使用して、サーバー設置型として開発された音声合成 AITalk(R) Serverは、データベース化された人間の声により、指定された任意の文章を合成音声として出力するServer用途向け音声合成エンジンです。

サーバー設置型音声合成 AITalk(R) Serverの特徴

  • 人の声をベースとした高音質音声合成
  • ユーザー辞書機能搭載
  • イントネーションの調整機能搭載
  • 3時間程度の音声収録で誰の声でもデータベースを作成することが可能
  • ソケット通信によるXMLフォーマットによるインターフェース
  • マルチスレッド対応

コーパスベース音声合成方式の仕組み

コーパスベース音声合成方式の仕組み

サーバー設置型音声合成 AITalk(R) Server 構成図

サーバー設置型音声合成 AITalk(R) Server 構成図:インターネットでの利用→Webサーバ⇔AITakサーバー⇔IVRサーバー→電話での利用
	※データ連携はSocket通信によるXML形式での連携となります。

AITalk(R) 声の職人 動作環境

CPU Pentium4 又はそれ以上の互換CPU
(1GHz以上を推奨)
メモリ 1GB以上
HDD 1GB以上 *1
OS Windows 2003/2008
Red Hat Enterprize Linux 5.0
Cent OS 5.3
ファイルフォーマット*2 16KHz 16bit Linear PCM
8KHz 16bit Linear PCM
11.025KHz 8bit Linear PCM*3
8KHz 8bit Linear PCM
8KHz 8bit μ Law
8KHz 8bit μ Law(ヘッダ無し)
MP3*4
  • *1:使用する話者が1名の場合。話者1名の追加につき、300MB程度
  • *2:音声はモノラルとなります。
  • *3:Windows版のみの対応となります。GNU Lesser General Public License(LGPL)に基づいてライセンスされているソフトウェア(sox.dll)を使用しています。なお、LGPLの詳細につきましては、こちらより詳細をご参照ください。
  • *4:MP3のエンコーダとして、GNU Lesser General Public License(LGPL)に基づいてライセンスされているソフトウェア(gogo.dll)を使用しています。尚、LGPLの詳細につきましては、こちらより詳細をご参照ください。