システム要件

注釈

記載以外の開発環境は別途お問い合わせください。

AITalk®5 SDK (Windows)

OS バージョン

Windows 10 日本語版(64 bit)
Windows 8.1 日本語版(64 bit)
Windows Server 2019 日本語版
Windows Server 2016 日本語版
Windows Server 2012 R2 日本語版
Windows Server 2012 日本語版

CPU

Intel Pentium 4 又はAMD Athlon 64以上のプロセッサ 1

メモリ

約 600 MB (1 話者使用時) 2

HDD

約 600 MB (1 話者使用時) 2
※話者 1 名につき 300 MB 程度の追加
※DNN 音声合成の話者は、1 名につき 20 MB 程度の追加

開発環境

Microsoft Visual Studio 2015 Update 3
Microsoft Visual Studio 2017
Microsoft Visual Studio 2019

開発言語

C/C++
C# (.NET Framework)
※Java は動作実績がございます。別途お問い合わせください。

ファイルフォーマット

16 bit リニア PCM 形式
8 bit リニア PCM 形式
8 bit μ-Law PCM 形式

サンプリング周波数

48 kHz, 22 kHz, 16 kHz
話者により異なります。3

対応中間言語フォーマット

AI 独自規格
JEITA TT-6004 規格

AITalk®5 SDK (Linux)

OS バージョン

Red Hat Enterprise Linux: 7(64-bit), 8(64-bit)
Cent OS: 7(64-bit), 8(64-bit)
Ubuntu: 18.04 LTS (64-bit), 20.04 LTS (64-bit)

CPU

Intel Pentium 4 又はAMD Athlon 64以上のプロセッサ 1

メモリ

約 600 MB (1 話者使用時) 2

HDD

約 600 MB (1 話者使用時) 2
※話者 1 名につき 300 MB 程度の追加
※DNN 音声合成の話者は、1 名につき 20 MB 程度の追加

開発環境

gcc-7 以降

開発言語

C/C++
C# (Mono)
※Java は動作実績がございます。別途お問い合わせください。

ファイルフォーマット

16 bit リニア PCM 形式
8 bit リニア PCM 形式
8 bit μ-Law PCM 形式

サンプリング周波数

48 kHz, 22 kHz, 16 kHz
話者により異なります。3

対応中間言語フォーマット

AI 独自規格
JEITA TT-6004 規格

AITalk®5 micro (iOS)

OS バージョン

iOS 10.0 以上

メモリ

日本語解析あり
約 30 MB 〜 45 MB (1 話者使用時)
※話者1名につき約 10 ~ 20 MBの追加
日本語解析なし
約 10 ~ 20 MB (1 話者使用時)
※話者1名につき約 10 ~ 20 MBの追加

HDD

日本語解析あり
65 ~ 100 MB(1話者の場合)
※話者1名につき約 40 MBの追加
日本語解析なし
50 MB(1話者の場合)
※話者1名につき約 40 MBの追加

開発言語

Swift/Objective-C からの C 関数呼び出しによる利用

ファイルフォーマット

16 bit リニア PCM 形式
8 bit リニア PCM 形式
8 bit μ-Law PCM 形式

サンプリング周波数

24 kHz 3

対応中間言語フォーマット

AI 独自規格
JEITA TT-6004 規格

AITalk®5 micro (Android)

OS バージョン

Android 4.1(API レベル 16)以上

メモリ

日本語解析あり
約 30 MB 〜 45 MB (1 話者使用時)
※話者1名につき約 10 ~ 20 MBの追加
日本語解析なし
約 10 ~ 20 MB (1 話者使用時)
※話者1名につき約 10 ~ 20 MBの追加

HDD

日本語解析あり
75 ~ 110 MB(1話者の場合)
※話者1名につき約 40 MBの追加
日本語解析なし
60 MB(1話者の場合)
※話者1名につき約 40 MBの追加

開発言語

Java

ファイルフォーマット

16 bit リニア PCM 形式
8 bit リニア PCM 形式
8 bit μ-Law PCM 形式

サンプリング周波数

24 kHz 3

対応中間言語フォーマット

AI 独自規格
JEITA TT-6004 規格

AITalk®5 micro (Raspberry-Pi)

OS バージョン

Raspbian Buster(Kernel version 5.4)にて動作確認済み | これより古い OS バージョンについてはお問い合わせください。

メモリ

日本語解析あり
約 30 MB 〜 45 MB (1 話者使用時)
※話者1名につき約 10 ~ 20 MBの追加
日本語解析なし
約 10 ~ 20 MB (1 話者使用時)
※話者1名につき約 10 ~ 20 MBの追加

HDD

日本語解析あり
75 ~ 110 MB(1話者の場合)
※話者1名につき約 40 MBの追加
日本語解析なし
60 MB(1話者の場合)
※話者1名につき約 40 MBの追加

開発言語

C/C++
C# (Mono)
※Java は動作実績がございます。別途お問い合わせください。

ファイルフォーマット

16 bit リニア PCM 形式
8 bit リニア PCM 形式
8 bit μ-Law PCM 形式

サンプリング周波数

24 kHz 3

対応中間言語フォーマット

AI 独自規格
JEITA TT-6004 規格
1(1,2)

DNN パラメトリック音声合成の音声辞書のご利用には AVX 拡張命令対応のプロセッサが必要です。 (Intel "Sandy Bridge" Core i3 以上, AMD Bulldozer, AMD Jaguar 以上のプロセッサ)

2(1,2,3,4)

AITalk の利用する領域です。動作には、OS などの利用する領域が別途必要です。 また、話者によって必要な大きさは異なります。この値は「のぞみ」で計測した参考値です。

3(1,2,3,4,5)

記載以外のサンプリング周波数の音声辞書については別途お問い合わせください。 付属するリサンプリング処理機能によって 48 kHz, 44 kHz, 24 kHz, 22 kHz, 16 kHz, 8 kHz に変換可能です。