AITalk® micro

AITalk® micro

AITalk® microは、Android・iOSに対応した組み込み用小型音声合成SDKです。
小型ながらも充実した機能を提供します。

AITalk® micro

主な用途

スマートフォンアプリケーション/オートモーティブ/ロボット/ゲーム

提供形態

ライブラリ(dll、so)

機能紹介

自由文音声合成・保存

自由文音声合成・保存

任意の文章を人間の声に近い自然な音声で合成し、音声ファイルとして保存します。

モバイルOS対応

モバイルOS対応

iOS / Android / 組込Linux に対応

低容量・低リソース

低容量・低リソース

さまざまな機器への組込みが可能な低容量・低リソースを実現

感情調整

感情調整

シチュエーションや用途に合わせた感情表現を実現しました。

※一部の話者のみ利用可能です。

入力対応

入力対応

入力は、漢字かな交じり日本語テキスト及び、中間表記(AI独自規格、JEITA TT-6004規格)に対応。

汎用PC向けSDKとの統一API

汎用PC向けSDKとの統一API

AITalk5 SDKとAPIを統一することで同等の機能を実現できるようになりました。※一部制限あり

日本語解析を分離した省サイズ辞書

日本語解析を分離した省サイズ辞書

親機(PC上の声の職人など)で高精度、大容量の日本語解析を行い、子機(micro SDK)で日本語なし辞書を使うことで省メモリ・ディスクで高品質な合成が行なえます。

フレーズ辞書・記号ポーズ辞書機能

フレーズ辞書・記号ポーズ辞書機能

声の職人で作成したフレーズ辞書・記号ポーズ辞書を読み込めるようになりました。

ユーザー辞書機能

ユーザー辞書機能

地名や名前などの特殊な読み方をする単語を辞書として登録・保存が可能です。

ユーザー辞書機能の複数ロード機能

ユーザー辞書機能の複数ロード機能

ユーザ単語辞書を同時に適用できるようになりました。

ルビ機能

ルビ機能

同じ漢字でも読み方が文章内で違う物等、ルビ記法で読み方を指定できます。

ブックマーク機能

ブックマーク機能

文中任意の位置にブックマークを設定できます。コールバック関数にてブックマークに関する情報を取得できます。

音声効果タグ機能

音声効果タグ機能

日本語テキスト中で、各種パラメーター値の指定や、ブックマークを付けることが可能です。

音声ファイル挿入機能

音声ファイル挿入機能

制御タグにより、入力テキスト中に任意のwavファイルを挿入できるようになりました。

ポーティング

ポーティング

多彩なOS向けにポーティング可能です。

具体的な活用シーン

スマートフォン・タブレットアプリケーション

キャラクターが名前を読み上げてくれるゲームや、ニュース読み上げなど、リアルタイム音声合成が可能なアプリケーションを開発することができます。

スマートフォン・タブレットアプリケーション

ウェアラブルデバイス

スマートウォッチや、ワイヤレスイヤホンの通知音声、音声翻訳機など、小型機器に音声合成エンジンを組み込むことができます。

ウェアラブルデバイス

ナビゲーション・PND

全国の交差点や通りの名称など、すべて録音をすると膨大な量になるナビゲーションの音声ですが、音声合成エンジンをご利用頂くことで収録の手間を省き、名前の変更や新規追加に伴う差し替えも簡単になります。

ナビゲーション・PND

ロボット

コミュニケーションロボット・サービスロボット・産業用ロボットなどの自由な発話を、音声合成で実現できます。

ロボット

開発時のシステム構成イメージ

Serverとmicroを活用した
ハイブリットシステム(ニュース配信)

システム側のAITalk®Server® により高品質な言語解析が可能・中間言語を端末側にキャッシュしておくことでオフライン状態でも音声合成が可能

外部サービスとの連携
(音声対話システム)

機器スペック、合成数に応じてAICloud連携または機器へAITalk搭載を選択可能

動作環境

OS バージョン
(iOS)

iOS 10.0 以上

RAM

日本語解析あり

約30MB〜45MB (1話者使用時)

※話者1名につき約10~20MBの追加

日本語解析なし

約10~20MB (1話者使用時)

※話者1名につき約10~20MBの追加

ROM/HDD

日本語解析あり

65~100MB(1話者の場合)

※話者1名につき約40MBの追加

日本語解析なし

50MB(1話者の場合)

※話者1名につき約40MBの追加

開発言語

Swift/Objective-C からの C 関数呼び出しによる利用

ファイル
フォーマット

16bit リニア PCM 形式
8bit リニア PCM 形式
8bit μ-Law PCM 形式

サンプリング
周波数

24 kHz *1

対応中間言語
フォーマット

AI 独自規格
JEITA TT-6004 規格

OS バージョン
(Android)

Android 4.1(API レベル 16)以上

RAM

日本語解析あり

約30MB〜45MB (1話者使用時)

※話者1名につき約10~20MBの追加

日本語解析なし

約10~20MB (1話者使用時)

※話者1名につき約10~20MBの追加

ROM/HDD

日本語解析あり

75~110MB(1話者の場合)

※話者1名につき約40MBの追加

日本語解析なし

60MB(1話者の場合)

※話者1名につき約40MBの追加

開発言語

Java

ファイル
フォーマット

16bit リニア PCM 形式
8bit リニア PCM 形式
8bit μ-Law PCM 形式

サンプリング
周波数

24kHz *1

対応中間言語
フォーマット

AI 独自規格
JEITA TT-6004 規格

OS バージョン
(Raspberry-Pi)

Raspbian Buster(kernel version 5.4)以降
Ubuntu 18.04 (64bit)(kernel version 5.4)以降
これより古い OS、kernel バージョンについてはお問い合わせください。

RAM

日本語解析あり

約30MB〜45MB (1話者使用時)

※話者1名につき約10~20MBの追加

日本語解析なし

約10~20MB (1話者使用時)

※話者1名につき約10~20MBの追加

ROM/HDD

日本語解析あり

75~110MB(1話者の場合)

※話者1名につき約40MBの追加

日本語解析なし

60MB(1話者の場合)

※話者1名につき約40MBの追加

開発言語

C/C++
C# (Mono)

※Java は動作実績がございます。別途お問い合わせください。

ファイル
フォーマット

16bit リニア PCM 形式
8bit リニア PCM 形式
8bit μ-Law PCM 形式

サンプリング
周波数

24kHz *1

対応中間言語
フォーマット

AI 独自規格
JEITA TT-6004 規格

*1:記載以外のサンプリング周波数の音声辞書については別途お問い合わせください。付属するリサンプリング処理機能によって 48 kHz, 44 kHz, 24kHz, 22 kHz, 16 kHz, 8 kHz に変換可能です。

※ 記載以外の開発環境は別途お問い合わせください。

価格

AITalk® microは、開発時に必要な基本ライセンス+商用利用時に必要な商用ライセンスとなります。

価格についてのご質問や音声合成活用全般に関してのご相談を受け付けています。
ライセンス形態や価格などご不明な点についてお気軽にお問い合わせください。

お問い合わせはこちら

AITalk® microの
主な導入先

すべての事例を見る

その他の製品・サービス

すべての製品・サービスを見る

お問い合わせ・ご相談

導入実績2000社突破 ai Talkを活用しきるポイント 導入事例集をダウンロード