AITalk® microは、Android・iOSに対応した組み込み用小型音声合成SDKです。
小型ながらも充実した機能を提供します。
スマートフォンアプリケーション/オートモーティブ/ロボット/ゲーム
任意の文章を人間の声に近い自然な音声で合成し、音声ファイルとして保存します。
iOS / Android / 組込Linux に対応
さまざまな機器への組込みが可能な低容量・低リソースを実現
シチュエーションや用途に合わせた感情表現を実現しました。
※一部の話者のみ利用可能です。
入力は、漢字かな交じり日本語テキスト及び、中間表記(AI独自規格、JEITA TT-6004規格)に対応。
AITalk5 SDKとAPIを統一することで同等の機能を実現できるようになりました。※一部制限あり
親機(PC上の声の職人など)で高精度、大容量の日本語解析を行い、子機(micro SDK)で日本語なし辞書を使うことで省メモリ・ディスクで高品質な合成が行なえます。
声の職人で作成したフレーズ辞書・記号ポーズ辞書を読み込めるようになりました。
地名や名前などの特殊な読み方をする単語を辞書として登録・保存が可能です。
ユーザ単語辞書を同時に適用できるようになりました。
同じ漢字でも読み方が文章内で違う物等、ルビ記法で読み方を指定できます。
文中任意の位置にブックマークを設定できます。コールバック関数にてブックマークに関する情報を取得できます。
日本語テキスト中で、各種パラメーター値の指定や、ブックマークを付けることが可能です。
制御タグにより、入力テキスト中に任意のwavファイルを挿入できるようになりました。
多彩なOS向けにポーティング可能です。
キャラクターが名前を読み上げてくれるゲームや、ニュース読み上げなど、リアルタイム音声合成が可能なアプリケーションを開発することができます。
スマートウォッチや、ワイヤレスイヤホンの通知音声、音声翻訳機など、小型機器に音声合成エンジンを組み込むことができます。
全国の交差点や通りの名称など、すべて録音をすると膨大な量になるナビゲーションの音声ですが、音声合成エンジンをご利用頂くことで収録の手間を省き、名前の変更や新規追加に伴う差し替えも簡単になります。
コミュニケーションロボット・サービスロボット・産業用ロボットなどの自由な発話を、音声合成で実現できます。
OS バージョン (iOS) |
iOS 12.0 以上 (Xcode 15) その他バージョンについてはお問い合わせください。 |
---|---|
RAM |
日本語解析あり 約30MB〜45MB (1話者使用時) ※話者1名につき約10~20MBの追加 日本語解析なし 約10~20MB (1話者使用時) ※話者1名につき約10~20MBの追加 |
ROM(Flash ROM) |
日本語解析あり 65~100MB(1話者の場合) ※話者1名につき約40MBの追加 日本語解析なし 50MB(1話者の場合) ※話者1名につき約40MBの追加 |
開発言語 |
Swift/Objective-C からの C 関数呼び出しによる利用 |
ファイル フォーマット |
16bit リニア PCM 形式 |
サンプリング 周波数 |
24 kHz *1 |
対応中間言語 フォーマット |
AI 独自規格 |
OS バージョン (Android) |
Android 4.1(API レベル 16)以上 |
---|---|
RAM |
日本語解析あり 約30MB〜45MB (1話者使用時) ※話者1名につき約10~20MBの追加 日本語解析なし 約10~20MB (1話者使用時) ※話者1名につき約10~20MBの追加 |
ROM(Flash ROM) |
日本語解析あり 75~110MB(1話者の場合) ※話者1名につき約40MBの追加 日本語解析なし 60MB(1話者の場合) ※話者1名につき約40MBの追加 |
開発言語 |
Java |
ファイル フォーマット |
16bit リニア PCM 形式 |
サンプリング 周波数 |
24kHz *1 |
対応中間言語 フォーマット |
AI 独自規格 |
OS (Linux) |
Ubuntu 24.04 LTS |
---|---|
CPU |
Raspberry Pi 4 |
RAM |
日本語 (波形接続合成方式):約 100 MB |
ROM(Flash ROM) |
製品本体:約 45 MB ※利用する話者やマルチスレッド利用等によって使用量は増減する可能性がございます。あらかじめご注意ください。 |
開発環境 |
gcc-10 以降 |
開発言語 |
C/C++ ※他の開発言語を使用する場合は、FFIを作成していただく必要がございます。 |
ファイル フォーマット |
16 bit リニア PCM 形式 (Little Endian) |
サンプリング 周波数 |
日本語:24kHz ※話者のデフォルト周波数になります。 |
対応中間言語 (入力のみ) |
日本語:JEITA TT-6004 規格 |
※ 当製品は OSS を利用しています。製品同梱のライセンス情報をご確認ください。
※ 記載以外の開発環境は別途お問い合わせください。
AITalk® microは、開発時に必要な基本ライセンス+商用利用時に必要な商用ライセンスとなります。
価格についてのご質問や音声合成活用全般に関してのご相談を受け付けています。
ライセンス形態や価格などご不明な点についてお気軽にお問い合わせください。