AI 中間言語¶
AITalk 製品の扱う AITalk 独自の中間言語を説明します。 以降「AITalk 独自の中間言語」は「AI 中間言語」と記します。
日本語テキストから音声合成する場合、AITalk はテキスト処理を行ったのちに音声を作成します。 テキスト処理によって作成されるのが AI 中間言語です。 AITalk では日本語テキストから AI 中間言語を得ることや、 AI 中間言語から音声合成することができます。
AI 中間言語は読み方を指定します。 日本語テキストは漢字の音読み・訓読みなどで、同じ表記でも別の読み方になることがあります。 テキスト処理によって作られた AI 中間言語を音声合成の入力にすれば、AITalk に一意の読み方を指定することができます。
AI 中間言語は以下から構成されます。
カタカナで表記される「読み」
「韻律記号」(アクセント、ポーズ位置、ポーズ長など)
「制御タグ」(音声辞書、音量、話速、ポーズなど)
注釈
制御タグは日本語テキストからも入力できます。 制御タグの詳細は 制御タグ を参照してください。
目次
AI 中間言語仕様¶
韻律記号¶
AI 中間言語で使用される韻律記号の一覧を次に示します。
No |
記号名 |
韻律記号 |
ASCII コード |
機能 |
---|---|---|---|---|
1 |
|
|
文の先頭を示す記号 |
|
2 |
|
|
平叙文の文末を示す記号 |
|
|
|
疑問文の文末を示す記号 |
||
|
|
上昇調の文末を示す記号 |
||
|
|
文の途中での終了を示す記号 |
||
|
|
体言止めを示す記号 |
||
|
|
急激な終了を示す記号 |
||
3 |
|
|
アクセントの区切りを示す記号
数字を省略した場合は |
|
|
|
数字を省略した場合は |
||
4 |
|
|
フレーズの区切りを示す記号
数字を省略した場合は |
|
5 |
|
|
ポーズを示す記号 |
|
6 |
|
|
アクセントの上がり目を示す記号 |
|
7 |
|
|
アクセントの下がり目を示す記号 |
|
8 |
|
|
直前の母音を無声化させる記号 |
|
9 |
|
|
直前の母音を有声化させる記号 |
(注) 韻律記号で使用可能な文字コードは ASCII となります。
文頭記号: <S>
¶
文の先頭を示します。 先頭に記載が必要です。
文末記号: <F>
<R>
<H>
<C>
<N>
<A>
¶
文の終端を示します。 文末にいずれかの記載が必要です。
<F>
は平叙文の文末に使用します。<R>
は疑問文の文末に使用します。<H>
は上昇調の文末に使用します。<C>
は文の途中で終了しているときに使用します。<N>
は体言止めの文末に使用します。<A>
は急激に終了する文末に使用します。
※ 文末記号は、音声辞書や文章によっては効果がない場合があります。
アクセント区切り記号: |
/
¶
|
はアクセント句、 /
は副次アクセント句の区切りを示します。
アクセント句は、アクセントを形成する最小の単位です。 アクセント句にはアクセントの上がり目および下がり目を、それぞれ最大 1 個まで記載することができます。
副次アクセント句は、弱いアクセント (アクセント句の中で上下動が少ないアクセント) 句です。
|
/
の後の数字 (0, 1, 2) は、アクセント区切り記号を挟む前後のアクセント句の相対的なピッチの関係を示します。
|0
(/0
): アクセント区切り記号を挟んでピッチが下がります。|1
(/1
): アクセント区切り記号の前後で同程度のピッチとなります。|2
(/2
): アクセント区切り記号を挟んでピッチが上がります。|
(/
): 数字を省略した場合は|0
(/0
) と同じです。
|
/
の後の数字は、音声辞書によっては効果がない場合があります。
|
と /
は、音声辞書によっては差異がでない場合があります。
フレーズ区切り記号: $
¶
フレーズの区切りを示します。 同時にアクセント句の区切りも示します。
フレーズとは、1 つの発話で発声するアクセント句のかたまりを示します。
$
の後の数字 (0, 1, 2) は、フレーズ区切り記号を挟む前後のフレーズの相対的なピッチの関係を示します。
$0
: フレーズ区切り記号を挟んでピッチが下がります。$1
: フレーズ区切り記号の前後で同程度のピッチとなります。$2
: フレーズ区切り記号を挟んでピッチが上がります。$
: 数字を省略した場合は$1
と同じです。
$
の後の数字は、音声辞書によっては効果がない場合があります。
ポーズ記号: _
¶
アクセント区切り記号またはフレーズ区切り記号の後ろに記載し、ポーズを挿入することを示します。
アクセント区切り記号の後のポーズは、フレーズ区切り記号の後より短くなります。
複数連続して記載すると、長いポーズが作成されます。
_0
, _1
, _2
で異なる長さのポーズを指定できます。
_0
: 一瞬のポーズです。_1
: 短めのポーズです。_2
: 長めのポーズです。_
: 数字を省略した場合は_1
と同じです。
アクセント上昇記号: ^
¶
モーラを構成するカナの間に記載し、アクセントの上がり目を示します。 モーラとは、日本語の読み上げるまとまりを意味し、読み に対応しています。
1 つのアクセント句の中に最大 1 つ記載します。
標準語では、先頭のモーラの直後にアクセント下降記号がない場合は、そこに上昇記号を入れてください。 先頭のモーラの直後以外はどの位置にも付加しません。
関西弁では、アクセント下降記号がある場合は、下降記号より前に上昇記号を入れてください。 一般的に下降記号の 1 モーラ前に上昇記号を記載します。
アクセント下降記号: !
¶
モーラを構成するカナの間に記載し、アクセントの下がり目を示します。 モーラとは、日本語の読み上げるまとまりを意味し、読み に対応しています。
1 つのアクセント句の中に最大 1 つ記載します。
アクセント句の中で「高」から「低」に変化する部分の、「高」のモーラの後ろに記載します。
無声化記号: D
¶
直前の母音を無声化させます。
母音の無声化 / 有声化は、音声合成エンジンにより自動的に判別されます。
母音の直後に D
を指定することで、強制的に無声化させることができます。
音声辞書によっては効果がない場合があります。
有声化記号: V
¶
直前の母音を有声化させます。
母音の無声化 / 有声化は、音声合成エンジンにより自動的に判別されます。
母音の直後に V
を指定することで、強制的に有声化させることができます。
音声辞書によっては効果がない場合があります。
読み¶
AI 中間言語で使用される「読み」の一覧を次に示します。
読み の一覧 |
||||||||||
---|---|---|---|---|---|---|---|---|---|---|
ア |
イ |
ウ |
エ |
オ |
ヒャ |
ヒュ |
ヒェ |
ヒョ |
||
ヴ |
ファ |
フィ |
フェ |
フォ |
||||||
カ |
キ |
ク |
ケ |
コ |
フャ |
フュ |
フョ |
|||
ガ |
ギ |
グ |
ゲ |
ゴ |
プァ |
プィ |
プェ |
プォ |
||
カ゜ |
キ゜ |
ク゜ |
ケ゜ |
コ゜ |
ピャ |
ピュ |
ピェ |
ピョ |
||
サ |
シ |
ス |
セ |
ソ |
ブァ |
ブィ |
ブェ |
ブォ |
||
ザ |
ジ |
ズ |
ゼ |
ゾ |
ビャ |
ビュ |
ビェ |
ビョ |
||
タ |
チ |
ツ |
テ |
ト |
ヴァ |
ヴィ |
ヴェ |
ヴォ |
||
ダ |
ヂ |
ヅ |
デ |
ド |
ヴャ |
ヴュ |
ヴョ |
|||
ナ |
ニ |
ヌ |
ネ |
ノ |
ムァ |
ムィ |
ムェ |
ムォ |
||
ハ |
ヒ |
フ |
ヘ |
ホ |
ミャ |
ミュ |
ミェ |
ミョ |
||
パ |
ピ |
プ |
ペ |
ポ |
ルァ |
ルィ |
ルェ |
ルォ |
||
バ |
ビ |
ブ |
ベ |
ボ |
リャ |
リュ |
リェ |
リョ |
||
マ |
ミ |
ム |
メ |
モ |
ウィ |
ウェ |
ウォ |
|||
ラ |
リ |
ル |
レ |
ロ |
イェ |
|||||
ヤ |
ユ |
ヨ |
スゥィ |
|||||||
ワ |
ン |
ッ |
ー |
ズゥィ |
||||||
クァ |
クィ |
クェ |
クォ |
トゥァ |
トゥィ |
トゥェ |
トゥォ |
|||
キャ |
キュ |
キェ |
キョ |
ドゥァ |
ドゥィ |
ドゥェ |
ドゥォ |
|||
グァ |
グィ |
グェ |
グォ |
ティェ |
||||||
ギャ |
ギュ |
ギェ |
ギョ |
ディェ |
||||||
スァ |
スィ |
スェ |
スォ |
フィェ |
||||||
シャ |
シュ |
シェ |
ショ |
ヴゥァ |
ヴゥィ |
ヴゥェ |
ヴゥォ |
|||
ズァ |
ズィ |
ズェ |
ズォ |
ヴィェ |
||||||
ジャ |
ジュ |
ジェ |
ジョ |
ギャ |
ギュ |
ギェ |
ギョ |
|||
トゥ |
グァ |
グィ |
グェ |
グォ |
||||||
ドゥ |
||||||||||
テャ |
ティ |
テュ |
テョ |
|||||||
ツァ |
ツィ |
ツェ |
ツォ |
|||||||
チャ |
チュ |
チェ |
チョ |
|||||||
デャ |
ディ |
デュ |
デョ |
|||||||
ヌァ |
ヌィ |
ヌェ |
ヌォ |
|||||||
ニャ |
ニュ |
ニェ |
ニョ |
- (注1)
読み記号は全角カタカナとなります。
- (注2)
読み記号の文字コードは
UTF-8
またはCP932 (Shift-JIS)
となります。- (注3)
これは AITalk が受け付けることのできる読みを全て記載した表です。 使用する音声辞書によっては収録されていない音も含んでおり、それらはよく似た他の音に変換して出力されます。
AI 中間言語の記述例¶
AI 中間言語での記述例を以下に列挙します。
平叙文¶
日本語 |
白い花が咲いている。 |
中間言語 |
<S>シ^ロ!イ|ハ^ナ!ガ|_サ^イテイル<F> |
疑問文¶
日本語 |
お元気ですか? |
中間言語 |
<S>オ^ゲ!ンキデスカ<R> |
平叙文 (制御タグあり)¶
日本語 |
白い花が咲いている。 |
中間言語 |
<S>#[[VOICE required=akari]]#[[PITCH level=2]]#[[RATE speed=4]] シ^ロ!イ|ハ^ナ!ガ|_サ^イテイル<F> |
疑問文 (制御タグあり)¶
日本語 |
お元気ですか? |
中間言語 |
<S>#[[VOICE required=seiji]]#[[VOLUME level=7]]#[[RATE speed=5]]オ^ゲ!ンキデスカ<R> |
長い文¶
【その 1】
日本語 |
鬼ヶ島では、鬼たちが近くの村から盗んだ宝物やごちそうを並べて、酒盛りの 真っ最中です。 |
中間言語 |
<S>#[[VOICE required=seiji]]#[[EMPH level=1]]#[[VOLUME level=6]]オ^ニガ!シマデワ$2_2オ^ニ!タチガ$2_2チ!カクノ|0ム^ラ!カラ|0ヌ^ス!ンダ$1_1タ^ カラモノヤ|0ゴ^チソーオ|0ナ^ラベテ$2_2サ^カモリノ|0マ^ッサ!イチューデス<F> |
【その 2】
日本語 |
桃太郎とイヌとサルとキジは、鬼から取り上げた宝物を車に積んで、元気よく家に帰りました。 |
中間言語 |
<S>#[[VOICE required=kaho]]#[[PITCH level=2]]#[[RATE speed=3]]#[[VOLUME level=8]]#[[EMPH level=1]]モ^モ!タロート|0イ^ヌ!ト|0サ!ルト|0キ^ジワ$2_2オ^ニ!カラ|0ト^リアゲタ|0タ^カ ラモノオ$1_1#[[Pau msec=500]]ク^ルマニ|0ツ^ンデ$2_2ゲ!ンキ|0ヨ!ク|0イ^エ!ニ|0カ^エリマ!シタ<F> |