高品質音声合成AITalk®を開発・提供する株式会社エーアイ(本社:東京都文京区、代表取締役社長:吉田大介、証券コード:4388、以下エーアイ)は、研究開発グループメンバー共著による論文が音声研究におけるトップカンファレス「INTERSPEECH 2022」において採択されたことをお知らせいたします。
研究概要
名古屋大学戸田教授との共同研究において、最先端の深層学習を用いた音声合成のためのテキスト処理技術の研究開発を実施。現在、製品化に向けたさらなる品質改善を実施中。
論文概要
論文タイトル
Spoken-Text-Style Transfer with Conditional Variational Autoencoder and Content Word Storage
執筆者
Daiki Yoshioka(名古屋大学大学院情報学研究科)
Yusuke Yasuda(名古屋大学大学院情報学研究科特任教授)
Noriyuki Matsunaga(株式会社エーアイ研究開発グループ主任研究員)
Yamato Ohtani(株式会社エーアイ取締役研究開発グループ統括)
Tomoki Toda(名古屋大学大学院情報学研究科教授)