お客様事例CUSTOMER CASE

過去の短い音声データから故人の音声を再現し、周年事業のプロジェクトに活用

Company

IMAGICA.Lab

広告・出版・マスコミ

この事例のポイント

導入の目的

  • 故人の過去の音声データを使って、現代人にエールを送る動画制作プロジェクトのため

導入前の課題

  • 限られた長さ・音質のデータしか残されておらず、仕上がりのクオリティが見通せなかった

導入効果

  • 少ない音声データから、予想以上の品質に仕上がった

インタビュー

導入の前提

IMAGICA Lab.様では映像制作事業を中心に、テレビCM・各種コンテンツ制作における映像技術サービスや広告・プロモーション・イベント向け支援サービス等を提供されています。
今回は故人の画像・音声データからAIで本人を再現するというプロジェクトのためにエーアイにお声がけいただきました。エーアイは音声部分の制作を受託し、IMAGICA Lab.様で制作された映像と併せて再生することで、故人が直接メッセージを伝えているかのような動画になりました。

 

導入製品もしくはサービスについて

今回エーアイ製品(AITalk Custom Voice)を導入いただいたコンテンツの概要を改めて伺えますか。

 故人をAIで現代によみがえらせ、用意されていたメッセージ(祝辞)を今読み上げているかのような動画を作るというものです。すでに動画は披露され、大変好評だったと聞いています。

AITalk Custom Voice導入の背景

当初のクライアントのご要望はどのようなものだったのでしょうか。

過去の音声を使って、なるべく違和感(ロボット音声らしさ)のない音声を生成したいというものでした。
とはいえ仕上がりのクオリティについて先方で具体的なイメージがあったわけではなく、限られた音声からのAI音声作成についてこちらに知見があったわけでもないので、当初は仕上がりイメージの提案に苦慮しました。結局はエーアイさんからサンプル音声をいただいたことでクリアになりましたが。

エーアイにお声がけいただいたきっかけは何だったのでしょうか

まず、企画を伺った時からAIでしか実現できないと考えていたため、初期段階から複数のベンダーを調査していました。その中でエーアイさんの取り組みを知り、問い合わせをした次第です。
実は以前、社内の別の部署が大学の研究室と協力して類似のプロジェクトに参加したことがあるのですが、それは膨大なデータをAIに学習させるものでした。今回のプロジェクトとは学習用データの質も量も全く異なるため、社内での解決は難しいだろうと早期に専門ベンダーを検討していました。

最終的に採用いただいた決め手は

仕上がりの品質です。
ノイズ交じりの短い音声からあのクオリティのAI音声を提出いただいたことには驚きました。クライアントも提供した音声データの状態がそれほど良かったわけではないということが分かっていたので、余計に驚かれたようです。もう少しロボットっぽいというか、固い印象になることを想定していたようですね。複数社検討していましたが、最終段階で残っていた2社のうちエーアイのクオリティが圧倒的でした。
私たちもスタジオ収録を行って作成するAI音声については仕上がりのイメージがありましたが、今回のような短いものからこういうクオリティになったということは驚きです。

AIによる動画制作の裏側

改めて、「故人をAIで再現する」というプロジェクトにあたってクライアントからどんなデータの支給があったのか教えてください。

 クライアントは、元となるデータ自体は画像・音声ともに色々お持ちでした。
まず映像に関しては複数の写真等を提供いただいて、それをAIに学習させれば自然に動かすことができるだろうという見通しが立っていました。
 ただ音声に関してはカセットテープやCDなど、様々なメディアでデータを支給いただいたのですが、聞いてみたらすべて雑音が混ざっていました。その中に比較的きれいな25分ほどのデータがあったので、それを学習用データとしてエーアイさんにお渡ししています。

技術的に難しいところはありましたか。

 元の素材(支給データ)が古いだけに、理想的なクリアな音声にはできませんでした。
今回は素材をエーアイさんに渡す前に軽く一度、納品データに対してさらにもう一度ノイズリダクションという処理をかけていますが、それでも現代の基準でクリアな音質にはなりませんでした。元データの帯域が狭いので、どうしても加工処理には限界があります。
映像に関してはAIを活用して古い画像のデータ量を増やし、クリアなものにするアップコンバートという技術がすでに存在するのですが、音声に関してはきっとこれからですね。

珍しい案件だったと思いますが、エーアイの対応はいかがでしたか。

きめ細やかに対応いただきました。
想定よりAI音声の出来が良かったために欲が出たというか、細かなイントネーション補正の要望が何度もありましたが、都度対応いただきました。最終的にはクライアントも満足する仕上がりになったと思います。

今後、AI音声を用いてこういうことがしたいという展望はおありでしょうか。

私たちは映像制作・映像技術サービス・CG/VFX・音楽作成・音響技術の提供をしています。
映像制作とAIはますます親和性が高くなっていくので、AIを全面に打ち出した映像制作サービスにも力を入れていきたいと思っています

この記事は2025年11月時点のものです。

IMAGICA.Lab

IMAGICA Lab.は、TV-CMを中心に、PV、WEB、イベント映像等の様々なジャンルの映像作品をお客様の求められる品質で確実に完成・納品するために、グループ会社とも連携し、撮影、CG、グレーディング、編集、MA、配信・流通やアーカイブといった各種サービスをワンストップにてトータルコーディネートいたします。
高いクリエイティビティと確かな技術力を備えたトップクリエイターがメディアの特性に応じた映像表現を提案し、質の高い作品を生み出すお手伝いをいたします。

お困りですか?

よくいただくご質問にお答えしています。

導入のきっかけや活用方法・導入後の効果などを、
インタビュー形式でご紹介します。