技術・サービス

"声の価値"を守り、未来へつなぐ。NTT西日本「VOICENCEカンパニー」の挑戦

"声の価値"を守り、未来へつなぐ。NTT西日本「VOICENCEカンパニー」の挑戦
モグラのイラスト

この記事の目次

この記事の内容【読了時間14分】

NTT西日本には、「VOICENCEカンパニー」という新しい事業があるんだ。AI音声合成と独自のトラスト技術を組み合わせて、声の権利を守りながら、新しいコンテンツの可能性を広げていく取り組みなんだって。どんな思いでこの事業は生まれ、どのような未来をめざしているのか。花城カンパニー長をはじめ、VOICENCEを立ち上げた皆さんに、その背景と挑戦について話を聞いてきたよ。

interviewee 今回、話を聞いた人

花城さん
花城 高志 (ハナシロ タカシヤ)さん

NTT西日本株式会社
VOICENCEカンパニー
カンパニー長 / CEO

大西さん
大西 祐佳 (オオニシ ユカ)さん

NTT西日本株式会社
VOICENCEカンパニー
マーケティング・セールスマネージャー /
CMO兼CRO

堀部さん
堀部 大介 (ホリベ ダイスケ)さん

NTT西日本株式会社
ミライ事業共創室
トラスト技術開発

※記載の役職・所属は取材時点(2025年11月)時点の情報です

VOICENCEって、何をしているところなんだろう?

1.“声”を支え続けてきたNTT。その技術がVOICENCEへとつながる

NTT西日本には、音声AI事業を担う「VOICENCEカンパニー」という組織があります。

声の権利を守りながら、その価値を未来へとつないでいく——。音声AI基盤「VOICENCE」の開発・提供を通じて、安心して声を活用できる環境を整え、新たな体験の創出をめざしています。

「VOICENCE」という名称は、声を意味する“Voice”に、権利を守る“License”と、声の本質的な価値を表す“Essence”を掛け合わせた造語です。声の権利を守り、その価値を正しく未来へとつないでいくという、事業の思想そのものが込められています。

電話の時代から声のコミュニケーションを支えてきたNTT。その技術と知見を基盤に、声の可能性を広げる新たな挑戦が、いま始まっています。

声は、ただの音じゃない。その人自身の価値だからこそ、守りながら活かしていく技術が必要なんだね。

モグラ

VOICENCEの始まりを、花城さんに聞いてみたよ。

2.共創から見えてきた、音声AIの可能性と守るべき価値

——音声AI事業は、どのような経緯で立ち上がったのでしょうか。

発端は、2022年にQUINTBRIDGEで行われたスタートアップとの共創プログラムです。当初は音声ではなく、AR技術を活用し、駅の看板やビルなどにアニメやアートが出現するコンテンツの実証実験に取り組んでいました。まちの賑わい創出と、人流データ分析を通じた地域活性化をめざすプロジェクトです。

私はこのプロジェクトの途中から参画しましたが、次の展開を検討する中で、「NTTグループの技術的な強みを生かした形に発展させたい」と考えるようになりました。その中で着目したのが、NTT研究所が持つ音声合成技術です。そこで2024年度には第二段階として、多言語での音声生成が可能なクロスリンガル音声合成技術を活用し、音声ARコンテンツ「みみぴく」の実証事業を開始しました。

この取り組みでは、訪日外国人旅行者が言語の壁を感じることなくコンテンツを楽しめる環境の実現をめざし、音声ARコンテンツの実証を行いました。その一環として、櫻坂46さんとコラボレーションし、観光地で提供される音声コンテンツを中国語など複数言語で再生できる仕組みを構築しました。

実証を通じて、音声によってコンテンツの体験価値を拡張できることを確認しました。同時に、エンターテインメント領域において音声AIが新たな表現や事業機会を生み出す可能性を強く感じています。

カンパニー長 / CEO 花城 高志さん

エンタメ×安心・安全に成長の種を見つけた

音声AIの可能性を感じる一方で、「AIによって声が置き換えられてしまう」という新たなリスクも認識するようになりました。特に、音声の権利保護という観点です。近年はフェイク動画などの問題も顕在化しており、音声IPホルダーの方々からも同様の懸念の声が上がっていました。

音声AIは、安心・安全に利用できる環境があってこそ成り立つものです。そのため、権利保護を技術的に担保する仕組みとして、「トラスト技術」を組み合わせた音声AI基盤の構築に取り組みました。

——VOICENCEの核となる「トラスト技術」とは、どのような技術なのでしょうか。

仮想通貨などでも活用されているパブリックブロックチェーンと、Verifiable Credentials(VCs)と呼ばれる次世代のデジタル証明書規格を組み合わせることで、音声の真正性や利用条件を検証可能な形で証明する、NTT西日本独自の「トラスト技術」を開発しました。

この技術では、音声ファイルに対して以下の証明情報を紐付けます。

・真正性:IPホルダーから正式に許諾された音声であること
・音声モデル情報:音声の生成元や派生関係(親子関係の追跡)
・用途証明:利用許諾の範囲や条件

これらの情報を検証可能な形で管理することで、無断生成された音声との識別を高い精度で行うことが可能になります。本技術は現在、特許出願中です。

VOICENCE 3つのキーテクノロジー

①Zero/Few-shot 音声合成
ほんのわずかな声をインプットするだけで本人の声の性質や話し方の特徴をとらえたAI音声モデルの生成が可能
②クロスリンガル 音声合成技術
本人の声色のまま多言語に変換しての出力が可能
(対応言語:日本語、英語、 中国語、韓国語、フランス語、スペイン語)
③真正性証明「トラスト技術」
ブロックチェーンを活用した「トラスト技術」で声の証明書を作成。第三者はもちろん、生成者(NTT西日本)にも改ざんできない仕組み ※特許出願中

音声は、新しい体験を生み出せる一方で、守るべきものでもある。その両方に向き合ったことが、VOICENCEの原点なんだね。

モグラ

堀部さん、「トラスト技術」のことをもっと教えて!

3.声の権利を守るために生まれた「トラスト技術」

——トラスト技術の開発において、特に難しかった点はどのようなところでしたか。

技術そのものは、パブリックブロックチェーンやVerifiable Credentialsなど、国際的に認知されている標準技術を組み合わせたものなので、実現可能性の面で大きな不安はありませんでした。

一方で難しかったのは、権利保護の考え方の整理です。本当にこの仕組みで音声IPの権利を十分に守ることができるのかという点について、弁護士をはじめとした専門家の方々と議論を重ねながら、真正性をどのように担保するかを検討しました。

また、AI分野は技術の進化や市場の変化が非常に速く、スピードも重要な要素です。他社に先行される可能性もある中で、ユースケースの検討と並行してシステム開発を進め、クライアントからのフィードバックを開発に反映しながら、試行錯誤を重ねてローンチに至りました。

今回のトラスト技術は、2025年度NEDO懸賞金活用型プログラム「GENIAC-PRIZE」に採択されており、技術の有効性と先進性が評価された取り組みとなりました。開発者としても、大きな意義のあるプロジェクトだったと感じています。

トラスト技術開発 堀部 大介 さん

ビジョンに共鳴し、著名人パートナーも続々と参画

——事業開始にあたり、著名なIPホルダーの方々が参画されていますが、どのような経緯があったのでしょうか。

これまでの技術連携やご縁をきっかけに、少しずつ広がっていきました。例えば、別所哲也さんはNTT持株との関係を通じてつながりがあり、花江夏樹さんについても、NTTテクノクロスの音声合成サービスでの連携実績がありました。また、春日俊彰さんをはじめとする方々には、事業の立ち上げにあたり、直接ご説明の機会をいただきました。

こうしたIPホルダーの皆さまに参画いただくためには、事業の意義や将来性について十分にご理解いただく必要がありました。単に「音声AIで新たなコンテンツが制作できる」という可能性だけでなく、声の権利をどのように守り、安心して活用できる環境を構築するのかを、技術とビジネスの両面から丁寧にご説明しました。

トラスト技術によって権利保護を担保できること、そしてIPホルダーの価値を損なうことなく、新たな活用機会を創出できるビジネスモデルであることをご理解いただき、参画へとつながりました。この合意形成のプロセスは、事業を立ち上げる上で特に重要な取り組みの一つでした。

ローンチイベント
ローンチ時に発表された“声”のパートナー

信頼を技術で守ること。その上で、音声コンテンツの可能性を広げることが、共感や参画につながっていったんだね。

モグラ

VOICENCEは、どんなビジネスになるの?教えて、大西さん!

4.声の権利を守りながら価値を届ける、VOICENCEのビジネスモデル

——ここからは「ビジネスモデル」についてお聞きします。業界の課題に対し、どのような戦略で展開されていくのでしょうか。

音声AIサービスは、すでに数多く存在しています。そのため、単に音声合成やAIという技術を提供するだけではなく、コンテンツの企画・制作からエンドユーザーに届けるまでを一体的にプロデュースすることを重視しています。もちろん、その過程においては、ライツマネジメント(権利管理・証明)を確実に担保できる仕組みを前提としています。

現時点では、BtoCではなくBtoBビジネスとして展開しています。音声コンテンツを制作・活用したい企業や自治体を主なクライアントとし、音声IPホルダーとクライアントの間に立つことで、声の権利を守りながら、双方が安心して活用できる音声コンテンツを提供していきます。今後は、ユースケースの創出やパートナー開拓を進めながら、契約から企画、制作、利用までをシームレスに行えるプラットフォームへと進化させていきたいと考えています。

ワークショップのプログラム

クライアント側には、著名人の声を活用した注目度の高いコンテンツを制作したいというニーズがある一方で、本人のスケジュール確保が難しいことや、AI音声の活用における権利面への不安といった課題があります。また、音声IPホルダーの方々にとっても、距離やスケジュールの制約により依頼を受けられず、本来得られるはずの機会を逃してしまうケースが少なくありません。

さらにこれまで、“声”そのものの権利を適切に管理し、ビジネスとして成立させる仕組みは十分に確立されていませんでした。映像や番組には二次利用の概念がありますが、その恩恵は主にコンテンツの権利所有者に帰属し、実演家である声優などに十分に還元される仕組みは限定的です。

VOICENCEでは、こうした課題を技術とビジネスモデルの両面から解決し、声の権利を適切に保護しながら活用できる環境を整えることで、実演家への新たな収益機会の創出と、持続可能な音声コンテンツ市場の形成をめざしています。

ローンチイベントでは、KizunaAI(VOICENCE)と
別所さん(本人)が英語で会話するデモを実施

広告、ツーリズム、グローバルビジネスなど音声AIの提供価値は無限大

VOICENCEの提供価値は、コンテンツの可能性によってさらに広げていけると考えています。今後は実績を一つひとつ積み重ねながら、活用領域を拡張し、新たな価値創出につなげていきたいと思っています。

すでに公開している事例の一つが、靴下屋(タビオ株式会社)における店内ラジオおよびSNSコンテンツへの活用です。人気声優によるAIナレーターを起用することで、新規性のある顧客体験を創出するとともに、ブランドの認知向上や話題創出にも寄与しました。実際に、花江夏樹さんご本人がSNSで「AIナレーター初仕事です!」と発信されたことで、多くの反響が生まれ、音声AIとIPを組み合わせた新しいプロモーション手法としての可能性が示されました。音声AIであれば、期間限定のキャンペーンや急なプロモーションにも柔軟に対応できる点も大きな特長です。

マーケティング・セールスマネージャー /
CMO兼CRO 大西 祐佳さん

もう一つは、2025年1月16日にニュースリリースを発表した、広島都心エリアでの謎解きデジタルラリーです。NTTアーバンソリューションズが推進する都市開発の一環として実施されている取り組みで、春日望さんのAIボイスを活用し、地域の魅力発信と回遊促進を図っています。音声を通じて街の体験価値を高めることで、都市空間とエンターテインメントを結びつける新しい活用モデルとなっています。

今後は、特にツーリズムやグローバル領域において大きな可能性があると考えています。例えば、アーティストのコンサート開催にあわせて、そのアーティスト本人の声による地域案内コンテンツを提供することで、地域の魅力発信とファン体験の向上を同時に実現することができます。

また、日本のアニメや声優文化は海外でも高い人気を持っており、声優による多言語音声コンテンツの需要は今後さらに拡大していくと見込まれます。権利保護を担保した形で音声AIを活用できる環境を整えることで、これまで実現が難しかったユースケースにも対応できるようになり、音声コンテンツ市場のさらなる発展に貢献していきたいと考えています。

広島で実施した、謎解きデジタルラリー
「The Unknown City ~時を超える広島の記憶とスパイミッション~」

声の権利を守りながら活用できる仕組みが、新しい市場を生み出していくんだ。次は、どんな楽しい体験が生まれるのかな。

モグラ

Learn More さらに詳しく掘る

声の権利を守りながら、その価値を未来へとつないでいく。VOICENCEカンパニーの取り組みについては、公式サイトをご覧ください。