文教速報デジタル版

BUNKYO DIGITAL

文教速報デジタル版

BUNKYO DIGITAL
大規模言語モデルに個人の発話を効率よく再現 NTTが技術開発 本人のデジタル分身を低コストに生成可能

NTT(本社:東京都千代田区)は、〝IOWN構想〟の柱の一つであるデジタルツインコンピューティング(DTC)で、物理世界の制約を超えた活動や交流を通した機会増大や自己成長の実現を目指し、本人のように行動し本人と経験を共有する分身のようなAIエージェント『Another Me(R)』の研究開発を進めている。今回、NTT版大規模言語モデル「tsuzumi」の拡張技術として、少量の対話データから個人の口調や発話内容の特徴を反映して対話を生成する個人性再現対話技術を開発した。また、少量の音声データから個人の声色 を反映した音声を合成するZero/Few-shot音声合成技術を開発した。

従来、個人の特徴を学習し再現するには個人に関するデータが大量に必要だったのに対し、少量データから再現可能になったことで、多くの人が誰でも簡単にデジタル空間内に自身の分身を持つことが可能となる。

この研究成果の実用化に向けて、自分自身に代わって人とのコミュニケーションやコミュニティ活動などを行うデジタル分身の公開実証等を進める方針だ。

Another Meのビジョン