腾讯混元发布并开源语音数字人模型,已应用于QQ音乐、全民K歌、酷狗音乐
本文来源:时代财经时代财经获悉,5月28日,腾讯混元发布并开源语音数字人模型HunyuanVideo-Avatar,该模型基于腾讯混元视频大模型(HunyuanVideo)及腾讯音乐天琴实验室MuseV技术联合研发,支持头肩、半身与全身景别,以及多风格、多物种与双人场景视频生成,适用于短视频创作、电商与广告等领域。
目前,该技术已应用于腾讯音乐、全民K歌、酷狗音乐等应用中的听歌陪伴、长音频播客以及唱歌MV等场景。 (时代财经 冯恋阁)
页:
[1]