微软开源创新音频模型VibeVoice-1.5B_每日聚焦

  • 发表于: 2025-08-26 06:22:25 来源:新浪网


(资料图)

今天凌晨,微软研究院开源了创新音频模型VibeVoice-1.5B。VibeVoice-1.5B开创了语音界多个重大技术突破:一次性可连续合成90分钟超长逼真语音,之前多数模型只能合成60分钟以内语音,并且30分钟后会出现音色漂移、语义断裂等难题。