通义语音团队开源了语音基座大模型：SenseVoice和

马儿发表于 2024-7-6 03:00:06

通义语音团队开源了语音基座大模型：SenseVoice和CosyVoice。SenseVoice多语言音频理解大模型：多语言语音识别在中文和粤语上相比Whisper相对提升+50%，推理速度快15倍，并且支持SOTA的情绪识别和音频事件检测。 CosyVoice多语言音频生成大模型：通过超过17万小时的多语
非会员试读19%,加入社区后可阅读全文

页: [1]

富裕者联盟社区's Archiver

通义语音团队开源了语音基座大模型：SenseVoice和