马儿 发表于 2024-7-6 03:00:06

通义语音团队开源了语音基座大模型:SenseVoice和

通义语音团队开源了语音基座大模型:SenseVoice和CosyVoice。SenseVoice多语言音频理解大模型:多语言语音识别在中文和粤语上相比Whisper相对提升+50%,推理速度快15倍,并且支持SOTA的情绪识别和音频事件检测。
CosyVoice多语言音频生成大模型:通过超过17万小时的多语
非会员试读19%,加入社区后可阅读全文
页: [1]
查看完整版本: 通义语音团队开源了语音基座大模型:SenseVoice和