阿里巴巴等开源语音情感基座模型emotion2vec
情感识别技术在各种场景中都有广泛的应用,如客服机器人根据客户语气调整策略、智能助手根据用户情绪提供建议、情感健康应用监测用户情感状态。为了支持情感理解,上海交通大学、阿里巴巴、复旦大学和香港中文大学的研究者联合开发了通用的语音情感表征模型 emotion2vec。
这个模型利用自监督学习方法在大量无标记的公开情感数据上进行预训练,成功学习到高度通用的语音情感特征。经过多语言和不同场景数据集测试,emotion2vec 在多种情感任务上表现超越了现有技术,为各种情感理解场景提供强大支持,有望提升用户体验和满意度。

基于 emotion2vec,研究者们进一步开发了语音情感识别基座模型。首先在语音情感识别学术数据集上对 emotion2vec 进行 fine-tune,然后对15万小时中英数据进行标注,筛选文本情感与语音情感相同且置信度高的数据,再次 fine-tune emotion2vec,得到该版本权重。相较于以往工作,通过迭代训练和大幅增加数据量,这个模型可作为语音情感识别的基座模型,已经开源并在 modelscope 上线体验 demo。
emotion2vec 的总体框架包括句子级别损失、帧级别损失和在线蒸馏。句子级别损失通过均方误差计算整体全局情绪,包括单嵌入、块嵌入和全局嵌入三种方法。帧级别损失设计为逐帧任务,学习上下文情绪信息。在线蒸馏是一种自监督学习策略,学生网络通过反向传播更新参数,教师网络通过指数移动平均更新参数,促使模型不断学习提升情感特征捕捉和理解能力。
实验结果显示,emotion2vec 在 IEMOCAP 数据集上表现最佳,性能超越其他 SSL 预训练模型和专家模型。在其他主流英语数据集上也展现出优异泛化能力,证明了其在不同环境中的先进性能。这表明 emotion2vec 不仅在训练数据集上表现优秀,还能适应不同录音环境,为多样情感任务提供支持。
emotion2vec通用语音情感表征模型:
https://www.modelscope.cn/models/iic/emotion2vec_base/summary
emotion2vec语音情感识别基座模型在线体验:
https://www.modelscope.cn/models/iic/emotion2vec_base_finetuned/summary
论文链接:
https://arxiv.org/abs/2312.15185
开源代码仓库:
https://github.com/ddlBoJack/emotion2vec
AI视野:百度推千帆SDK开源版本;美图推出“AI封面”功能;支付宝上线AI写真功能;三星发布生成式AI模型
🤖📈💻💡大模型动态百度智能云千帆大模型平台推出千帆SDK开源版本百度智能云升级推出免费开源的千帆SDK,包括数据集管理、模型训练、模型评估、服务部署等功能,助用户轻松构建大语言模型应用。具体操作指引可点击链接查看:站长网2023-11-08 14:38:510000刷新记录!科学家利用AI成功缩短钙钛矿太阳能电池制造周期
**划重点:**1.🤖利用AI技术,澳大利亚研究团队成功缩短了制造钙钛矿太阳能电池的时间,打破了人工劳动和错误的限制。2.☀️钙钛矿太阳能电池被制造出来,不仅成本低于硅材料,而且经过最新技术的稳定性测试,具备商业应用的长期稳定性。3.🚀利用机器学习,他们开发了新的太阳能电池制造方法,取得了16.9%的功率转换效率,创下了无人工干预的最佳记录。站长网2023-11-16 11:20:450000小杨哥鞠躬致歉梅菜扣肉事件:一定给大家一个满意的结果
近日,针对梅菜扣肉事件,小杨哥在直播间向消费者深深地鞠了一躬,表达了他的诚挚歉意。他明确表示,尽管厂家提供了诸多证明,证明所售五花肉并非槽头肉,但他们仍将以当地相关部门的最终认定结果为准,致力于给消费者一个满意的答复。为了保障消费者的权益,他们决定先行垫付退款,并在全额退款的基础上,严格按照相关法律法规进行售后处理。站长网2024-03-21 19:15:380000英伟达CEO黄仁勋已抵达深圳 正在参加公司新年庆典活动
快科技1月15日消息,据知情人士透露,今日(1月15日)英伟达创始人兼CEO黄仁勋已经现身深圳分公司,目前正在参加该公司年会活动。据前一日媒体消息,英伟达首席执行官黄仁勋此行覆盖深圳、上海及北京这些主要城市。在首站抵达深圳后,他将参与公司当地员工一年一度的农历新年庆典活动。另外他的行程还将延伸至中国台北,预计于本周晚些时候成行。站长网2025-01-15 16:55:380000Doly:让你可以用iPhone 生成3D产品视频
划重点:-📱AniML推出的Doly应用帮助用户使用手机生成3D模型并制作专业的产品视频。-🤖Doly利用高斯光斑技术将2D图像转换为逼真的3D模型,采用了新兴的神经网络技术。-💰AniML已经获得200万美元的种子轮融资,吸引了多家投资者,包括知名天使投资人。站长网2024-05-28 19:35:430000