登陆注册

捕获的

  • Meta AI 发布 MMCSG数据集:使用 Project Aria 捕获的 25 小时以上的双向对话

    划重点:-💡CHiME-8MMCSG任务专注于通过智能眼镜录制的对话转录挑战,旨在帮助研究人员解决活动检测和说话者分离等问题。-💡提出的模型利用多模态数据集MSCSG数据集,包括音频、视频和IMU信号,以提高转录准确性。-💡通过整合各种技术来改善实时对话的转录准确性,包括目标说话者识别/定位、说话者活动检测、语音增强、语音识别和对话。
    站长网站长资讯2024-03-02 13:10:10
    0000