AudioSep:可以从音频剪辑中仅分离出特定的声音
站长网2023-10-27 10:48:250阅
AudioSep 是一种 AI 模型,可以使用自然语言查询进行声音分离。这一创新性的模型由Audio-AGI开发,使用户能够通过简单的语言描述来分离各种声音源。
通过使用AudioSep这一人工智能模型,我们可以从音频剪辑中精准地分离出特定的声音。举个例子,假设你在一个拥挤嘈杂的咖啡馆录制了一段音频,现在你可以从中剥离出对应的人声。这项技术支持本地部署,并且还提供了一个直观的用户界面,使操作更加简便。
项目地址:https://github.com/Audio-AGI/AudioSep
主要功能:
训练和微调: AudioSep提供了训练和微调模型以适应特定音频-文本配对数据集的工具。无论您在音频事件分离还是语音增强领域工作,此功能都使您能够为自己的独特需求定制模型。
推断: 利用AudioSep通过提供文本描述来进行音频分离。该模型以32kHz采样率处理音频,确保高质量的结果。您还可以直接从Hugging Face加载模型以方便使用。
内存效率: AudioSep提供基于块的推断,这是一种节省内存的选项,可以让您处理大型音频文件,而无需担心资源限制。
评估基准: 使用内置的基准工具来评估分离音频的性能。下载各种类别的评估数据,包括audioset、audiocaps、vggsound、music、clotho和esc50,并获得详细的结果。
引用: 如果您发现AudioSep有用,请考虑引用其背后的研究。承认开发者和研究人员为使这个工具可用所付出的辛勤工作是至关重要的。
AudioSep具有强大的分离性能和出色的零射击泛化能力,AudioSep为音频事件分离、乐器分离和语音增强等任务提供了广泛的应用。
0000
评论列表
共(0)条相关推荐
英伟达首席执行官黄仁勋:生成式 AI 时代「人类」会是新的编程语言
在今年于洛杉矶举行的SIGGRAPH2023大会上,英伟达发布了一系列公告,突出了该公司的创新,特别是在生成人工智能(AI)和图形领域。英伟达创始人兼首席执行官黄仁勋表示,该公司在2018年做出了一个重大的商业决策,很少有人意识到这将重新定义其未来并帮助重新定义一个不断发展的行业。站长网2023-08-10 14:55:330000董明珠怒斥孟羽童 称孟羽童只想用格力平台去当网红
今年5月,曾被视为董明珠接班人的孟羽童从格力离职,这一消息在网上引起了热议,尤其是关于她的离职原因。近日,董明珠在格力电器2023届大学生入职仪式中再次提及孟羽童,揭露了背后的真相。董明珠表示,当初在实习生节目中看中了孟羽童的勤奋,选她来做秘书。然而,在工作中孟羽童的表现并不尽如人意,她只想着利用格力平台成为网红,在公司中产生了不良影响。因此,董明珠决定将她开除。0000字节跳动计划制造机器人 优先服务自身电商履约需求
根据《晚点LatePost》的消息,字节机器人团队目前约有50名成员,并计划在年底扩充到上百人。他们的目标是开发一些能够满足字节自身电商履约需求的机器人,这些机器人能够在仓库内进行货物分拣和打包工作。目前,字节机器人团队隶属于字节AILab,由AILab总监李航负责。李航曾担任华为诺亚方舟实验室主任和首席科学家,在2017年加入字节,目前向字节副总裁兼算法技术负责人杨震原汇报。站长网2023-07-04 00:57:000001李一舟AI课程小程序因违规被暂停服务 199元人工智能课已被下架
据搜索结果显示,李一舟用于售卖AI课程的微信小程序“一舟一课”因违反《即时通信工具公众信息服务发展管理暂行规定》,已被暂停服务。与此同时,李一舟的人工智能课在微信视频号橱窗已下架,先前售价199元的“每个人的人工智能课”视频课也不再可见。在其另一小程序“每个人的人工智能课”上,课程同样无法查看。站长网2024-02-22 15:12:380000数百名人工智能名人签署信函 呼吁反深度造假立法
据外媒报道,人工智能界近500名专家日前联名信呼吁,对利用AI生成的深度伪造和冒充行为实施更为严格的监管,甚至完全定为刑事犯罪。他们信中直言,深度伪造内容已对社会构成日益严重的威胁,政府必须强力干预,制定跨部门、全产业链的法规义务,从源头截断此类有害内容的传播。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-02-22 09:59:540000