语义听觉革新:可让智能耳机在消除环境噪音的同时保持空间感知
要点:
华盛顿大学和微软的研究人员推出了一项先进的机器学习算法驱动的噪音消除耳机技术,具备语义听觉能力,使用户能够选择他们想听到的声音,同时消除其他听觉干扰。
该技术解决了传统噪音消除耳机的关键问题,强调了这些耳机在实时智能方面的不足,无法从环境中识别和隔离特定声音,从而确保用户听觉和视觉感知的无缝同步。
与传统耳机不同,该创新原型采用分类系统处理传入声音,使用户能够通过选择他们想要听到的声音来个性化他们的听觉体验。利用用户手机上的专门神经网络实现快速声音处理,为用户提供更强大的体验。
华盛顿大学和微软的研究人员推出了一项引领先进科技的创新,即噪音消除耳机具备语义听觉能力,由先进的机器学习算法驱动。这项技术的核心目标是让佩戴者能够有选择地听到他们想要听到的声音,同时消除其他环境中的干扰声音。文章着重介绍了这一创新的动机,指出传统噪音消除耳机在实时智能方面的不足,无法迅速识别和隔离特定声音,这导致了听觉和视觉感知之间的不同步。
为了解决这一问题,研究团队采用了一种全新的方法,不再仅仅专注于消除特定频率的声音或减弱来自环境的声音,而是通过一种分类系统对传入的声音进行处理。这使用户能够通过选择他们感兴趣的声音来个性化他们的听觉体验。

项目地址:https://semantichearing.cs.washington.edu/
通过一系列试验,原型展示了在各种环境中的潜在应用,从在吸尘器噪音中进行对话到专注于鸟鸣声,甚至在施工噪音中保持对交通喇叭的警觉。这一创新还在冥想中起到了作用,通过消除环境噪音,除了结束时的警报之外,提供了一种安静的氛围。
为了实现快速声音处理,关键在于利用比耳机内部集成的设备更强大的工具,即用户的智能手机。这种手机上的专门神经网络被设计用于进行双耳声音提取,为整个系统提供更快的响应时间。通过实验证明,基于转换器的网络在连接的智能手机上仅需6.56毫秒就能够处理20种不同的声音类别,并在室内和室外等多种场景中展示了其在提取目标声音同时保留空间线索方面的有效性。
这项噪音消除技术的创新为提升用户在各种环境中的体验打开了新的可能性,使个体能够实时定制其听觉环境,超越了传统耳机的局限。随着团队不断完善这一创新并准备发布代码,个性化音景似乎越来越接近现实。这一创举为未来提供了广阔的前景,让个体能够轻松定制他们的声音体验。
IDC:2027 年生成式 AI 支出将达到 1430 亿美元
站长之家(ChinaZ.com)10月17日消息:现在几乎每家大公司都在寻找方法将人工智能纳入他们的业务计划,投资于构建或采用生成式人工智能模型来执行特定任务。国际数据公司(IDC)的一份新报告预测,这种支出只会增加。IDC预测,到2027年,用于生成式人工智能解决方案的支出,包括软件、相关基础设施硬件以及实施生成式人工智能所需的IT/业务服务,将达到1430亿美元。站长网2023-10-18 11:43:060000低质量AI生成网站获广告支撑 数量高达217个
新闻网站评级工具NewsGuard公布了2023年6月的错误信息监控结果,称141个品牌正在为低质量的人工智能(AI)生成的网站提供广告收入,用于支持这些不可靠网站的发展。这些网站几乎没有人对其进行监督,每天平均会生成上千条文章,其中包括错误信息,尤其是误导用户的医疗健康信息。站长网2023-06-29 12:13:380000首场直播就赚了130万引热议 李斌本人回应:实际收入3.3万元
快科技3月22日消息,近期,蔚来李斌首次直播收入130万元的消息,引起网友热议。对此,李斌日前在其个人社交平台发布视频回应称,由于自己是第一次直播,对业务并不熟悉,所以开通了打赏功能。随后,李斌晒出直播收入明细,并笑称自己也想多点收入,但当晚的实际收入为33088元,并没有网传的那么夸张。李斌决定将这个钱全部捐给大学生方程式这个赛事,后续将继续接受打赏,所获收入也全部捐出。站长网2024-03-23 17:12:020000京东发布“35711”梦想:成为一家纳税1000亿提供100万就业的公司
京东6月18日公布《凝心聚力迈向“35711”梦想》全员信,正式提出面向未来二十年的“35711”梦想:能有3家收入过万亿人民币,净利润过700亿人民币的公司;5家进入世界五百强的公司;7家从零做起市值不低于1000亿人民币的上市公司;能为国家缴纳1000亿人民币税收;提供超过100万就业岗位。以下为全员信正文:凝心聚力迈向“35711”梦想各位同事:站长网2023-06-18 23:41:030000Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统
昨天,OpenAI联合创始人兼首席执行官SamAltman出席了日本东京大学活动,介绍了OpenAI的技术研发、产品规划以及GPT模型未来发展等重要信息。在问答环节,有学生提到了大家比较关心的GPT-5问题,Altman表示,GPT-5将是一个超级混合模型,计划会把GPT和o系列模型整合在一起,并且支持视频、音频、图像的多模态交互。0000