ECOGEN:一种用于生成逼真鸟鸣的深度学习新方法
**划重点:**
1. 🌐 利用深度学习技术,加拿大蒙克顿大学的研究人员开发了ECOGEN,这是一种能够生成逼真鸟鸣的创新方法,旨在帮助生态学家更好地监测和保护世界上一些最稀有的鸟类。
2. 🔊 ECOGEN通过转化鸟鸣录音为声谱图,生成新的人工智能图像,从而扩充了对那些录音有限的稀有鸟类的数据集。研究发现,将ECOGEN生成的合成鸟鸣样本添加到鸟鸣识别工具中,平均提高了12%的鸟鸣分类准确度。
3. 🌍 该研究对于生态学和保育工作具有重要意义,为自动化监测工具提供了更全面的参考库,同时为其他动物类别的声音识别模型提供了可行的方法。
深度学习技术的崛起显著影响了各个领域,将其影响扩展到不同领域。其中一个显著的应用是利用深度学习技术监测稀有鸟类的鸟鸣。随着移动应用程序和软件对于生态学家和普通公众更加可用,通过鸟鸣区分鸟类变得更加容易。然而,当识别软件遇到不熟悉的鸟类物种或者缺乏参考录音时,就会出现一个重要问题。
为了解决这个问题,加拿大蒙克顿大学的研究人员开发了ECOGEN,这是一种可以生成逼真鸟鸣的方法,旨在增强那些鸟类样本有限的物种录音。这些生成的逼真鸟鸣样本可以用于训练生态监测中使用的音频识别工具。
在音频合成过程中存在许多挑战,包括合成所需的大量样本。不同的格式用于处理音频文件,其中许多表示形式会导致信息丢失,从而使高质量音频样本的制作变得复杂。ECOGEN采用波形表示,记录时间域中的声音压力振幅,成为一种在不丢失信息的前提下保持信息完整性的最常见格式之一。
ECOGEN通过创建鸟鸣的新实例来改善人工智能模型。基本上,ECOGEN可以扩展对那些野外录音有限的物种的声音库,而无需伤害动物或进行额外的野外工作。
研究人员发现,将ECOGEN生成的合成鸟鸣样本添加到鸟鸣识别器中,平均提高了12%的鸟鸣分类准确度。主要研究人员之一,尼古拉斯·勒孔特博士强调了自动化工具(如声学监测)对追踪由动物种群全球波动引起的生物多样性变化的迫切需求。然而,目前用于声学监测物种识别的人工智能模型往往缺乏详尽的参考库。
研究人员强调,创造合成鸟鸣可以有助于保护濒危鸟类,提供有关它们的叫声、行为和栖息地偏好的宝贵见解。勒孔特博士表示,尽管ECOGEN是为鸟类开发的,但他们确信它可以应用于哺乳动物、鱼类、昆虫和两栖动物等其他类型的动物。
ECOGEN的运作方式是将鸟鸣录音转化为声谱图,即声音的可视化表示。随后,它基于这些声谱图生成新的人工智能图像,从而扩充了专门用于录音有限的稀有物种的数据集。然后,这些新生成的声谱图被转换回音频格式,用于训练鸟鸣识别模型。在这项研究中,研究人员使用了全球范围内包括264种不同物种的23,784个野生鸟类录音的数据集。
论文网址:https://besjournals.onlinelibrary.wiley.com/doi/10.1111/2041-210X.14239
商汤科技推出AI大模型智能编程助手“代码小浣熊 Raccoon”
商汤科技推出了基于大语言模型的智能编程助手——代码小浣熊Raccoon,并开放公测。代码小浣熊支持30主流编程语言和主流IDE,可以帮助开发者提升编程效率。通过与商汤的大语言模型结合,代码小浣熊具备强大的代码生成和中文语言理解能力。用户可以在编辑器内触发代码补全,也可以通过对话框进行交互。站长网2023-12-07 16:38:220000阿里将开源720亿参数大模型 或为目前国内参数规模最大的开源大模型
在今日的2023年世界互联网大会乌镇峰会上,阿里巴巴集团CEO吴泳铭表示,阿里巴巴即将开源720亿参数大模型。这将是国内参数规模最大的开源大模型。据悉,此前,阿里云已先后开源通义千问70亿参数模型Qwen7B和140亿参数模型Qwen14B,模型累计下载量超过100万。10月31日,阿里云宣布通义千问2.0正式发布,参数规模达千亿。站长网2023-11-09 11:17:1300005款免费可用的3D建模AI工具!一键出片神器集合
AIGC已在文字、图像领域大放异彩,在3D内容领域最近也有了新进展。由于3D内容包含的信息更复杂,创建一个3D模型涉及美术、建模、动画制作、编程等多种能力,专业人士可能需要花费数天时间、上万元才能完成。站长网2023-08-14 14:24:240004苹果官网商店开始维护:iPhone 15系列凌晨1点见
快科技9月12日消息,今晚1点(9月13日凌晨),苹果将特别活动”,也就是秋季新品发布会,届时将推出多款新品。苹果官网目前已经开始维护,各类商品已无法进行购买,显示AppleStore上新中。页面上大大的苹果logo与邀请函一致,其中深蓝色和灰色双拼暗示了这次iPhone15Pro的新配色:泰坦灰、深蓝色。站长网2023-09-12 19:51:380000苹果iOS 18将升级新版Siri:引入AI 支持自然对话能力
知名苹果爆料人马克·古尔曼(MarkGurman)在最新一期《PowerOn》中透露,苹果计划在6月份的全球开发者大会(WWDC)上推出一系列基于生成式人工智能(AI)的工具。其中,升级版的Siri作为iOS18的一部分,将首次具备自然对话的能力,为用户提供更加个性化的体验。0001