清华大学提出二值化光谱重建算法BiSRNet 计算需求降为1%
要点:
清华大学提出的二值化光谱重分布网络(BiSRNet)降低了计算需求至1%,相比全精度CNN性能几乎持平,存储空间仅需0.06%。
该算法采用二值神经网络(BNN)和二值化光谱重分布卷积(BiSR-Conv),在移动端设备上表现出色,解决了全精度模型难以部署的问题。
BiSRNet在光谱压缩重建领域显著超越其他二值化算法,仅需1%的计算代价,同时代码全开源,可在光谱图像应用中取得与全精度CNN相媲美的效果。
清华大学在NeurIPS2023上首次提出的「二值化光谱重建算法」引起了广泛关注。该算法的核心优势在于将计算需求降低至仅1%的水平,相较于全精度CNN,性能几乎持平,而存储空间却只需0.06%。这一创新主要得益于二值神经网络(BNN)和二值化光谱重分布卷积(BiSR-Conv)的引入,使得算法在移动端设备上具备了可行性,解决了全精度模型难以部署的问题。
论文链接:https://arxiv.org/abs/2305.10299
代码链接:https://github.com/caiyuanhao1998/BiSCI
代码链接:https://github.com/caiyuanhao1998/MST
高光谱图像在医疗、地形勘探和农业等领域应用广泛,但传统成像设备采集这类图像存在一定难度。为此,科学家们设计了单曝光压缩成像系统,通过光谱压缩重建任务从二维的压缩估计图中恢复出三维的高光谱数据。当前主流方法采用全精度模型,但由于复杂的计算单元和无法在移动端设备上运行的问题,推动光谱重建算法的实际应用成为挑战。
为解决这一问题,清华大学的研究人员提出了BiSRNet,这是光谱压缩重建领域内首个基于二值神经网络的算法。通过设计新的二值化卷积单元和多个二值化卷积模块,BiSRNet不仅在性能上超越了当前最先进的二值化算法,还取得了与全精度CNN相媲美的效果,同时仅需约0.06%的存储空间和1%的计算代价。这一成果的代码已全面开源在BiSCI工具包中,支持八类主要的二值网络。
基础模型的重新设计是该算法的关键之一,采用轻量、易于部署的U形结构,所有计算单元都可在移动端设备上运行。另外,二值化光谱重分布卷积单元的创新也在算法的成功中发挥了关键作用,通过可缩放的双曲正切函数在反向传播中更灵活地逼近符号函数,解决了以往逼近函数的不足。
这一研究对光谱压缩重建算法的实际应用具有重要意义,为移动端设备上的高效图像处理提供了新的思路。BiSRNet的出现为光谱图像处理领域带来了突破,有望推动相关技术更广泛地应用于医疗、地质勘探和农业等领域。
StreamingLLM:让AI模型无限期平稳运行的一种方法
要点:1.Meta、麻省理工学院(MIT)和卡内基梅隆大学(CMU)的研究人员介绍了一项名为StreamingLLM的技术,旨在解决大型语言模型(LLMs)在长时间对话中性能下降的问题。2.StreamingLLM利用“attentionsinks”(关注点汇)的概念,通过在对话的不同阶段重新引入初始标记,使LLMs能够在无限长度的文本上保持高性能。站长网2023-10-08 09:42:270000通义千问、文心一言和ChatGPT回答热点话题 结果意外
凤凰网科技讯4月7日晚间消息,阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请符合条件的用户可参与体验,凤凰网科技对通义千问、文心一言和ChatGPT提出了:网传加班怼领导聊天记录系捏造、你如何看待加班、马克龙访华有哪些现实意义、张继科事件为何愈演愈烈等问题,我们来看下它们分别是如何回答。你觉得阿里巴巴和马云怎么样?站长网2023-04-12 11:20:210001中小企业私域碰到了大难题?不少企业积极寻求突破
中小企业私域碰到大难题了?近期在与乙方市场服务商交谈过程中,见实突然有这样的疑问。因为现在私域的乙方市场真的有点惨:一些以小程序为载体的代运营商城续约率跌近谷底。一家服务商告诉见实,他们的续约率仅有35%左右,而另一家甚至趋近于忽略不计。这一点从一些乙方企业的财报变化中也能够窥知一二。站长网2024-06-22 23:42:170000消息称苹果将于周二发布第11代iPad:沿用当代设计
10月17日消息,据外媒报道,泄密者MajinBu透露,苹果公司将于当地时间周二推出第11代低成本iPad。他声称,第11代iPad将采用与第10代iPad相同的设计,而且配件“将完全兼容”。上周末,外媒声称,新款iPad将于本周推出。有消息称,苹果正在与特定媒体安排媒体见面会。0000智谱AI推出第三代基座大模型ChatGLM3 智谱清言具备代码交互能力
智谱AI在2023中国计算机大会上发布了第三代基座大模型ChatGLM3及相关系列产品。ChatGLM3经过深度优化,在中英文公开数据集测试中表现优秀,其中MML提升36、CEval提%、GSM8K提升179%、BBH提升126%。ChatGLM3实现了多模态理解能力、代码生成和执行、网络搜索增强等新功能,并通过自研的AgentTuning技术提升了智能规划和执行能力。站长网2023-10-28 07:49:280000