UltraFastBERT:推理过程仅用0.3%神经元,性能与类似的BERT模型相当
**划重点:**
1. 🧠 **创新介绍:** ETH Zurich研究人员成功开发了UltraFastBERT,通过使用快速前馈网络(FFFs)在推理过程中仅使用0.3%的神经元,实现了与其他模型相当的性能水平。
2. 🚄 **性能提升:** 通过简化的FFFs替代传统模型的前馈网络,UltraFastBERT在保持高效语言建模的同时,取得了显著的速度提升,甚至达到48倍到78倍的CPU上的推理速度提升。
3. 🛠 **潜在应用:** 该研究不仅提供了高水平的CPU和PyTorch实现,还建议通过混合稀疏张量和设备特定优化,以及通过多个FFF树的联合计算,进一步加速大型语言模型,如GPT-3。
近日,ETH Zurich的研究人员成功推出了一项创新性的技术——UltraFastBERT,该技术通过在推理过程中仅使用0.3%的神经元,实现了与其他类似BERT模型相当的性能水平。这一创新主要通过引入快速前馈网络(FFFs)来解决在推理过程中减少神经元数量的问题,相较于基准实现,取得了显著的速度提升。
研究人员提供了代码、基准设置以及模型权重,支持了这一方法的有效性。他们建议进一步探索通过混合稀疏张量和设备特定优化,以及在大型语言模型中应用多个FFF树的潜在性能提升。
UltraFastBERT在推理过程中展现了高效的语言建模,通过将传统模型的前馈网络替换为简化的FFFs,使用一致的激活函数和所有节点输出权重,同时消除了偏差。多个FFF树协同计算中间层输出,允许多样化的架构。所提供的高水平CPU和PyTorch实现显著提升了速度,而研究还探讨了通过多个FFF树和替换大型语言模型前馈网络为FFFs,实现潜在加速的可能性。为设备特定优化,建议使用Intel MKL和NVIDIA cuBLAS。
UltraFastBERT不仅在推理中仅使用0.3%的神经元的情况下实现了与BERT-base相当的性能,而且在仅使用单个GPU进行一天训练的情况下,仍保持至少96.0%的GLUE预测性能。研究还展示了通过快速前馈层实现显著的速度提升,达到48倍到78倍的CPU上的即时推理速度提升,以及GPU上的3.15倍速度提升,表明在替换大型模型方面存在潜在可能性。
总体而言,UltraFastBERT是对BERT的修改,实现了在推理过程中仅使用少量神经元的高效语言建模。该模型通过FFFs实现了显著的速度提升,提供的CPU和PyTorch实现分别实现了78倍和40倍的速度提升。研究建议通过实现有条件神经执行的基元,进一步加速语言建模。尽管仅使用0.3%的神经元,UltraFastBERT的最佳模型与BERT-base的性能相当,展示了高效语言建模的潜力。UltraFastBERT展示了高效语言建模的潜在进展,为未来更快、资源友好的模型铺平了道路。
未来研究的建议包括使用混合向量级稀疏张量和设备特定优化实现高效的FFF推理,探索有条件神经执行加速语言建模的全部潜力,以及通过将前馈网络替换为FFFs优化大型语言模型的潜在性。未来的工作可能着重于在流行框架如PyTorch或TensorFlow中实现可重现的模型,并进行广泛的基准测试,以评估UltraFastBERT及类似高效语言模型的性能和实际影响。
论文地址:https://arxiv.org/abs/2311.10770
AI文档阅读神器司马阅 通过聊天方式帮你精准获取关键信息
司马阅是一款基于AI技术的智能文档助手,可以上传PDF、Word等多种格式文档,通过语音或文字与文档进行交互,快速定位关键信息。比如可以帮你:1、分析一份合同的风险保护倾向2、总结一个行业报告的发展趋势3、判断一份专业简历的技能水平4、提炼一个产品手册的关键卖点5、概括一份研究论文的核心要点站长网2023-09-08 14:51:260000任正非:我们即将进入第四次工业革命 规模之大不可想象
快科技9月19日消息,近日,ICPC基金会主席及教练和世界计算机竞赛的金牌获得者前往华为考察。在此期间,华为创始人任正非表示,我们即将进入第四次工业革命,波澜壮阔,其规模之大不可想象。在任正非看来,第四次工业革命的基础就是大算力,今天的年青人是未来大算力时代的领袖,我们支持竞赛的目的是要为年青人搭建一个绽放生命火花的舞台。0000视觉语言模型BLIVA:让AI更擅长阅读图像中的文本 懂得看路牌和食品包装
文章概要:1.BLIVA是一种视觉语言模型,擅长读取图像中的文本。2.BLIVA结合了InstructBLIP的学习查询嵌入和LLaVA的编码修补嵌入。3.BLIVA在多个数据集上表现优异,可用于识别路牌、食品包装等场景。BLIVA是一种视觉语言模型,擅长读取图像中的文本,使其在许多行业的现实场景和应用中发挥作用。站长网2023-08-28 11:38:200000又一个本土茶饮品牌火了,这次出圈竟然是靠“敲木鱼”!
近日,一个诞生于2020年的广东本土茶饮品牌,在520期间,凭借买茶赠木鱼的周边营销走进消费者的视野。据网友种草笔记上分享的购买规则,当天凡是购买当家茶饮,3.8元即可获得一款桃花木鱼:“每天敲一敲,心想事成,功德无量”这款周边让不少消费者心甘情愿掏出钱包,为其买单。站长网2023-05-25 18:20:130000钉钉回到自己的轨道上
2022年初,一位飞猪高层人士曾在内部会议上形容飞猪正在进行的组织调整(独立经营):飞猪过去就像地球上的一块大陆,地球出太阳飞猪也出太阳,地球刮风飞猪也刮风。“现在我们希望变成月球,有节奏一致的公转轨道,也有我们的自转轨道。”钉钉过去的处境类似,它就像一颗卫星,围绕在行星阿里云身边,现在,它终于可以回归自己的轨道了。0000