马毅教授CRATE-α模型首次证实白盒Transformer可扩展性
马毅教授团队最近取得了显著的研究成果,他们开发的CRATE-α模型首次证实了白盒Transformer架构的可扩展性。这一进展对于自然语言处理(NLP)、图像处理和视觉计算领域的深度表征学习具有重要意义。
尽管Transformer架构及其变体在AI领域取得了巨大成功,但它们大多基于经验设计,缺乏严格的数学解释。CRATE模型通过数学推导得到每一层,提供了更好的可解释性。不过,CRATE的应用规模之前相对有限,与Vision Transformer的参数量相比有较大差距。
为了解决这一问题,研究团队提出了CRATE-α,它对稀疏编码块进行了策略性但最小化的修改,并设计了轻量级的训练方法,有效提高了CRATE的可扩展性。实验结果显示,CRATE-α的性能随着模型尺寸和训练数据集的增大而持续提升。在ImageNet分类任务上,CRATE-α-B和CRATE-α-L的准确率显著提高,同时保持了CRATE模型的可解释性。
研究人员使用了ImageNet-21K和ImageNet-1K数据集进行训练和微调,证明了CRATE-α在不同像素块大小下的性能。此外,他们还采用了多模态数据集DataComp1B,包含14亿图文对,通过对比学习的方法训练CRATE-α,并使用优化的CLIPA协议减少计算资源消耗。
CRATE-α模型的可扩展性通过在ImageNet-1K数据集上的零样本学习评估得到了证明,这为衡量模型的泛化能力提供了重要指标。研究人员还发现了节省计算资源的扩展策略,通过调整预训练阶段的图像token序列长度,在减少计算资源消耗的同时,保持了模型性能。
CRATE-α的语义可解释性也得到了提升,使用MaskCut评估模型捕获的丰富语义信息,CRATE-α在目标检测和分割方面比现有模型有所提高。这些研究成果不仅推动了Transformer模型的发展,也为未来的研究和应用开辟了新的道路。
论文:https://arxiv.org/pdf/2405.20299
项目地址:https://rayjryang.github.io/CRATE-alpha/
加州消防局利用人工智能早期发现野火
本文概要:1.加州消防局与加州大学圣地亚哥分校合作推出“加州警报人工智能”计划,利用摄像头和人工智能技术早期发现野火。2.该计划已经成功在早期阶段发现了至少一起野火,并得到了迅速控制。3.该系统利用人工智能分析360度旋转摄像机的反馈,自动提醒紧急服务人员采取行动。加州消防局与加州大学圣地亚哥分校合作推出的“加州警报人工智能”,计划利用摄像头和人工智能技术来早期发现野火。站长网2023-08-15 11:57:2000000代码训练GPT-5?MIT微软证实GPT-4涌现自我纠错能力,智能体循环根据反馈让代码迭代!
【新智元导读】谁能想到,训练GPT-5竟不用手写代码。MIT微软最新研究发现,GPT-4在代码修复中的有效性。以后,OpenAI工程师能做的只有——Critiqueisallyouneed。我们都知道,大模型具有自省能力,可以对写出的代码进行自我纠错。这种自我修复背后的机制,究竟是怎样运作的?对代码为什么是错误的,模型在多大程度上能提供准确反馈?站长网2023-07-05 09:17:240000告别百万年薪,逃离大厂后的N种生存
2023,是重新拥抱世界的一年。年轻人不再被消费主义洗脑,他们更注重物品本身的价值。连接世界的方式发生了改变,性价比成为他们最关心的事情。一次说走就走的旅行,一场精心策划的演出是人们抚平心灵皱纹的方式。0000九月AI公司投资排行榜出炉,最高投资额达40亿美元
随着大模型技术的爆发,人工智能行业也吸引了众多资本的目光。不管是做基础大模型的企业,还是在研究AI应用落地的公司,只要打出人工智能的名号,就能收获不少的投资。而这些数额巨大的投资交易,也吸引了不少看客的目光。之前我们整理过今年八月投资额排名前十的AI公司名单,而在刚刚过去的九月,也有这么一份名单出炉。在这份名单中,排名第一的是刚刚获得亚马逊大笔投资的Anthropic。站长网2023-10-08 14:12:320000Discord 宣布将于 12 月 1 日起关闭其人工智能聊天机器人 Clyde
Discord正在关闭其实验性人工智能聊天机器人Clyde。根据公司的支持说明,Clyde将于本月底被「停用」,并且从12月1日起,「用户将无法在私聊、群聊或服务器聊天中调用Clyde」。站长网2023-11-21 11:24:180000