Meta提出全新注意力机制S2A 大模型准确率提升至80.3%

站长网2023-11-28 17:13:220阅

要点:

1. Meta提出的注意力机制S2A能有效提升LLM回答问题的事实性和客观性，降低模型对无关信息的敏感度，使其更准确。

2. S2A通过深思熟虑的注意力机制（System2Attention）解决了LLM在回答问题时容易受上下文中虚假相关性影响的问题，提高了模型的推理能力。

3. S2A的实现方式利用LLM本身构建，通过指令调整的LLM删除不相关文本，重写上下文，以更好地控制注意力焦点，进而提升回答的准确性。

在2023科技领域，大语言模型（LLM）的应用日益广泛，但其在回答问题时存在的问题引起了关注。Meta团队提出的新注意力机制S2A通过解决LLM容易受到上下文虚假相关性的问题，显著提升了模型的准确性和客观性。这一机制的提出得到了深度学习领域的重要人物LeCun的认可，他表示这将有助于使LLM更具推理能力。

传统LLM存在的问题包括对无关信息的过度敏感和容易受到用户观点的影响。S2A通过更深思熟虑的注意力机制，即System2Attention，有效解决了这些问题。以一个数学计算的例子为证，S2A可以过滤掉无关信息，使模型更关注问题的实质，从而提高答案的准确性。

论文地址：https://arxiv.org/pdf/2311.11829.pdf

S2A的实现方式是利用LLM本身构建，通过指令调整的LLM来删除不相关的文本，重新生成上下文。这不仅使模型能够在输出响应之前深思熟虑地推理，还能够控制注意力焦点，类似于人类的方式。实验证明，S2A显著提高了模型的性能，使其更适应复杂的推理任务。

随着理解的加深，添加的文本是无关紧要的，应该被忽略。通过引入更深思熟虑的注意力机制，S2A为解决LLM的问题提供了一种可行的方法，为大型语言模型的进一步发展铺平了道路。

Meta提出全新注意力机制S2A大模型准确率提升至803

0000

评论列表

共(0)条

相关推荐

猎豹移动宣布控股猎户星空：从PC时代跃迁至AGI时代
快科技12月4日消息，猎豹移动今晚宣布，公司已通过两家全资子公司增持了北京猎户星空合计35.17%的股权。就该增持，公司向北京猎户星空的出售股东合计支付现金对价约3760万美元。增持前，猎豹移动持有北京猎户星空37.74%的股权，增持完成后，持股比例增至72.91%，实现控股猎户星空。与此同时，公司将自2023年12月起将北京猎户星空的财务业绩并入其合并财务报表。
站长网站长资讯2023-12-04 23:06:35
0000
站长资讯
荣耀Magic6系列下月发布：首发自研卫星通信对标华为Mate 60
快科技12月2日消息，据博主厂长是关同学”爆料，荣耀Magic6系列将会在1月份正式发布。据悉，该机近期已经获得国家质量认证，信息显示其由长沙比亚迪电子代工，支持最高66W快充。综合目前多方爆料和官方透露的信息，荣耀Magic6系列最大的亮点之一就是卫星通信。该机将采用自研卫星通信技术，攻克了天线体积、通话续航、通信体验三大技术难题。
站长网2023-12-02 15:07:17
0000
站长资讯
OpenAI科学家盛赞中国大模型：算法非常强，算力用到极致！
OpenAI创始团队成员、高级研究科学家AndrejKarpathy很罕见地，分享了一个来自中国的开源大模型——DeepSeek-v3。Karpathy表示，DeepSeek仅用了280万小时的GPU算力，就训练出了比Llama-3405B（使用3080万小时GPU）更强的前沿模型，整体成本节省了11倍左右，将算力发挥到了极致。
站长网2024-12-30 09:18:31
0002
站长资讯
直接抄Character.AI作业？Meta发布虚拟聊天机器人 Gen AI Personas
Meta计划推出名为「GenAIPersonas」的AI聊天机器人服务，旨在挽回社交媒体平台的用户流失问题。这款AI聊天机器人将具备个人助理功能，不同性格的聊天机器人选择以及帮助用户更好表达自己的能力。
站长网2023-09-25 14:52:52
0000
站长资讯
半年涨粉1000万，这个AI聊天搭子是怎么火的
最近，很多快手用户都能发现，一个名叫「AI小快」的账号格外活跃。在视频作品的评论区，经常有人跟「AI小快」聊得火热，一个抛梗、一个接梗:如果你问点严肃问题，AI小快一样有问必答:没看明白的视频，还能帮忙解读:甚至还有离谱之中带有一丝合理的扩图，网友已经笑倒在评论区:这让人很好奇，「AI小快」到底是谁?新晋千万粉丝网红「AI小快」
站长网2024-04-28 21:00:22
0000