Meta悄然发布Llama 2 Long AI,在某些任务上击败GPT-3.5 Turbo和Claude 2
站长网2023-10-03 10:56:141阅
本文概要:
Meta悄然发布Llama2Long AI模型,该模型在某些任务上击败了GPT-3.5Turbo和Claude2。
Llama2Long是基于Meta的开源Llama2模型,经过改进后能够更好地处理长文本和复杂任务。
Llama2Long的改进主要包括:增加了长文本数据集、修改了位置编码、使用了强化学习。
Meta Platforms在9月29日发布了一篇计算机科学论文,介绍了其新发布的Llama2Long AI模型。该模型在某些任务上击败了GPT-3.5Turbo和Claude2,这表明Meta的开源方法在生成人工智能领域取得了重大进展。

Llama 2 Long是基于Meta的开源Llama2模型,经过改进后能够更好地处理长文本和复杂任务。该模型的改进主要包括:
增加了长文本数据集:Llama2Long的数据集比Llama2大了4000亿个token,其中包括大量的长文本。
修改了位置编码:Llama2Long使用了RoPE编码,该编码能够更好地处理长文本。
使用了强化学习:Llama2Long使用了强化学习来提高其性能。
在测试中,Llama2Long在生成长文本、翻译语言、编写代码等任务上都取得了优异的成绩。例如,在生成长文本的任务中,Llama2Long的表现比GPT-3.5Turbo和Claude2都更好。
Llama2Long的发布是一个重要里程碑,表明Meta在生成人工智能领域取得了重大进展。该模型的开源性也表明,开源方法在这一领域具有竞争力。
0001
评论列表
共(0)条相关推荐
“下周回国”无望 贾跃亭持有乐视股票拍卖:5毛钱一股
快科技7月24日消息,从阿里拍卖获悉,近日,又有一批贾跃亭持有的乐视网信息技术(北京)股份有限公司(股票代码:400084)的股票被挂上了拍卖。据悉,西安铁路运输中级法院将于7月28日10时至7月29日10时在阿里资产平台上公开拍卖一批贾跃亭持有的乐视股票。站长网2023-07-25 12:20:400000未成年人网络保护拟出台行政法规:为网络沉迷防治立规矩
据司法部官微消息,近日,司法部、国家网信办专题研究审议《未成年人网络保护条例(草案)》,进一步修改完善后,将加快推动条例立法进程。站长网2023-07-12 12:11:310000阿里巴巴推AI画图框架SCEdit 可显著减少训练参数
阿里巴巴的新项目SCEdit是一个AI画图框架,可以显著减少训练参数、内存使用率和计算开销。在训练阶段,它减少了52%的内存消耗,仅利用ControlNet所需参数的7.9%,并实现内存使用量减少30%。项目地址:https://scedit.github.io/站长网2023-12-27 11:22:070000科大讯飞:讯飞星火V4.0版6月27日发布 讯飞星火智能体平台亮相
今日,科大讯飞发布了首个支持长文本、长图文、长语音的大模型。在讯飞星火V3.5春季上新活动中,科大讯飞董事长刘庆峰介绍了讯飞星火大模型的一系列新功能:1.首次上线的星火图文识别大模型可以快速识别和学习多类型海量知识,提供更专业、更精准的行业场景回答。2.星火合同助手首次上线,可以审核规避合同风险、提炼总结关键要素,并一键起草合同文件。站长网2024-04-26 10:55:050004闲鱼回应多用户未经本人允许挂售同事:不可售卖非个人资产
近日,闲鱼平台上出现了一股独特的“售卖”风潮,用户们纷纷将自己的公司、工作甚至同事作为折扣商品上架,引起了广泛关注。这些商品的售价从9.9元到80000元不等,数量已超过500条。站长网2024-06-12 15:55:300001