基于LLaMA!开源模型Giraffe将LLaMA上下文窗口扩大10倍 达3万个token
站长网2023-08-26 16:14:333阅
文章概要:
1. 研究人员扩展了开源 LLaMA 模型的上下文窗口,创建了 Giraffe,上下文窗口扩大10倍,达到约32,000个标记。
2. Giraffe适合需要处理数十页文本的商业应用,为大上下文语言模型研究提供了重要见解。
3.该研究还强调了当前技术的局限性以及定制测试的必要性,当前不足以衡量长上下文表现,需要定制测试。
最近,研究人员使用插值技术将开源语言模型LLaMA的上下文窗口从原来的约3,200个token扩大了10倍,达到约32,000个token,由此开发出新的开源语言模型Giraffe。该版本有130亿个参数版本,并且拥有所有开源 LLM 中最大的上下文窗口之一。
Giraffe适用于需要处理数十页文本的各种商业应用场景。像GPT-3这样的语言模型上下文窗口有限,对长文本理解能力较弱。而Giraffe具有更大的“记忆”,能更好地处理这样的用例。
作为开源研究,Giraffe研究还提供了对语言模型内部运作以及不同的上下文窗口扩大技术的重要见解。研究发现,位置嵌入的线性缩放对增加上下文长度最为有效。
研究同时也凸显了当前技术的局限性,因为准确率会随上下文窗口增加而下降。这表明仅用困惑度来衡量语言模型的表现是不够的,对长上下文任务需要定制化的测试。
目前,开源的Giraffe-v2-13b-32k模型已在Hugging Face平台上线,代码也在GitHub上开源。
项目网址:
https://github.com/abacusai/Long-Context
https://huggingface.co/abacusai/Giraffe-v2-13b-32k
0003
评论列表
共(0)条相关推荐
OpenAI斥资500万美元用AI技术辅助地方新闻事业
据报道,OpenAI与美国新闻项目(AJP)合作,向AJP提供500万美元的资金支持,以利用AI技术辅助地方新闻事业。站长网2023-07-19 12:29:510000网信办发布全球人工智能治理倡议
今日,国家网信办发布了《全球人工智能治理倡议》,全球人工智能治理倡议是针对人工智能技术快速发展所带来的挑战和机遇提出的倡议。倡议强调了人工智能治理的重要性,呼吁各国加强信息交流和技术合作,共同制定人工智能治理框架和标准规范。倡议强调了人工智能应以人为本,增进人类共同福祉为目标,并应尊重他国主权和法律,防范恶意使用人工智能技术。站长网2023-10-18 23:29:380000OpenAI科学家震惊TED大会:让AI模型思考20秒,提升10万倍性能!
今天凌晨,知名科技媒体Venturebeat消息,OpenAI高级研究科学家、德扑AI之父NoamBrown,在美国旧金山举办的TEDAI大会上提出了一个震惊的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。0000阿里巴巴称阿里云将继续分拆上市
阿里巴巴在港交所公告称,按照阿里巴巴集团于2023年6月20日宣布的计划,公司已于今日完成领导层交接,由蔡崇信接任公司董事会主席及吴泳铭接任公司首席执行官及董事。另外,公司宣布吴泳铭将接替张勇出任阿里云智能集团代理董事长兼首席执行官,委任于2023年9月10日生效。站长网2023-09-11 08:26:230000月活10亿的TikTok,能为品牌出海提供什么新增量?
5月18日下午,TikTokforBusiness(TikTok旗下的全球移动营销平台)在深圳举办了SHOPNOW品牌电商出海营销峰会。TikTok坐拥10亿月活用户,早就被认为是下一个风口。因此,TikTok的一举一动都能够吸引众多业内机构及品牌商家们的目光。站长网2023-05-23 09:04:050000