基于LLaMA!开源模型Giraffe将LLaMA上下文窗口扩大10倍 达3万个token
站长网2023-08-26 16:14:333阅
文章概要:
1. 研究人员扩展了开源 LLaMA 模型的上下文窗口,创建了 Giraffe,上下文窗口扩大10倍,达到约32,000个标记。
2. Giraffe适合需要处理数十页文本的商业应用,为大上下文语言模型研究提供了重要见解。
3.该研究还强调了当前技术的局限性以及定制测试的必要性,当前不足以衡量长上下文表现,需要定制测试。
最近,研究人员使用插值技术将开源语言模型LLaMA的上下文窗口从原来的约3,200个token扩大了10倍,达到约32,000个token,由此开发出新的开源语言模型Giraffe。该版本有130亿个参数版本,并且拥有所有开源 LLM 中最大的上下文窗口之一。

Giraffe适用于需要处理数十页文本的各种商业应用场景。像GPT-3这样的语言模型上下文窗口有限,对长文本理解能力较弱。而Giraffe具有更大的“记忆”,能更好地处理这样的用例。
作为开源研究,Giraffe研究还提供了对语言模型内部运作以及不同的上下文窗口扩大技术的重要见解。研究发现,位置嵌入的线性缩放对增加上下文长度最为有效。
研究同时也凸显了当前技术的局限性,因为准确率会随上下文窗口增加而下降。这表明仅用困惑度来衡量语言模型的表现是不够的,对长上下文任务需要定制化的测试。
目前,开源的Giraffe-v2-13b-32k模型已在Hugging Face平台上线,代码也在GitHub上开源。
项目网址:
https://github.com/abacusai/Long-Context
https://huggingface.co/abacusai/Giraffe-v2-13b-32k
0003
评论列表
共(0)条相关推荐
在线图像编辑器miniPaint 开源Photoshop网页最强替代品
要点:1.miniPaint是一款在线图像编辑器,使用HTML5技术,无需下载或安装。2.支持图层、滤镜等关键功能,是Photoshop的替代品,操作直接在浏览器中完成。3.提供丰富的编辑功能,包括打开各种图像格式、剪切、复制、粘贴、选择、缩放等,同时具备多层系统和各种特效。站长网2023-12-01 10:35:040000OpenAI 支持的人工智能聊天机器人 My AI 发布神秘视频 吓坏 Snapchat 用户
站长之家(ChinaZ.com)8月17日消息:尽管还没有到万圣节,但一些Snapchat用户却觉得像是在这个节日已经到来。周二晚上,Snapchat的MyAI聊天机器人发布了一个神秘的一秒钟的视频,画面上似乎是一面墙和一个天花板,尽管以前从未在消息中添加过视频。当用户问聊天机器人时,机器保持了怪异的沉默。图片来自Snap站长网2023-08-17 08:46:300000苹果iPhone 15系列将采用Type-C接口,正崴称已接到订单
据工商时报报道,数据线和接插件制造商正崴日前召开法说会,就今年下半年展望进行了讨论。正崴表示,虽然一季度销售状况相对不景气,但从6月开始到下半年,公司将迎来旺季,因此预计今年的营收将较去年有所增长。站长网2023-06-24 14:17:070000研究人员推自动测试平台CodeIPPrompt 可分析AI代码生成是否侵权
最近,人工智能工具如ChatGPT和Copilot在程序员中爆发式增长,为他们提供了更多帮助。然而,这些人工智能助手可能会删除代码中的注释(这些注释本来用于明确版权和归属指南),从而使人类程序员对知识产权侵权一无所知,但仍会在法律上承担责任。站长网2023-08-01 15:11:310001“云养老”的年轻人,再次爱上鉴宝直播
“故宫一对我一对”“来靠近点我看看……东西是老的一眼大开门(真货)”最近,抖音平台上的鉴宝直播再次出圈,@海东鉴宝、@听泉寻宝等博主与宝友(指文玩玉石爱好者)直播连线鉴宝,节目效果十足,引起广大网友关注。早在二十多年前,鉴宝节目在电视上就已经有很多忠实观众。王刚主持的《天下收藏》就因为会在“护宝”环节砸掉所谓的“赝品”而噱头十足。站长网2024-02-02 11:07:190000