32k上下文可商用!长颈鹿来袭,开源大模型长度再创新高
要点:
长颈鹿是基于LLaMA模型打造的,上下文长度达到32k,是目前开源大模型中最长的。
研发团队Abacus.AI通过测试不同的上下文外推方法,发现线性插值效果最好,并在此基础上提出了Power Scaling和Truncated Basis两种新思路。
尽管Abacus.AI宣称长颈鹿是首个32k开源模型,但Together.AI更早发布了类似规模的版本,两者可以说并列第一。
长颈鹿(Giraffe)是Abacus.AI团队基于LLaMA模型系列打造的新作,被称为“开源大模型史上第一个上下文长度达到32k的版本”。LLaMA发布于2022年,包含多个规模参数的迭代版本,但都仅有4k的上下文长度,在实际应用中表现仍有局限。为突破这一瓶颈,Abacus.AI团队进行了一系列测试与优化。
论文地址:https://arxiv.org/abs/2308.10882
项目地址:https://huggingface.co/abacusai/Giraffe-v2-13b-32k
他们发现,通过修改注意力机制中的位置编码系统是当前主流的上下文外推方法,包括线性缩放、随机编码等。在此基础上,团队提出了Power Scaling和Truncated Basis两种新思路。Power Scaling是对原有编码做指数变换,使模型更倾向于外推距离较远的上下文;Truncated Basis则是保留高频分量但将低频分量设置为0,也能在循环周期中覆盖更长距离。
为全面评估不同方法的效果,团队设计了三个新的测试集,除困惑度外还加入了问答和关键词检索等任务。结果显示,线性插值最为有效,新提出的Truncated Basis也展现出一定的优势。最终,团队选择线性插值法打造出长颈鹿系列模型,长度可选4k、16k和32k。
Abacus.AI宣称这是全球首个32k开源大模型,但实际上Together.AI已经在更早发布了类似的版本。两家企业使用的上下文扩展方法和模型规模也有细微区别。所以,可以说长颈鹿与Together.AI的模型并列为当前开源领域32k长度的“第一”。
Instagram推出基于生成式AI的背景编辑工具 轻松打造独特图片
划重点:1.Instagram于12月14日向美国用户推出了生成式AI背景编辑工具。2.用户可以通过各种提示,如“走红地毯”、“被恐龙追赶”、“被小狗包围”等,定制图片背景。3.创新的AI工具为用户的Story帖子添加“尝试”标签,让其他用户也能参与图像生成过程。站长网2023-12-14 18:08:150000报告称:生成式AI或将使种族财富差距扩大430亿美元
**划重点:**1.📉生成式人工智能预计将为美国创造近2万亿美元的财富,其中500亿美元将流向家庭。2.📈黑人家庭“每增加一美元家庭财富就赚取38美分”,如果准确的话,种族贫富差距可能会扩大430亿美元3.⚙️黑人专业人士主要从事不需要学位的工作,如办公支持、生产工作、食品服务和机械安装和维修,这些工作可能被人工智能取代,进一步加剧财富差距。0000Meta 向员工演示为 Whatsapp 和 Messenger 开发的生成式 AI 聊天机器人
Facebook所有者Meta于周四向员工提供了一系列正在开发的人工智能工具的初步展示,其中包括计划在Messenger和WhatsApp上使用类似ChatGPT的聊天机器人,这些机器人可以使用不同的角色进行对话。站长网2023-06-10 08:46:510001字节跳动澄清“OpenAI服务被禁”: 未来几天将再次全面排查
划重点:🚨报道称,字节跳动使用OpenAI技术涉嫌违反服务条款,导致账户被封禁。🤝公司负责人澄清称,违规行为是早期阶段实验性项目中的偶发行为,已于4月停止,并在9月进一步采取措施以符合规范。🔄公司表示将在未来几天进行全面排查,以确保严格遵守OpenAI相关服务的使用条款。0000微软携手风险投资公司,为初创企业提供免费AI芯片资源
划重点:-微软计划与风险投资公司合作,为初创企业提供免费的Azure基础设施,用于训练人工智能模型。-该计划首先针对YCombinator和M12等初创企业提供NvidiaGPU虚拟机集群,以训练和运行生成模型。-微软希望通过此举降低初创企业训练和运行AI模型的门槛,同时推动Azure云平台的使用。站长网2023-11-08 16:58:020000