OpenBuddy发布新一代中文跨语言大模型 基于Llama 3 70B打造
站长网2024-05-10 11:29:400阅
OpenBuddy 团队发布了基于 Meta Llama370B 的最新成果:OpenBuddy-Llama3-70B-v21.1-8k,这是他们首次在 Llama370B 基座上的中文跨语言训练尝试。
Llama370B 是一个15T 训练集训练而成的稠密大模型,然而由于训练集中缺少中文数据,Meta 官方的 Llama3系列对话模型在中文领域的认知、理能力较弱,容易出现以英文回答中文问题的现象。

因此,OpenBuddy 团队在此次训中选择了 Llama370B Base 模型作为基础,重点提升模型的跨语言理解、认知能力。
测试过程中,OpenBuddy-Llama3-70B 展现出了优秀的中文理解能力,具备了更的认知潜力和量化后性能。在此次发布的模型中,他们对 Llama3现有词表进行了扩,增加了7000余个中文字词,进一步提升了模型中文编码密度。
值得一提的是,于量化版模型能力下降较为明显,他们本次只发布了模型的完整版权重,后续会尝优化70B 模型的量化后性能,并挑选合适时机发布量化版。
模型链接:
https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-70b-v21.1-8k/summary
0000
评论列表
共(0)条相关推荐
ARC浏览器发布了2个好用功能 彻底改变传统搜索模式
ARC浏览器日前发布了两项引人瞩目的新功能,为用户提供了更为高效的搜索体验,彻底改变了传统搜索的模式。首先,对于一般的搜索需求,比如查找特定视频,ARC浏览器直接将用户导向目标视频的播放页面,省去了翻阅多个搜索结果的烦恼,让搜索过程更为直观和迅速。站长网2024-02-02 10:31:170000Xbox被指使用AI生成的艺术作品推广游戏
**划重点:**1.🤖一些玩家指责Xbox在社交媒体上使用由AI程序生成的艺术品来推广独立游戏。2.📅在12月27日,Xbox账号ID@Xbox发推询问粉丝对2023年最喜欢的独立游戏的看法,引发了一场争议。3.🖌️尽管一些开发者对AI艺术持积极态度,但许多玩家批评使用这种技术,认为其在游戏和广告中的应用引发了社区不满。站长网2023-12-29 13:06:160000Stack Overflow 调查显示开发人员已准备好使用 AI 工具辅助编程
AI工具在编码问答网站StackOverflow的开发者调查中被发现正变得普遍,尽管编码人员对其准确性持怀疑态度。这项调查在该网站正面临处理AI生成内容引发的版主罢工时进行,对其来说正值一个有趣的时刻。调查发现,77%的受访者对在工作流程中使用AI持积极态度,70%的人已经使用或计划在今年使用AI编码工具。站长网2023-06-16 14:38:590000Rerender A Video源代码放出!解决AI视频闪烁问题
RerenderAVideo是一项令人印象深刻的技术成果,它旨在将大型文本到图像扩散模型的能力扩展到视频领域。该项目提出了一种零训练的文本引导视频到视频翻译框架,能够在视频帧之间确保时间一致性,这一直是一个巨大的挑战。它包括两个主要部分:关键帧翻译和完整视频翻译。第一部分使用适应的扩散模型生成关键帧,通过应用层次交叉帧约束来强化形状、纹理和颜色的连贯性。站长网2023-09-26 11:44:410001库克发文纪念乔布斯“69岁生日”:他曾对世界产生深远影响
快科技2月24日消息,今天,现任苹果CEO蒂姆库克(TimCook)在微博发文,纪念苹果创始人史蒂夫乔布斯(SteveJobs)的69岁生日”。库克表示,在我的朋友史蒂夫生日这天,怀念他,怀念他触动的生命、他分享的愿景以及他对我们这个世界产生的深远影响。我们来到这个宇宙就是要引发些许改变,否则我们为什么要来呢?”库克称。站长网2024-02-24 10:52:180000