OpenBuddy发布新一代中文跨语言大模型 基于Llama 3 70B打造
站长网2024-05-10 11:29:400阅
OpenBuddy 团队发布了基于 Meta Llama370B 的最新成果:OpenBuddy-Llama3-70B-v21.1-8k,这是他们首次在 Llama370B 基座上的中文跨语言训练尝试。
Llama370B 是一个15T 训练集训练而成的稠密大模型,然而由于训练集中缺少中文数据,Meta 官方的 Llama3系列对话模型在中文领域的认知、理能力较弱,容易出现以英文回答中文问题的现象。
因此,OpenBuddy 团队在此次训中选择了 Llama370B Base 模型作为基础,重点提升模型的跨语言理解、认知能力。
测试过程中,OpenBuddy-Llama3-70B 展现出了优秀的中文理解能力,具备了更的认知潜力和量化后性能。在此次发布的模型中,他们对 Llama3现有词表进行了扩,增加了7000余个中文字词,进一步提升了模型中文编码密度。
值得一提的是,于量化版模型能力下降较为明显,他们本次只发布了模型的完整版权重,后续会尝优化70B 模型的量化后性能,并挑选合适时机发布量化版。
模型链接:
https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-70b-v21.1-8k/summary
0000
评论列表
共(0)条相关推荐
“霸总”下场整活,“短剧式直播”狂揽500万GMV
直播带货又有了新玩法,这次是跟短剧组起了CP。近日,因为《毛巾帝国》系列短剧出圈的洁丽雅“毛巾少爷”,在抖音开启了直播带货首秀,单场带货GMV破500万。从短剧的爆火再到直播间的亮眼成绩单,背后体现的除了“短剧直播”为直播带货带来新的内容解法之外,还有品牌营销思路的变化:与其花钱投放,不如自己做IP。短剧和直播“组CP”站长网2024-06-23 00:00:180000腾讯混元最新图生视频模型!想动哪里点哪里,诸葛青睁眼原来长这样 | 开源
单击画面中的火箭,输入“发射”prompt,瞬间起飞!就连想要回收火箭,也只需要输入“Launchdown”,再轻轻一点击:马斯克看了都要自我怀疑一下,这火箭发射这么简单,自家星舰成功进入太空怎么那么难(开个小玩笑)??以上效果来自一个新的图生视频模型Follow-Your-Click,由腾讯混元、清华大学和香港科技大学联合推出。食用方法非常友好:站长网2024-03-17 17:42:110001意大利监管机构:若 OpenAI 采取「有效措施」 ChatGPT 有望 4 月 30 日重新上线
意大利数据保护监管机构的负责人PasqualeStanzione周二在CorrieredellaSera采访时表示,如果ChatGPT的开发商OpenAI公司能够采取「有效措施」来解决其担忧,他们将允许该公司在4月30日重新上线ChatGPT。站长网2023-04-19 11:42:290000全球首款三折叠!华为Mate XT非凡大师开启新品预订:高清外观揭晓
快科技9月7日消息,华为官方今天正式宣布,华为MateXT非凡大师三折叠手机于12:08开启预订。同时官方还揭晓了新机的外观图,可以清晰的了解到这部全球首款三折叠的造型。折叠方式与爆料相同,采用Z”字形方案,等于是将一部外折和一部内折相结合。使用时有三种折叠方式可用:完全展开、完全折叠、仅折叠一边。站长网2024-09-08 12:28:490000苹果将推出AirPodsMax2头戴式耳机:改用USB-C接口
彭博社的马克·古尔曼(MarkGurman)在最新帖文中透露,苹果公司计划在明天凌晨的发布会上推出AirPodsMax2头戴式耳机,这将是自2020年12月该产品首次发布以来的首次更新。站长网2024-09-10 16:25:560000