嘉楠科技Canaan开源通用大语言模型Toucan
站长网2023-08-31 08:45:340阅
近日,嘉楠科技(Canaan)发布了参数量为70亿的通用大语言模型 Toucan-7B 及 INT4量化版本 Toucan-7B-4bit。
Toucan-7B 能够实现文案写作、代码解析、信息抽取等多种自然语言处理任务,并在测试中表现优于 ChatGLM-6B。Toucan-7B-4bit 使用了最新的 INT4量化技术,显存占用量更低,与 Toucan-7B-fp16模型相比,具有较好的推理效果。
据悉,Toucan 是一个基于 Meta LLaMa 架构的开源中文对话语言模型。它具有70亿参数,并结合了模型量化和稀疏技术,可以在端侧进行推理。Toucan-7B 的效果略好于 ChatGLM-6B,而经过4bit 量化后的模型与 ChatGLM-6B 的效果相当。
项目地址:https://github.com/kendryte/Toucan-LLM
0000
评论列表
共(0)条相关推荐
AlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了
把AlphaGo的核心算法用在大模型上,“高考”成绩直接提升了20多分。在MATH数据集上,甚至让7B模型得分超过了GPT-4。一项来自阿里的新研究引发关注:研究人员用蒙特卡洛树搜索(MCTS)给大语言模型来了把性能增强,无需人工标注解题步骤,也能生成高质量数据,有效提升大模型的数学成绩。论文发布,让不少网友重新关注到了蒙特卡洛树搜索这个在前大模型时代的明星算法。有人直言:站长网2024-05-09 20:26:180007马斯克的xAI欲筹 60 亿美元挑战ChatGPT和谷歌Bard
**划重点:**1.埃隆·马斯克旗下的xAI计划筹资60亿美元,目标是与OpenAI的ChatGPT竞争,估值达到200亿美元。2.xAI已推出聊天机器人Grok,提供实时知识和回答有趣问题,致力于确保人工智能发挥积极作用,并开发防范恶意使用的保障措施。3.预计这一巨额融资将由摩根士丹利和中东投资者推动,标志着xAI有意成为人工智能领域的重要力量。站长网2024-01-30 11:47:330001苹果最新AI研究或彻底改变iPhone体验 比如可从视频生成逼真3D头像
**划重点:**1.🎥**3D动态头像技术:**苹果提出HUGS技术,从短视频中生成逼真的3D动态头像,训练速度是之前方法的100倍以上,为更沉浸的视觉体验打开新可能。2.🧠**内存优化:**苹果研究人员攻克在有限内存设备上运行大型语言模型的难题,通过降低数据传输量和优化读取方式,实现在iPhone等设备上高效运行复杂的AI系统。0000仅5个字符的新绘图语言火了,ChatGPT都学会了
只用五个字符,就能完成一幅像素画的绘制了。这是一种新的绘图语言,一共支持8种颜色,画幅可达256*256。它包含了“CFR[]”这五个符号,因此名字也就叫CFR[]了,主打的就是一个直观。而且CFR[]免费开源,无需部署安装,在线就能体验。虽然只有5个符号,但是它能绘制出的图像可并不简单,比如作者展示的这个DEMO:站长网2023-10-24 21:22:590000华为FreeClip耳夹耳机官宣将于12月26日发布
华为冬季全场景发布会将于12月26日14:30举行,届时问界M9将与华为FreeClip耳夹耳机一同亮相。华为FreeClip耳夹耳机是华为首款开放式耳机,此前已在海外发布,定价199欧元(约1544元人民币)。这次在国内的发布将标志着这款耳机的正式登陆。站长网2023-12-14 14:55:420002