嘉楠科技Canaan开源通用大语言模型Toucan
站长网2023-08-31 08:45:340阅
近日,嘉楠科技(Canaan)发布了参数量为70亿的通用大语言模型 Toucan-7B 及 INT4量化版本 Toucan-7B-4bit。
Toucan-7B 能够实现文案写作、代码解析、信息抽取等多种自然语言处理任务,并在测试中表现优于 ChatGLM-6B。Toucan-7B-4bit 使用了最新的 INT4量化技术,显存占用量更低,与 Toucan-7B-fp16模型相比,具有较好的推理效果。
据悉,Toucan 是一个基于 Meta LLaMa 架构的开源中文对话语言模型。它具有70亿参数,并结合了模型量化和稀疏技术,可以在端侧进行推理。Toucan-7B 的效果略好于 ChatGLM-6B,而经过4bit 量化后的模型与 ChatGLM-6B 的效果相当。
项目地址:https://github.com/kendryte/Toucan-LLM
0000
评论列表
共(0)条相关推荐
苹果头显制造成本曝光 Vision Pro零部件成本超1500美元
苹果发布的高端头戴式显示器AppleVisionPro,尽管其市场售价高达3499美元,但其背后的制造成本同样引人瞩目。据权威研究机构Omdia的评估,仅该头显的零部件成本就已超过了1500美元。这一高昂成本主要归因于其所采用的双块4Kmicro-OLED屏幕,这种屏幕以高分辨率和高像素密度闻名,旨在为用户带来顶级的视觉体验。站长网2024-02-26 10:31:290000国产特斯拉Model 3/Y全系上涨2000元:原因未知
快科技5月2日消息,从特斯拉官网查询可知,国产特斯拉Model3和Y价格上调,全系均涨2000元。其中特斯拉Model3入门版价格涨至23.19万元(此前为22.99万元),高性能版涨至33.19万元(此前为32.99万元);站长网2023-05-02 15:21:420003亚马逊向个人开发者免费提供AI编程助手CodeWhisperer
亚马逊已经为其人工智能编码助手CodeWhisperer免费提供给个人开发者。该工具根据基于文本的提示生成代码行,并支持多种语言,包括Python、Java、JavaScript、TypeScript和C#。CodeWhisperer会自动过滤掉有偏见或不公平的代码建议,并标记与开源训练数据相似的代码。它还包括安全扫描功能,可识别开发人员代码中的漏洞并提供建议以弥补任何安全漏洞。站长网2023-04-17 14:46:080001周鸿祎回应带队360直播带货:高度关注网红经济
刚刚,周鸿祎对市场传言作出回应,他表示会在下午的视频中分享自己对直播带货背后的短视频直播商业模式和网红经济现象的想法。有媒体报道,业内人士透露360计划效仿东方甄选的模式,选择和培养主播进行直播带货。这一战略举措引发外界广泛关注。据悉,周鸿祎近年来一直保持对网红经济的高度关注,并与多家企业家和明星就此展开交流。站长网2024-02-06 14:51:170000AI行业求职冰火“两重天”,谁在大厂“打螺丝”?
自今年3月人工智能ChatGPT火爆全网,AI行业一度备受关注。而当风口兴起,从大厂到“新一线厂”求贤若渴,不少求职者也争相涌入赛道。伴随着“金九银十”求职季的到来,AI行业的再度掀起热潮。不过,当AI方向的硬件开发、移动开发、前端开发等核心技术人员和算法研究员成为各个大厂抢夺的人才,薪酬水涨船高时,AI内容编辑、数据标记等岗位却一度被因低薪、含金量低等原因被求职者调侃为“数字劳工”。站长网2023-10-08 18:08:290000