嘉楠科技Canaan开源通用大语言模型Toucan
站长网2023-08-31 08:45:340阅
近日,嘉楠科技(Canaan)发布了参数量为70亿的通用大语言模型 Toucan-7B 及 INT4量化版本 Toucan-7B-4bit。
Toucan-7B 能够实现文案写作、代码解析、信息抽取等多种自然语言处理任务,并在测试中表现优于 ChatGLM-6B。Toucan-7B-4bit 使用了最新的 INT4量化技术,显存占用量更低,与 Toucan-7B-fp16模型相比,具有较好的推理效果。
据悉,Toucan 是一个基于 Meta LLaMa 架构的开源中文对话语言模型。它具有70亿参数,并结合了模型量化和稀疏技术,可以在端侧进行推理。Toucan-7B 的效果略好于 ChatGLM-6B,而经过4bit 量化后的模型与 ChatGLM-6B 的效果相当。
项目地址:https://github.com/kendryte/Toucan-LLM
0000
评论列表
共(0)条相关推荐
微信灰度测试小绿书
近日,在微博上有网友爆料,微信正在灰度测试看一看新图文板块。这是继公众号图文改版后又一个关于图文消息侧改版的重磅消息,也有网友称之为“小绿书”。微信更新版本后,用户能在“看一看”界面的首页直接看到图文消息,并且还可以直接发布自己的图片帖子。让我们一起来看看网友口中的“小绿书”究竟什么样子。01小绿书来了站长网2023-08-01 09:27:060000福布斯发布2023年AI50榜单:OpenAI、谷歌云、AWS等上榜
今日,福布斯发布2023年AI50榜单,它是由美国福布斯杂志、SequoiaCapital和MeritechCapital联合评选的榜单,旨在表彰最有前途的使用人工智能进行商业应用的未上市公司。站长网2023-04-14 15:17:450002品牌直播2023:内卷与突围
回顾2023年,红利消退、降本增效成为越来越多品牌的共识,相较几年前找大主播带货的“轻松”,品牌们不得不走出舒适区,或大搞内容,或开启撒钱模式,或探索新平台新玩法,期待能真正积累起属于自己的企业数字化内容资产。多番尝试下,有人为活力28的“三个小老头”疯狂下单,有人为椰树的荷尔蒙直播频频点赞,有人因为79元眉笔事件开始重新思考品牌的营销动作……站长网2024-01-04 14:23:540002对话仁汇网络:每场直播超10万人在线,“木森大舞台”成功的秘诀是什么?
在抖音众多优质的大舞台直播间里,“木森大舞台”一定是有一席之地的。该直播间以头部主播木森和红豆为主导,每场直播都能维持10万流量。去年10月,木森来到了抖音,重启自己的直播事业,并选择了户外才艺大舞台的直播形式。精心装扮的户外舞台,极具地方特色的歌曲表演,很快为木森带来了百万的粉丝。站长网2023-10-13 18:00:040001巴黎世家雨中走秀:推出支付宝联名T恤 一件4700元
近日,法国高端时尚品牌巴黎世家(Balenciaga)在上海盛大举办了其备受瞩目的春季25系列发布秀,这也是艺术总监DemnaGvasalia首次在亚洲呈现其设计才华。而在这场时尚盛宴中,最引人注目的无疑是支付宝与巴黎世家跨界合作的联名款T恤。站长网2024-05-31 16:18:020003