阿里云等发布智海-三乐教育垂直大模型 基于教材、论文等语料进行微调
站长网2023-08-23 12:45:290阅
阿里云宣布,浙江大学联合高等教育出版社、阿里云等发布基于通义千问7B(70亿参数)模型训练的智海-三乐教育垂直大模型,该模型已在阿里云灵积平台(DashScope)上线服务,开发者仅需一行代码即可使用。
智海-三乐以阿里云通义千问7B通用模型为基座,基于核心教材、领域论文和学位论文等教科书级高质量语料和专业指令数据集继续预训练和微调,集成了搜索引擎、计算引擎和本地知识库等功能,将于9月在全国12所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力。
目前智海-三乐已通过阿里云灵积平台(DashScope)对外提供API服务。未来该模型还将基于灵积平台提供的高效微调训练能力、插件框架等配套设施,系统化的拓展模型覆盖面和效果。
据悉,阿里云正积极建设自研和行业大模型生态,灵积平台已托管了通义千问、Stable Diffusion、ChatGLM-v2、百川、姜子牙、LLaMa2等业界领先的大模型。不久前,阿里云还在AI模型社区魔搭ModelScope开源通义千问7B参数通用模型和对话模型。
0000
评论列表
共(0)条相关推荐
Meta 已关闭 1000 多个涉及 ChatGPT 等生成式 AI 相关的恶意链接
Meta表示,它已经关闭了1000多个涉及ChatGPT的相关链接,这些链接会引导其用户访问恶意软件,因为犯罪分子正在利用人们对生成式人工智能的热潮来谋利。站长网2023-05-04 17:56:420000网易开放免费声音复原技术,让听障人士用自己的声音 “说话”
近日,网易集团和网易公益联合浙江省残疾人福利基金会发起了名为“人生第一句”的声音复原公益计划。该计划利用网易互娱AILab的iSpeech技术,开发了一款能够复原听障人士原声的工具。站长网2023-07-21 17:06:400000MIT斯坦福Transformer最新研究:过度训练会让中度模型“结构顿悟”
要点:经过过度训练,中度模型如Transformer表现出结构性泛化能力,被称为"结构顿悟"(StructuralGrokking)。研究发现,对于Transformer类模型,长时间训练后,模型在泛化到新结构输入时能够有效地捕捉到句子的层级结构。结果显示,模型的深度对结构顿悟呈倒U形缩放,中深度模型的泛化能力较深度和浅度模型更强。站长网2023-12-08 15:01:400000英伟达收购人工智能初创公司 OmniML 押注边缘 AI
英伟达在今年2月悄悄收购了人工智能初创公司OmniML。OmniML的技术可以将机器学习模型小型化,使其能够在边缘设备上运行,而不依赖云端。一位发言人以及前OmniML员工的LinkedIn个人资料,他们现在都加入了英伟达。站长网2023-07-05 10:22:090001“小作文”风波后 东方甄选宣布孙东旭辞任公司非执行董事
快科技12月22日消息,今日晚间,东方甄选发布公告,宣布孙东旭已辞任公司非执行董事一职,即时生效。公告指出,孙东旭之辞任乃由于鉴于最近的舆论风波,其对本公司品牌及声誉管理不善,董事会认为,孙东旭之辞任将能够更好地维护本公司股东的利益。站长网2023-12-23 10:31:300000