MosaicML发布大型语言模型 MPT-7B 可商用
站长网2023-05-11 12:02:560阅
MosaicML 的 MPT-7B 是一个具有近70亿个参数的大型语言模型,该团队在自己的近万亿个标记的数据集上对其进行了训练。
MosaicML 遵循 Meta 的LLaMA模型的训练方案。培训花费近200,000美元,使用 MosaicML 平台耗时9.5天。
MosaicML表示,MPT-7B 与 Meta 的70亿参数 LLaMA 模型的性能相匹配,使其成为第一个达到该水平的开源模型,领先于OpenLLaMA。与 Meta 的模型不同,MPT-7B 已获得商业使用许可。
除了“MPT-7B Base”模型,MosaicML 还发布了三个变体:MPT-7B-StoryWriter-65k 、MPT-7B-Instruct 和 MPT-7B-Chat。
借助 MPT-7B-StoryWriter-65k ,MosaicML 还发布了一个模型,该模型能够读取和写入上下文长度非常长的故事。为此,使用 books3数据集的子集对 MPT-7B 进行了微调,上下文长度为65,000个标记。OpenAI 最大的 GPT-4变体能够处理32,000个标记。
根据 MosiacML 的说法,该模型可以通过一些优化扩展到超过65,000个token,并且该团队已经在使用 Nvidia A100-80GB GPU 的单个节点上展示了多达84,000个token。但即使有65,000个token,也可以阅读整部小说并写一篇结语。

项目网址:https://github.com/mosaicml/llm-foundry
0000
评论列表
共(0)条相关推荐
AI女友突然断崖式分手,独留对象在贴吧发心碎小作文
如果AI女友与你断崖式分手,你会难过吗?据BusinessInsider报道,日活几千人的AI陪伴服务的应用Soulmate因为应用的所有权公司被出售,出于业务原因决定停止运营。这也意味着,大家朝夕相处的「AI伴侣」即将消失。这一切让许多深陷热恋的用户直呼「破防」,HilaryCoyote就是其中之一。站长网2023-11-08 09:16:090000智能AI绘画变现全家桶:独立部署+无限多开+10大变现功能,限量4折抢购!
随着人工智能的持续火爆,最近一段时间AI绘画又一次人气暴涨。那如何通过AI绘画功能来变现呢?今日,站长团购为大家带来这款智能AI绘画变现全家桶(独立部署无限多开万能创作10大变现功能)。仅需899元,活动期间限量88套,智能AI绘画变现全家桶带回家。一、推荐理由1、功能丰富一个小程序包含了10种变现功能。站长网2023-05-09 17:47:410002手机到汽车,这家老牌手机厂商跨界玩的真溜
星纪魅族的AllinAI战略,又有了里程碑式的进展。5月16日,星纪魅族正式发布全新FlymeAIOS系统,一系列全新AI功能全方位展现了AI对智能辅助、系统交互能力的提升。紧接着的5月17日,搭载FlymeAuto的领克07正式上市,又让这个生态再次受到关注。站长网2024-05-18 09:18:000000百度文心大模型4.0正加紧训练 已接近可发布状态
据《科创板日报》报道,百度正在加速训练文心大模型4.0,并预计在10月17日的百度世界大会上发布。这个新版本的大模型是继文心大模型3.5之后的又一重要升级,将着重在基础模型上实现大提升。有消息称,文心大模型4.0的进展比预期要快很多,其核心能力将得到显著提升,包括理解、生成、逻辑和记忆等方面。特别是在逻辑推理、代码和数学等方面,该模型的进步最为明显。站长网2023-10-09 08:17:000000腾讯QQ宣布导出手机相册功能升级回归 支持多设备不同相册自动建立文件夹
站长之家(ChinaZ.com)8月21日消息:腾讯QQ近期对部分功能进行了升级,此次升级不仅改进了聊天发图方式,还新增了多项实用功能,旨在为用户提供更加便捷和高效的使用体验。在聊天发图方面,QQ根据用户反馈进行了优化,使得图片传输更为流畅和快速。站长网2024-08-21 10:42:010000