亚马逊机器学习团队推出 Mistral 7B 基础模型 支持8000个token上下文长度
文章概要:
- Mistral7B 是Mistral AI开发的英文文本和代码生成基础模型,参数规模70亿。
- SageMaker JumpStart提供一键部署Mistral7B进行推理,可快速自定义。
- Mistral7B具有8000个token的上下文长度,表现低延迟和高吞吐量。
亚马逊机器学习团队近日宣布,Mistral AI开发的Mistral7B基础模型现已在亚马逊SageMaker JumpStart上提供,用户可以通过该平台一键部署模型进行推理。
Mistral 7B是Mistral AI开发的英文文本和代码生成基础模型,拥有70亿个参数,支持文本摘要、分类、文本补全和代码补全等多种用例。为展示模型的易于自定义性,Mistral AI还发布了Mistral7B Instruct对话模型,使用各种公开对话数据集进行了优化。
Mistral 7B采用transformer架构,通过grouped-query attention和sliding-window attention实现更快的推理速度和处理更长序列的能力。该模型具有8000个token的上下文长度,表现出低延迟和高吞吐量,与更大模型相比性能出色,参数量只有70亿,显存需求较低。Mistral7B基于宽松的Apache2.0许可发布,可无限制使用。
亚马逊SageMaker JumpStart是一个机器学习中心,提供各种预训练好的算法和模型,用户可以快速上手机器学习。现在,用户可以通过几次点击在SageMaker Studio中发现并部署Mistral 7B,或者通过SageMaker Python SDK以编程方式部署,利用SageMaker的各项功能如管道、调试器对模型性能及MLOps进行控制。模型部署在AWS安全环境下、用户的VPC控制之中,有助于确保数据安全。
SageMaker JumpStart为机器学习从业者提供了越来越多性能最好的基础模型。它们帮助降低训练和基础设施成本,并支持自定义以适应特定用例。
总结Mistral7B的主要特色功能点大致如下:
1. 参数规模达70亿,支持多种自然语言处理任务。Mistral 7B是一个具有70亿参数的基础模型,支持文本摘要、分类、补全等多种英文NLP任务。
2. 推理速度快,具有8000个token的上下文长度。Mistral 7B使用了transformer架构,可以实现低延迟和高吞吐量推理,支持长达8000个token的上下文长度。
3. 易于部署使用,提供一键体验。用户可以通过Amazon SageMaker JumpStart一键部署Mistral7B,并便捷获得其推理服务,无需训练即可使用。
4. 模型开源,基于Apache2.0协议。Mistral7B的模型权重已在宽松的Apache2.0许可下开源,用户可以无限制地使用。
SageMaker JumpStart体验网址:https://aws.amazon.com/cn/sagemaker/jumpstart/
科大讯飞刘庆峰:星火大模型今年6、7月就能赶上GPT-4目前水平
在澳门举办的BEYOND国际科技创新博览会上,科大讯飞董事长刘庆峰对中美在通用大模型底座上的竞争态势发表了独到见解。他坚信,尽管中美在此领域存在差距,但这只是半年到一年半之间的动态追赶,科大讯飞绝不会被甩在后面。站长网2024-05-23 20:47:270000东方甄选入驻拼多多,出抖计划再进一步
东方甄选的抖音出逃计划,又有新动作了。最近,东方甄选悄悄入驻了拼多多。比起之前入驻淘宝时,大张旗鼓地联合宣传,这一次,东方甄选看上去格外低调,可以说是不动声色。如果说,之前出抖入淘,东方甄选还有种跟抖音明面叫嚣的意味在,现在它的种种动作,更像在以一种平常心稳步推进。站长网2024-03-15 09:17:390000仿人脑神经开发AI!剑桥大学最新研究登Nature子刊,人造大脑成AI新方向
【新智元导读】剑桥大学最新研究显示,AI模型和人脑神经结构有不少相似,也许未来会成为AI模型设计的关键。人脑作为地球上最复杂的智能载体,一个最大的特点就是能高能效地产生智能。如果能尽可能按照人脑的工作原理来创建AI系统,将会大大提高AI的工作效率,大幅降低能耗。最近,剑桥大学做了这么项研究,就是想找到一个条路径,让AI系统复制人脑。0000大模型管理平台LangTale 简化协作、提高AI团队效率
LangTale是一个强大的平台,旨在简化团队对大型语言模型提示的管理,实现更高效的协作和部署。该平台通过提供提示集成、变更管理、资源优化等功能,让非技术团队成员也可以无缝使用LLM。官网地址:https://langtale.ai/站长网2023-08-24 23:45:420001百度发布2023年第四季度财报 李彦宏:继续坚定对生成式AI投入
百度公布了其2023年第四季度及全年的财务报告,全年总营收高达1345.98亿元,同比增速达39%,归属百度的净利润(non-GAAP)为287亿元,同样实现了显著增长。在第四季度,百度的营收达到了349.51亿元,同比增长44%,净利润(non-GAAP)为77.55亿元。值得一提的是,百度全年营收和利润均超过了市场预期。站长网2024-02-28 17:53:300000