Meta 的 Llama 2 基础模型现已在亚马逊 SageMaker JumpStart 中提供
站长网2023-07-20 11:07:560阅
亚马逊公司宣布,Meta 开发的 Llama 2 基础模型可通过 Amazon SageMaker JumpStart 向客户提供。Llama 2 系列大型语言模型 (LLM) 是预先训练和微调的生成文本模型的集合,其规模从 70 亿到 700 亿个参数不等。

经过微调的 LLM,称为 Llama-2-chat,针对对话用例进行了优化。用户可以轻松尝试这些模型并将其与 SageMaker JumpStart 结合使用。
Amazon SageMaker JumpStart 是一个机器学习 (ML) 中心,提供预训练模型、内置算法和预构建解决方案,帮助用户快速开始使用 ML。只需在 SageMaker Studio 中单击几下即可部署和使用 Llama 2 基础模型,或者通过 SageMaker Python SDK 以编程方式部署和使用 Llama 2 基础模型。
Llama 2 是一个使用优化的 Transformer 架构的自回归语言模型。Llama 2 旨在用于商业和研究用途的使用。它有多种参数大小可供选择——70 亿、130 亿和 700 亿,以及预训练和微调变体。
根据 Meta 的说法,微调版本使用有监督的微调(SFT)和人类反馈的强化学习(RLHF)来对齐人类对有用性和安全性的偏好。Llama 2 的预训练数据来自公开可用的 2 兆 tokens 数据。微调模型旨在用于类似助手的聊天,而预训练模型可以适应各种自然语言生成任务。
无论开发人员使用哪个版本的模型,Meta 的负责任使用指南都可以帮助指导可能需要进行的额外微调,以定制和优化模型,并采取适当的安全措施。
此前微软的 Azure 云计算服务也提供了 Meta 新人工智能大语言模型 Llama 2 服务。
0000
评论列表
共(0)条相关推荐
1米糖葫芦硬控年轻人,半个月爆卖超15万单
“冰糖葫芦甜又甜,红红山楂圆又圆”,你听过这首童谣吗?你吃过糖葫芦吗?如今,插在草垛上的糖葫芦变成了大街小巷的拍照景观。许多年轻人,举着“1米糖葫芦”,分享着自己甜蜜的心情。一米糖葫芦最早在东北街头被发现,现在已经扩展到全国多个城市和景点,成为网红小吃。哈尔滨的中央大街、北京的南锣鼓巷、西安的钟鼓楼、济南的芙蓉街,以及上海、浙江等地也都能看到它的身影。0000李彦宏:未来50%的工作将是提示词工程
今日,百度创始人、董事长兼CEO李彦宏在2023中关村论坛上表示,大模型是人工智能新时代的核心,将改变人工智能和世界。李彦宏提到,大模型重新定义了人机交互,自然语言人机交互将带来提示词革命。大模型将重新定义营销和客服,并催生AI原生应用。百度将做第一个把全部产品重做一遍的公司。李彦宏还提到,人工智能技术可能出现对人类不利的方向,需要防止失控。站长网2023-05-26 14:10:070000安卓跑分诞生!iQOO Z9 Turbo 亮相:搭载天玑9300
iQOOZ9Turbo正式亮相,搭载联发科天玑9300移动平台,这是目前安卓阵营中顶尖的手机芯片。天玑9300采用全大核CPU架构,八核CPU包含4个Cortex-X4超大核,频率高达3.4GHz,以及4个频率为2.0GHz的Cortex-A720大核,为用户提供出色的性能体验。站长网2024-09-29 08:44:110000“东北雨姐”虚假宣传被罚165万元:红薯粉条样品未含红薯成分
近日,本溪县市场监督管理局对外宣布,针对本溪雨姐传媒有限公司(以下简称"雨姐传媒")在直播带货中涉嫌虚假宣传的问题,已完成调查并依法作出处罚决定。0000短剧变天:下架,毁约,拍摄延期观望
短剧行业似乎从来不缺话题热度,“市场规模300亿,接近电影全年票房”,“7天拍完,8天充值过亿”,“知名导演、正规军入局”,“《完蛋了我被美女包围了》游戏短剧模式爆火出圈”……各方玩家涌入,行业“暴富”故事不断上演。不少人调侃,在横店拍摄短剧的剧组,多到让“横店变竖店”(短剧多为竖屏播放)。不仅国内一片繁荣,短剧风口甚至吹到了海外,中式霸总出海,征服海外受众。0000