登陆注册
5745

Meta 的 Llama 2 基础模型现已在亚马逊 SageMaker JumpStart 中提供

站长网2023-07-20 11:07:560

亚马逊公司宣布,Meta 开发的 Llama 2 基础模型可通过 Amazon SageMaker JumpStart 向客户提供。Llama 2 系列大型语言模型 (LLM) 是预先训练和微调的生成文本模型的集合,其规模从 70 亿到 700 亿个参数不等。

经过微调的 LLM,称为 Llama-2-chat,针对对话用例进行了优化。用户可以轻松尝试这些模型并将其与 SageMaker JumpStart 结合使用。

Amazon SageMaker JumpStart 是一个机器学习 (ML) 中心,提供预训练模型、内置算法和预构建解决方案,帮助用户快速开始使用 ML。只需在 SageMaker Studio 中单击几下即可部署和使用 Llama 2 基础模型,或者通过 SageMaker Python SDK 以编程方式部署和使用 Llama 2 基础模型。

Llama 2 是一个使用优化的 Transformer 架构的自回归语言模型。Llama 2 旨在用于商业和研究用途的使用。它有多种参数大小可供选择——70 亿、130 亿和 700 亿,以及预训练和微调变体。

根据 Meta 的说法,微调版本使用有监督的微调(SFT)和人类反馈的强化学习(RLHF)来对齐人类对有用性和安全性的偏好。Llama 2 的预训练数据来自公开可用的 2 兆 tokens 数据。微调模型旨在用于类似助手的聊天,而预训练模型可以适应各种自然语言生成任务。

无论开发人员使用哪个版本的模型,Meta 的负责任使用指南都可以帮助指导可能需要进行的额外微调,以定制和优化模型,并采取适当的安全措施。

此前微软的 Azure 云计算服务也提供了 Meta 新人工智能大语言模型 Llama 2 服务。

0000
评论列表
共(0)条