Meta开源最新模型——Llama Guard-7b

站长网2023-12-12 09:24:492阅

全球社交、科技巨头Meta在官网开源了全新模型——Llama Guard。

据悉，Llama Guard是一个基于Llama2-7b的输入、输出保护模型，可对人机会话过程中的提问和回复进行分类，以判断其是否存在风险。可与Llama2等模型一起使用，极大提升其安全性。

Llama Guard也是Meta推出的“Purple Llama”安全评估项目中，输入、输出保障环节的重要组成部分，这也是首个在输入输出防护中区分用户与AI风险的模型。

Llama Guard地址:https://huggingface.co/meta-llama/LlamaGuard-7b

Purple Llama地址:https://github.com/facebookresearch/PurpleLlama

论文地址:https://ai.meta.com/research/publications/llama-guard-llm-based-input-output-safeguard-for-human-ai-conversations/

Llama Guard简单介绍

研究人员设计了一个包含法律和政策风险的安全风险分类体系。分类体系包含6大类可能的安全风险:暴力与仇恨、色情内容、非法武器、犯罪计划等。

此外还详细说明了每个风险类别中的易犯错误。

通过使用Anthropic提供的人机对话数据集，对数据进行标记。标记内容包括对话提问与回应中的风险类别及是否存在安全隐患。最终收集了近14000条标注好的对话样本。

再以Llama2-7b作为基础模型，采用指令式学习框架进行训练。此框架将分类任务表述为一个接一个的指令任务。

使Llama Guard根据输入指令和数据学习进行多类分类。研究人员为用户提问和机器回复分别编写指令，实现对其语义结构的区分。

还采取数据增强方法，强化模型只考虑给定输入中的分类信息。

测试数据

首先在内部测试集上进行验证，Llama Guard在整体和每个单独分类上的表现都超过了其他内容监管工具。

然后，研究人员采用零样本和少量实例学习的方法，将Llama Guard迁移到其他公开测试集上进行验证。

测试结果显示，在ToxicChat数据集上，Llama Guar的平均准确率高于所有基线方法;在OpenAI评估数据集上，Llama Guard在零样本的情况下与OpenAI内容监管API表现相当。

此外，Llama Guard使用了指令调优，可以适配不同的AI分类法或政策。用户可以通过零样本或小样本的方式便可实现指令迁移，以适配不同的应用场景需求。

Meta开源最新模型LlamaGuard7b

0002

评论列表

共(0)条

相关推荐

百度2023年Q3营收344亿元、净利润大涨增23% 均超预期
快科技11月21日消息，百度今天发布了2023年第三季度财报。报告显示，百度第三季度营收达344.47亿元，同比增长6%；净利润（non-GAAP）达73亿元，同比增长23%，营收、利润均超市场预期。财报显示，本季度内百度核心（搜索服务与交易服务的组合）收入266亿元，净利润（non-GAAP）达70亿元，同比增长21%。
站长网站长资讯2023-11-21 20:18:11
0000
2024年，文娱“搞钱”六大方向
最近几年一直低迷的文娱行业，从去年开始有了一些回暖迹象。先上数据。根据QuestMobile，去年，文娱消费各方面都有不同程度地增长。
站长网站长资讯2024-03-18 10:40:21
0000
站长资讯
声音类 AI 产品的创业探索
机器与人类交互的最直接方式无非就三种，视觉、触觉和听觉。大语言模型满足了视觉上对文字的交互，而听觉就需要语音模型来补齐了。1找到AI新赛道随着大语言模型的技术日趋成熟，寻找新的增长点，探索未完全开发的AI市场成为了一个必然的趋势。其中，人类与机器之间的交互无疑是一个重要的方向。图1目前部分国产大语言模型列表机器与人类交互的最直接方式无非就三种，视觉、触觉和听觉。
站长网2023-07-31 11:24:23
0001
站长资讯
清华大学团队推出RTFS-Net:革新视听语音分离，百万参数实现高效性能
**划重点:**1.🎙️RTFS-Net是首个采用少于100万个参数的视听语音分离方法，通过压缩-重建策略显著减少计算复杂度。2.🌐针对传统视听语音分离方法的问题，RTFS-Net创新性地解决了时域和时频域方法的挑战，提高了在复杂环境中的性能。3.🚀在三个基准多模态语音分离数据集上，RTFS-Net在大幅降低模型参数和计算复杂度的同时，接近或超越了当前最先进的性能。
站长网2024-03-06 17:46:32
0002
站长资讯
Meta 推出雷朋智能眼镜的多模态 AI 功能测试：可识别物体并翻译语言
站长之家(ChinaZ.com)12月13日消息:Meta宣布将开始推出其多模态AI功能的早期访问测试，这些功能将应用于MetaRay-Ban（雷朋）智能眼镜，能够通过眼镜的摄像头和麦克风告知用户所看和所听的内容。马克·扎克伯格在Instagram的一个视频中展示了这次更新，他询问眼镜建议哪种裤子与他手里拿着的衬衫相配。
站长网2023-12-13 09:37:48
0000