Meta开源最新模型——Llama Guard-7b
全球社交、科技巨头Meta在官网开源了全新模型——Llama Guard。
据悉,Llama Guard是一个基于Llama2-7b的输入、输出保护模型,可对人机会话过程中的提问和回复进行分类,以判断其是否存在风险。可与Llama2等模型一起使用,极大提升其安全性。
Llama Guard也是Meta推出的“Purple Llama”安全评估项目中,输入、输出保障环节的重要组成部分,这也是首个在输入输出防护中区分用户与AI风险的模型。
Llama Guard地址:https://huggingface.co/meta-llama/LlamaGuard-7b
Purple Llama地址:https://github.com/facebookresearch/PurpleLlama
论文地址:https://ai.meta.com/research/publications/llama-guard-llm-based-input-output-safeguard-for-human-ai-conversations/
Llama Guard简单介绍
研究人员设计了一个包含法律和政策风险的安全风险分类体系。分类体系包含6大类可能的安全风险:暴力与仇恨、色情内容、非法武器、犯罪计划等。
此外还详细说明了每个风险类别中的易犯错误。
通过使用Anthropic提供的人机对话数据集,对数据进行标记。标记内容包括对话提问与回应中的风险类别及是否存在安全隐患。最终收集了近14000条标注好的对话样本。
再以Llama2-7b作为基础模型,采用指令式学习框架进行训练。此框架将分类任务表述为一个接一个的指令任务。
使Llama Guard根据输入指令和数据学习进行多类分类。研究人员为用户提问和机器回复分别编写指令,实现对其语义结构的区分。
还采取数据增强方法,强化模型只考虑给定输入中的分类信息。
测试数据
首先在内部测试集上进行验证,Llama Guard在整体和每个单独分类上的表现都超过了其他内容监管工具。
然后,研究人员采用零样本和少量实例学习的方法,将Llama Guard迁移到其他公开测试集上进行验证。
测试结果显示,在ToxicChat数据集上,Llama Guar的平均准确率高于所有基线方法;在OpenAI评估数据集上,Llama Guard在零样本的情况下与OpenAI内容监管API表现相当。
此外,Llama Guard使用了指令调优,可以适配不同的AI分类法或政策。用户可以通过零样本或小样本的方式便可实现指令迁移,以适配不同的应用场景需求。
荣耀首款保时捷设计折叠屏预计明年 1 月发布 全球限量911台
近日,荣耀宣布与保时捷设计合作,共同打造下一代高端智能手机。据数码博主“厂长是关同学”透露,荣耀首款保时捷设计折叠屏预计在明年1月发布,产品内部代号为“荣耀911”,且全球限量发售911台。荣耀首款保时捷设计折叠屏的发布预计将引发新一轮抢购热潮。由于限量发售的属性,预计二手平台的价格会比产品本身高出数倍,成为2024开年首款“理财产品”。0000DB-GPT:使用专有LLM技术改变与数据库互操作的方式
划重点:-DB-GPT是一个实验性的开源项目,利用本地化的大型GPT模型,用于处理数据库相关的各种情境。-该工具强调了隐私和数据安全,可通过业务模块进行定制化实施和分割,确保LLM功能的完全机密性、安全性和可管理性。-DB-GPT支持处理结构化和非结构化数据,数据可从多个来源进行整合和可视化,同时具备多个数据可视化工具,支持多种大型语言模型。站长网2023-11-06 15:22:550000治理电视套娃收费阶段成效公布 电视收费包实现压减50%
在近日召开的电视套娃收费和操作复杂工作阶段性总结部署推进会上,国家广播电视总局联合多部门通报了治理电视套娃收费和操作复杂的第一阶段工作进展和成效。经过四个多月的合力推进,第一阶段工作取得了显著成果。全国实现开机看直播的有线电视用户达到9249.5万,IPTV用户达到1.92亿,基本覆盖了具备升级条件的终端。这标志着开机看直播的目标已经基本实现。站长网2024-01-23 17:35:450001雷军回应网友催更小米14:别着急 这次产品很很很强
高通即将在10月25日至26日举行2023年的骁龙峰会,届时将正式推出全新的移动平台骁龙8Gen3。按照以往的惯例,小米14很有可能成为这款新平台的首发机型。甚至有消息称,小米会在高通的发布会上之前就开始预热。网友们也纷纷在雷军的微博上留言,催促小米14的发布。对此,雷军今天在微博上做出了回应,表示大家不要着急,这次的新产品非常强大。这是雷军首次针对小米14的发布表态,给人留下了深刻的印象。站长网2023-10-16 15:05:210000环球音乐集团与周杰伦及杰威尔音乐达成全球战略合作伙伴关系
12月6日,环球音乐宣布,与周杰伦及其经纪公司杰威尔音乐(JVRMusic)达成战略合作伙伴关系。这一合约确立环球音乐集团将获得周杰伦经典曲库及未来新发行作品的全球发行权利,同时还包括两位杰威尔音乐旗下的潜力新人派伟俊和曹杨的加盟。此番与环球音乐大中华区全新战略合作伙伴关系的达成,进一步巩固了环球音乐集团作为周杰伦及杰威尔全领域战略级合作伙伴的地位。站长网2023-12-06 10:00:500000