Vicuna Makers打造小型AI模型Llama-rephraser,130亿参数、性能媲美GPT-4
**划重点:**
1. 🌐 Vicuna Makers的研究团队成功构建了一个只有130亿参数的小型语言模型(LLM),在性能上与OpenAI的GPT-4相媲美。
2. 🔄 利用新工具LLM Decontaminator,研究人员通过改写测试集,使得LLM能够在主要基准测试中达到GPT-4的性能水平。
3. 🌟 Llama-rephraser的研发不仅在性能上取得突破,而且通过挑战对语言模型中数据污染的理解,为业务提供了性能与成本平衡的可能性。
Vicuna Makers的研究团队在构建Vicuna语言模型的基础上,成功推出了一款新型的小型人工智能模型(LLM),该模型在性能上与OpenAI的GPT-4相媲美,仅包含130亿个参数。
这一新模型被命名为Llama-rephraser,由LMSYS Org揭示。尽管规模相对较小,但该模型在主要基准测试中达到了GPT-4的性能水平。这一成就的关键在于团队采用了一种独特的方法:通过改写测试集,即对测试样本进行释义,使模型能够进行泛化并实现高性能。
通过在数据集中改变句子,Llama-rephraser不仅帮助模型记住文本,更能理解其含义。通过用变化的短语提示模型,研究团队验证了模型是否真正理解了材料。结果表明,Llama-rephraser能够返回正确的响应。
这一创新性的方法让这个拥有130亿参数的Llama-rephraser在基准测试中取得了GPT-4级别的成绩,包括涵盖基本数学、计算机科学、法律等多个领域的流行MMLU基准测试,以及人工评估模型代码生成的HumanEval基准测试。
这一研究的最大成就之一是挑战了对语言模型中数据污染的理解。数据污染指的是测试集的信息泄漏到训练集中,可能导致对模型性能的过于乐观的估计,尤其是对于一个只有130亿参数的模型能够达到GPT-4的成果。
在构建Llama-rephraser的研究过程中,他们发现类似CodeAlpaca的GPT生成的合成数据可能导致微妙的污染,这是难以检测的。为了解决这个问题,他们引入了一个名为LLM Decontaminator的新工具,用于量化数据集的释义样本与基准的对比,使开发人员能够估计数据集中释义样本的污染程度,并将其删除。
对于企业而言,这意味着在采用人工智能解决方案时,有必要使模型规模更小,以保持运营成本的低廉。像Llama-rephraser这样性能媲美GPT-4的小型模型的出现,有助于企业在性能和成本之间取得平衡。此外,LLM Decontaminator这样的工具还可以帮助企业完善其现有系统,使当前一代模型得以改进,而无需在开发成本上投入大量资金构建全新的模型。
LMSYS Org在博客文章中呼吁社区重新思考在大型语言模型背景下的基准测试和数据污染,并在对大型语言模型进行公共基准测试时采用更强大的去污染工具。
5年大量投入研发!华为自研仓颉编程语言官网上线:首个公测版本开放下载
快科技10月30日消息,仓颉编程语言官网于今天10:08正式公开上线,同时首个公测版本开放下载。本次仓颉编程语言官网上线了首页、在线体验、文档、学习、下载、动态以及三方库共六个模块,可供开发和学习和体验。据悉,仓颉编程语言是在今年6月的华为开发者大会上正式公布,这是华为首次公开发布仓颉编程语言。仓颉编程语言项目于2019年在华为诞生,历经5年研发沉淀,大量研发投入,终于和全球开发者见面。0000360智脑通过国家大模型标准符合性测试
12月22日,在全国信息技术标准化技术委员会人工智能分委会全体会议上,国内首个官方“大模型标准符合性评测”结果公布,360集团与百度、腾讯、阿里四家率先通过评测。该测试由中国电子技术标准化研究院发起,旨在建立大模型标准符合性名录,引领人工智能产业健康有序发展。测评围绕多维度展开,涵盖语言、语音、视觉等多模态领域,是基于官方大模型测试基准的权威评测。0003雾怎样形成的?
站长网2023-05-24 19:55:370000IBM研究发现: AI语音克隆可劫持合法通话进行诈骗
**划重点:**1.🚨IBM研究发现,利用生成式AI工具,黑客可以相对轻松地劫持语音通话,构成新的威胁。2.💳对金融机构等使用电话验证身份的组织而言,使用低成本AI工具,骗子能够轻松冒充他人的声音,窃取资金和其他敏感信息。3.🛡️"音频劫持"是一种新的威胁,威胁行为者可在进行中的对话中使用语音克隆操纵大型语言模型。站长网2024-02-04 11:08:210000号称免费版桌面端Copilot!清华本科生团队打造的灵羽助手火了!
自从有了ChatGPT,大家似乎已经习惯什么问题都交给ChatGPT来解决。但这个复制、粘贴的过程还是难免让人感觉繁琐。而这款这款名叫灵羽助手(AIAnywhere)的桌面端智能助手,很好地解决了这个问题。据了解,灵羽助手由几位清华大学计算机系的本科生团队开发。它搭建在GPT-3.5上,用户无需复制粘贴,通过快捷键即可随时随地调用ChatGPT。站长网2023-07-25 17:18:2300010