最先进的开源预训练大语言模型Lemur 平衡文本和代码功能
文章要点:
Lemur是首个在文本和代码任务上都表现卓越的开源预训练语言模型。
Lemur通过在大规模代码集上预训练,在文本理解和知识任务上保持竞争力的同时,在编程基准测试上超过其他模型。
Lemur填补了语言模型中文本和代码能力之间的空白,推动了开源LLM的发展。
随着语言和技术交叉的日益增多,对多功能和强大语言模型的需求也越来越大。传统的大型语言模型(LLMs)在文本理解或编码任务方面表现出色,但很少能够在两者之间达到平衡。这种不平衡为模型在文本推理和编码能力之间无法无缝切换留下了一定的空间。因此,Lemur和Lemur-chat应运而生,这两个开放预训练和监督微调LLMs的开创性贡献旨在弥合这一差距。
创建既能够熟练处理文本又能够处理代码的语言模型一直是一个长期存在的挑战。现有的LLMs通常专门用于文本理解或编码任务,但很少同时具备两者。这种专业化使得开发人员和研究人员需要在在两者之间进行选择。因此,需要一种LLMs,它能够提供全面的技能集,包括理解、推理、规划、编码和上下文基础。
项目地址:https://github.com/OpenLemur/Lemur
Lemur项目是由XLang Lab与Salesforce Research合作推出的,旨在解决语言模型技术中的关键差距。Lemur和Lemur-chat代表了一项开创性的努力,旨在开发开放的、预训练的和监督微调LLMs,其在文本和代码相关任务方面表现出色。这项工作的基石是对Llama2进行广泛的预训练,涉及约1000亿行代码密集型数据的大量语料库。这个预训练阶段之后是在约30万个公共教学和对话数据实例上进行的监督微调。结果是一个语言模型,具有增强的编码和基础能力,同时保持着竞争性的文本推理和知识性能。
Lemur和Lemur-chat的性能指标证明了它们的实力。Lemur在编码基准测试中超过了其他开源语言模型,证明了它的编码能力。同时,它在文本推理和知识性能方面保持了竞争优势,展示了它的多功能技能集。与此同时,Lemur-chat在各个方面显著优于其他开源监督微调模型,表明它在桥接对话环境中文本和代码之间的差距方面具有出色的能力。
Lemur项目是XLang Lab和Salesforce Research的协作研究成果,得到了Salesforce Research、Google Research和Amazon AWS的慷慨赠礼的支持。虽然朝着一个平衡的开源语言模型的旅程仍在持续,但Lemur的贡献已经开始重塑语言模型技术的格局。通过提供在文本和代码相关任务方面表现出色的模型,Lemur为寻求在语言和技术交叉领域中导航的开发人员、研究人员和组织提供了一个强大的工具。
总之,Lemur项目是语言模型领域创新的标志。它能够和谐地平衡文本和代码相关任务,解决了该领域长期存在的挑战。随着Lemur的不断发展和设立新的基准,它将推动代理模型的进一步研究,并为开源语言模型建立更强大和平衡的基础。有了Lemur,语言模型技术的未来将比以往任何时候都更加光明和多功能。
微软奔向20万亿帝国
ChatGPT的爆火,让背后的公司OpenAI走到台前,作为OpenAI的大股东,微软也再次回到舞台中央。7月25日,微软公布了2023财年第四季度财报。然而,这份号称微软“史上最重要的财报”,却表现平平,不仅AI对收入的贡献几乎没有体现,PC、云业务增长依然乏力,与全线飘红的“死对头”谷歌相比,逊色不少。站长网2023-07-27 10:35:290000腾讯混元发布开源文生图大模型混元DiT加速库 生图时间缩短75%
腾讯混元发布了针对开源文生图大模型混元DiT的加速库,可将推理时间缩短75%,生图时间大幅缩短。混元DiT模型也已部署至HuggingFaceDiffusers通用模型库,用户可通过三行代码调用模型,无需下载原始代码。通过知识蒸馏和TensorRT高性能推理框架,实现了DiT模型的采样步数压缩与高效推理部署,推理时间缩短75%。站长网2024-06-06 20:58:090000Gemini将更好地理解手机屏幕上的内容 包括网页、文件、视频
划重点:-Google将更新Android上的Gemini,使其AI能更好了解屏幕上的内容。-通过GeminiAdvanced订阅,用户可以使用Gemini来理解PDF文件,并在特定题上获得专家建议。-可以摘要或回答关于网页和屏幕截图的问题。-Gemini将能够识别屏幕上的视频,并根据视频的自动字幕回答用户的问题。站长网2024-05-15 11:59:160000MIT惊人再证大语言模型是世界模型!LLM能分清真理和谎言,还能被人类洗脑
【新智元导读】MIT等学者的「世界模型」第二弹来了!这次,他们证明了LLM能够分清真话和假话,而通过「脑神经手术」,人类甚至还能给LLM打上思想钢印,改变它的信念。大语言模型是世界模型,又添新证据!前不久,MIT和东北大学的两位学者发现,在大语言模型内部有一个世界模型,能够理解空间和时间。最近他们又有了新发现,LLM还可以区分语句的真假!站长网2023-10-20 18:19:070001谷歌、亚马逊、英伟达等科技巨头投资 Hugging Face 使其估值进一步攀升至 45 亿美元
站长之家(ChinaZ.com)8月25日消息:总部位于纽约的人工智能公司HuggingFace已从一些科技巨头公司筹集了2.35亿美元,使其估值攀升至45亿美元。站长网2023-08-26 16:14:310000