微软推出微型AI自动编码模型phi-1,击败 GPT-3.5
微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型 phi-1,并且其性能优于 ChatGPT 背后的大型语言模型 GPT-3.5。
据了解, 这个基于 Transformer 的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。
微软的研究人员仅用了四天时间就使用 Nvidia 的8个 A100芯片来训练 phi-1。该模型使用来自网络的60亿个token以及使用 GPT-3.5生成的另外10亿个token进行训练。
在性能方面,phi-1在HumanEval基准测试中获得了50.6% 的 pass@1准确率。尽管模型小得多,但微软模型击败了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S (37.6% ) 。
在MBPP pass@1测试中,phi-1表现更好,取得了55.5% 的分数。上述许多模型尚未发布该基准测试的结果,但 WizardLM 的WizardCoder在本月早些时候进行的测试中得分为51.5%。WizardCoder 是一个150亿个参数模型,而 phi-1的参数模型为13亿个。
高质量数据带来差异
微软的研究人员认为,正是“高质量数据的力量”让 phi-1表现如此出色。为了说明这一点,研究人员将他们模型的论文命名为“教科书就是你所需要的”。
他们写道:“正如一本全面、精心制作的教科书可以为学生提供掌握新学科所需的知识一样,我们的工作展示了高质量数据在磨练语言模型在代码生成任务中的熟练程度方面的显着影响。” 。
“通过制作‘教科书质量’数据,我们能够训练出一个模型,尽管模型大小缩小了10倍,数据集大小缩小了100倍,但在编码基准(例如 HumanEval 和 MBPP)上,该模型超越了几乎所有开源模型。”
与其他可用的编码模型相比,Phi-1仅限于 Python 编码。他们表示,该模型的局限性还在于它缺乏大型模型的特定领域知识,例如使用特定 API 进行编程。
为了扩展他们的工作,微软的研究人员建议使用 GPT-4而不是 GPT-3.5来生成用于模型训练的合成数据。
研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法“在数据生成过程中注入随机性和创造力,同时仍然保持示例的质量和连贯性。”
ChatGPT让人形机器人实现了讲多国语言能力
最近,一款名为Ameca的人形机器人现在可以说多种语言,这得益于ChatGPT的支持。Ameca的开发商EngineeredArts发布了一段视频,展示了这款机器人说英语、日语、德语、中文和法语的能力。EngineeredArts使用了ChatGPT-3进行对话和翻译,使用DeepL进行语言识别,并使用AmazonPollyNeuralvoices实现其说话功能。站长网2023-04-13 14:33:190000o3并非独门秘技,谷歌已发背后关键机制,方法更简单、成本更低
o1/o3带火的推理计算Scaling,原来谷歌早在今年8月就曾探讨过。当时,来自斯坦福、牛津以及谷歌DeepMind的团队提出通过重复采样来扩展推理计算量——结果在编码任务中将性能最多提高40%。他们发现小模型通过生成多种答案/样本,其任务表现可能比一些大型模型单次尝试还要好。比如,DeepSeek-Coder通过重复采集5个样本,性能优于GPT-4o,而成本却仅为后者的三分之一。000080%代码秒生成!AI神器Copilot大升级,百万开发者动嘴编码5年内成真
【新智元导读】AI编码神器Copilot模型升级,5年80%的代码自动生成,百万码农提速55%。码农AI神器又升级了!就在刚刚,Github官宣,Copilot模型升级,5年内80%的代码将自动生成。GitHubCopilot发布还不到两年,就已经为100多万的开发者,编写了46%的代码,并提高了55%的编码速度。这次升级究竟改进了什么呢?5年,80%代码自动生成站长网2023-07-31 09:12:220000谷歌斥资20亿美元战略投资AI初创公司Anthropic
划重点:1.谷歌宣布向Anthropic投资20亿美元,进一步巩固其在快速发展的人工智能领域的地位,引发行业动态深刻转变。2.谷歌的投资不仅仅是财务支持,还是战略合作,旨在加速Anthropic的人工智能创新,同时巩固GoogleCloud在尖端AI研究和部署的地位。3.亚马逊也对Anthropic进行重大投资,进一步证明其潜力,并将其置于高风险的技术竞争中。站长网2023-10-30 10:09:060000高薇:互联网时代的公共承运人规制
本文发表于《政法论坛》2016年第4期,第83-95页。文章下载链接:互联网时代的公共承运人规制高薇法学博士北京大学法学院副教授站长网2023-05-24 00:52:220001