微软推出微型AI自动编码模型phi-1,击败 GPT-3.5
微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型 phi-1,并且其性能优于 ChatGPT 背后的大型语言模型 GPT-3.5。
据了解, 这个基于 Transformer 的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。
微软的研究人员仅用了四天时间就使用 Nvidia 的8个 A100芯片来训练 phi-1。该模型使用来自网络的60亿个token以及使用 GPT-3.5生成的另外10亿个token进行训练。
在性能方面,phi-1在HumanEval基准测试中获得了50.6% 的 pass@1准确率。尽管模型小得多,但微软模型击败了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S (37.6% ) 。
在MBPP pass@1测试中,phi-1表现更好,取得了55.5% 的分数。上述许多模型尚未发布该基准测试的结果,但 WizardLM 的WizardCoder在本月早些时候进行的测试中得分为51.5%。WizardCoder 是一个150亿个参数模型,而 phi-1的参数模型为13亿个。

高质量数据带来差异
微软的研究人员认为,正是“高质量数据的力量”让 phi-1表现如此出色。为了说明这一点,研究人员将他们模型的论文命名为“教科书就是你所需要的”。
他们写道:“正如一本全面、精心制作的教科书可以为学生提供掌握新学科所需的知识一样,我们的工作展示了高质量数据在磨练语言模型在代码生成任务中的熟练程度方面的显着影响。” 。
“通过制作‘教科书质量’数据,我们能够训练出一个模型,尽管模型大小缩小了10倍,数据集大小缩小了100倍,但在编码基准(例如 HumanEval 和 MBPP)上,该模型超越了几乎所有开源模型。”
与其他可用的编码模型相比,Phi-1仅限于 Python 编码。他们表示,该模型的局限性还在于它缺乏大型模型的特定领域知识,例如使用特定 API 进行编程。
为了扩展他们的工作,微软的研究人员建议使用 GPT-4而不是 GPT-3.5来生成用于模型训练的合成数据。
研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法“在数据生成过程中注入随机性和创造力,同时仍然保持示例的质量和连贯性。”
百度百科App将下线 相关功能迁移至百度App“百度百科”小程序
近日,百度百科官方宣布,为进一步优化用户体验,其现有的App将于2024年6月30日正式下线,而相关功能将迁移至百度App中的“百度百科”小程序。随着App的下线,用户们将无需再下载或更新这款独立的App。相反,他们只需打开百度App,搜索“百度百科”小程序,即可享受同样丰富且更为全面的知识服务。站长网2024-04-23 15:53:530000看完苹果直播首秀,谁会哭,谁会笑
618的正式号角于5月31日晚上吹响,各个电商平台在复杂优惠规则、针锋相对的“百亿补贴”以及五花八门的重磅直播嘉宾之间博弈谁胜谁负,但在单个品牌方面,“不食人间烟火”的苹果显然在当晚刷够了存在感。站长网2023-06-03 13:06:090004专为Stable Diffusion 1.5设计!IP Composition Adapter模型可模仿图片构图
要点:1.IPCompositionAdapter是为StableDiffusion1.5设计的适配器,用于将图像的一般构图注入模型,大部分忽略风格和内容。2.SDXL变种正在开发中,用户可以在网站上关注更新。3.Controlnet更为刚性,构图适配器允许更灵活的控制。站长网2024-03-18 15:00:550000ofo创始人戴威在美国创业 开设About Time Coffee咖啡连锁店
据凤凰科技消息,ofo小黄车创始人戴威再次开始创业,这次选在美国。他开了一家名为AboutTimeCoffee的咖啡店,已经在纽约市中心的黄金地段开了四家连锁店,售卖冰镇珍珠咖啡。站长网2023-05-16 11:30:5300002024北京国际车展展位图公布:小米、智己“冤家聚头”
快科技4月20日消息,2024(第十八届)北京国际汽车展览会将于2024年4月25日-5月4日在中国国际展览中心顺义馆、朝阳馆举办,官方现已公布各品牌展位图。其中顺义馆为各大汽车品牌参展场馆,主要的展馆集中在E1-E4以及W1-W4之间,这八个馆将会是主要的展台。公众展示时间4月27日起-5月4日,4月25-26日为展会新闻日,专门接待到场参观采访报道的海内外新闻媒体记者。站长网2024-04-20 10:14:270000