微软推出微型AI自动编码模型phi-1,击败 GPT-3.5
微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型 phi-1,并且其性能优于 ChatGPT 背后的大型语言模型 GPT-3.5。
据了解, 这个基于 Transformer 的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。
微软的研究人员仅用了四天时间就使用 Nvidia 的8个 A100芯片来训练 phi-1。该模型使用来自网络的60亿个token以及使用 GPT-3.5生成的另外10亿个token进行训练。
在性能方面,phi-1在HumanEval基准测试中获得了50.6% 的 pass@1准确率。尽管模型小得多,但微软模型击败了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S (37.6% ) 。
在MBPP pass@1测试中,phi-1表现更好,取得了55.5% 的分数。上述许多模型尚未发布该基准测试的结果,但 WizardLM 的WizardCoder在本月早些时候进行的测试中得分为51.5%。WizardCoder 是一个150亿个参数模型,而 phi-1的参数模型为13亿个。
高质量数据带来差异
微软的研究人员认为,正是“高质量数据的力量”让 phi-1表现如此出色。为了说明这一点,研究人员将他们模型的论文命名为“教科书就是你所需要的”。
他们写道:“正如一本全面、精心制作的教科书可以为学生提供掌握新学科所需的知识一样,我们的工作展示了高质量数据在磨练语言模型在代码生成任务中的熟练程度方面的显着影响。” 。
“通过制作‘教科书质量’数据,我们能够训练出一个模型,尽管模型大小缩小了10倍,数据集大小缩小了100倍,但在编码基准(例如 HumanEval 和 MBPP)上,该模型超越了几乎所有开源模型。”
与其他可用的编码模型相比,Phi-1仅限于 Python 编码。他们表示,该模型的局限性还在于它缺乏大型模型的特定领域知识,例如使用特定 API 进行编程。
为了扩展他们的工作,微软的研究人员建议使用 GPT-4而不是 GPT-3.5来生成用于模型训练的合成数据。
研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法“在数据生成过程中注入随机性和创造力,同时仍然保持示例的质量和连贯性。”
尽管艺术家明确拒绝,作品仍被用于训练开源人工智能模型
本文要点:1.艺术家GregRutkowski明确表示不希望他的作品出现在人工智能中,但仍有一个基于他的作品的AI图像生成器出现。2.AI生成器开发者表示愿意删除该模型,但无法阻止未来类似的开源机器人的创建。3.艺术家认为人工智能可能威胁到整个行业,使人类艺术家面临被淘汰的风险。站长网2023-08-04 15:18:210000由于人工智能和自动化,英国电信将裁员多达 55000 人
英国电信集团是世界上最大的电信公司之一,它表示到本十年末将裁员多达55,000人,占其员工总数的42%,这在很大程度上是人工智能和自动化影响的。站长网2023-05-22 15:52:470000IBM在印度甘地讷格尔开设新的客户创新中心 聚焦生成式AI
划重点:1.🚀IBM宣布在印度甘地讷格尔开设新的IBM咨询客户创新中心,标志着该公司在印度非大都市和新兴城市的持续扩张。2.💡该中心将聚焦生成式AI、混合云和网络安全等关键技术领域,加速数字转型并促进该地区的经济增长。3.👥甘地讷格尔的扩展将为现有员工提供机会,同时帮助IBM吸纳该地教育生态系统中的潜在人才,包括毕业生。站长网2023-11-24 16:50:280000iPhone手机进水如何处理官方回应来了!不推荐放入米袋和使用吹风机
快科技2月15日消息,使用iPhone手机的用户日常生活中或许会遇到手机进水的情况,那么当你的iPhone手机进水了该如何处理呢?或许有些人会把手机放进米袋里,以此来吸取水分;再者还有人用吹风机对着进水的部位用热风吹,认为能把水分吹干。对此种情况,苹果官方上月已更新了支持文档,明确表示不推荐这种做法。苹果公布的《如果iPhone上出现液体检测提醒》支持文档的注意事项中提到:站长网2024-02-16 09:32:340000谷歌 I/O 公布的人工智能布局让两位创始人财富飙升
Alphabet公司的联合创始人拉里·佩奇和谢尔盖·布林因旗下谷歌公司的人工智能热潮而财富大幅增长。上周,谷歌在年度开发者大会GoogleI/O上推出了重新设计的搜索引擎,该搜索引擎将AI聊天机器人的响应集成到搜索结果中,并使其聊天机器人更广泛地可用。站长网2023-05-15 11:54:210000