微软开源最强小参数大模型—Phi-3 Mini
4月23日晚,微软在官网开源了小参数的大语言模型——Phi-3-mini。
据悉,Phi-3-mini是微软Phi家族的第4代,有预训练和指令微调多种模型,参数只有38亿训练数据却高达3.3T tokens,比很多数百亿参数的模型训练数据都要多,这也是其性能超强的主要原因之一。
Phi-3-mini对内存的占用极少,可以在 iPhone14等同类手机中部署使用该模型。尽管受到移动硬件设备的限制,但每秒仍能生成12个tokens数据。
值得一提的是,微软在预训练Phi-3-mini时使用了合成数据,能帮助大模型更好地理解语言架构、表达方式、文本语义理解、逻辑推理以及特定业务场景的专业术语等。
开源地址:https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3
Ollama地址:https://ollama.com/library/phi3
技术报告:https://arxiv.org/abs/2404.14219
2023年6月,微软首次推出了专用于Python编码的模型Phi-1,只有13亿参数却在编程领域击败了GPT-3.5等知名模型,这让微软看到小参数模型的广阔发展空间。
随后在Phi-1基础之上,微软推出了具备推理、文本生成、内容总结、起草邮件的大语言模型Phi-1.5,成为当时最强小参数模型之一。
2023年12月,微软在Phi-1.5基础之上开发了Phi-2,参数只有27亿并且在没有人类反馈强化学习和指令微调的情况下,击败了130亿参数的Llama-2和70亿参数的Mistral;在编码和数学测试中,Phi-2的性能甚至超过了700亿参数的Llama-2。
本次发布的Phi-3系列集合了之前三代所有的优秀技术特征,并使用了海量高质量数据集、创新的训练、微调方法,使其成为目前最强的开源小参数模型。
Phi-3-mini架构简单介绍
Phi-3-mini采用了transformer架构,支持4K和128K上下文窗口,也是同类小模型中第一个支持128K的开源产品。
高质量训练数据集是Phi-3-mini性能超强的重要原因之一,微软使用了3.3T tokens数据集包括:经过严格质量筛选的网络公开文档、精选的高质量教育数据和编程代码;
通过合成数据创建的教科书式数据,例如,数学、编码、常识推理、世界常识、心理科学等;
高质量聊天格式的监督数据,涵盖各种主题以反映人类在不同方面的偏好,例如,遵循指令、真实性、诚实性等。
在训练策略方面,为了帮助Phi-3-mini更好地吸收合成数据,微软使用了迭代训练策略:初始阶段,Phi-3-mini使用了公开网络数据,学会了基本的语法、语义和上下文理解;
迭代阶段,将合成数据与网络数据合并构建全新的训练集,并对Phi-3-mini进行迭代训练,进一步强化模型的理解和生成能力,并且进行多次重复训练。
测试数据方面,Phi-3Mini在MMLU、GSM-8K、MedQA、BigBench-Hard等知名基准测试平台中,对语言理解、逻辑推理、机器翻译、编码等进行了综合测试。
结果显示,Phi-3-mini仅通过少量样本提示,在语言理解、编码、数学的性能超过了参数更大的模型,整体性能非常出色。
微软表示,在未来几周内还会发布70亿参数的Phi-3-small和140亿参数的Phi-3-medium两款小模型。其中,Phi-3-medium的性能可媲美Mixtral8x7B 和GPT-3.5,资源消耗却更少。
谷歌突失Hinton!深度学习之父警告AI风险,对毕生工作表示遗憾
BreakingNews!深度学习三巨头、神经网络之父GeoffreyHinton已离职谷歌,结束十载生涯。最新推文中透露了原因:为了自由地讨论人工智能的风险。消息一出,整个科技圈炸了,人们震惊于AI已经让Hinton感到害怕了。有网友直接懵住:到底发生了什么?还是我漏掉了什么?你不是曾说过GPT-4为人类的蝴蝶吗?站长网2023-05-02 10:18:460001马斯克承认用X数据训练AI:微软别想用,但我自己能用
马斯克终于忍不住,开始用X的数据喂AI了!这两天,大伙儿发现X悄悄更新了一版隐私政策,里面表示会使用社交媒体数据来训练机器学习或AI模型。要知道,马斯克前不久还威胁微软,要起诉它用X的数据训练AI。就在网友们纷纷艾特马斯克“要个说法”时,他却直接承认了:只会用公开信息(训练),不会用私信和任何私人数据。此处有网友表示惊讶:你不是反对AI的吗?但还是有网友选择给马斯克打掩护:站长网2023-09-04 09:16:260000索尼同意与微软签订为期 10 年的《使命召唤》协议
据theverge报道,索尼同意与微软签订为期10年的《使命召唤》协议,保证该系列游戏将继续留在PlayStation上。这意味着微软和索尼之间的《使命召唤》争夺战结束了。站长网2023-07-18 16:35:030000评论区广告上线,视频号“起风”了
3月3日,视频号小任务在分成政策、任务筛选和运营服务方面提效升级,官方透露创作者参与所有小任务将增加40%收益;3月28日,在2023微信公开课PRO上,官方透露了一组数据:过去一年,视频号万粉作者数量增长4倍,日活创作者数与日均视频上传量同比翻倍,用户消费时长增长了3倍;4月6日,视频号发布全新创作分成计划。符合一定条件的视频号优质原创作者,可在原创视频评论区通过展示广告内容,获取广告收入。站长网2023-04-12 13:44:450001花400块钱,做烟盒回收,多久回本?
各位村民好,我是村长。烟盒也可以回收,做得好,一个月随便挣个三五万都不是我问题。这是最近一部分人,在抖音等渠道刷到的内容。我看过几个类似的烟盒回收直播间,许多人拼命的在评论区互动咨询,似乎终于找到了一个稳定靠谱又轻松的发财生意了。村长之前也写过卖烟头赚钱的生意,那么今天我们再和大家聊聊,关于烟盒回收的项目到底靠不靠谱。6万元/吨,烟头回收真的能赚钱吗?01真的有人回收烟盒吗?站长网2023-06-13 23:54:040000