微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了
Llama3发布刚几天,微软就出手截胡了?
刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。
其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama38B。
为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。
微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iPhone14pro和iPhone15使用的苹果A16芯片上跑到每秒12token。
这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。
在技术报告中还玩了一把花活,让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。
除了mini杯之外,小杯中杯也一并发布:
Phi-3-small,7B参数,为支持多语言换用了tiktoken分词器,并额外增加10%多语种数据。
Phi-3-medium,14B参数,在更多数据上训练,多数测试中已超越GPT-3.5和Mixtral8x7b MoE。
(大杯他们目前不打算做)
作者阵容一看也不简单,一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。
那么,Phi-3系列到底有什么独特之处呢?
根据技术报告中披露,其核心秘诀就在于数据。
去年团队就发现,单纯堆砌参数量并不是提升模型性能的唯一路径。
反而是精心设计训练数据,尤其是利用大语言模型本身去生成合成数据,配合严格过滤的高质量数据,反而能让中小模型的能力大幅跃升。
也就是训练阶段只接触教科书级别的高质量数据,Textbooks are all you need。
Phi-3也延续了这一思路,这次他们更是下了血本:
投喂了多达3.3万亿token的训练数据(medium中杯是4.8万亿)
大幅强化了数据的”教育水平”过滤
更多样化的合成数据,涵盖逻辑推理、知识问答等多种技能
独特的指令微调和RLHF训练,大幅提升对话和安全性
举个例子,比如某一天足球比赛的结果可能对于大模型是良好的训练数据,但微软团队删除了这些加强知识的数据,留下更多能提高模型推理能力的数据。
这样一来,对比Llama-2系列,就可以用更小的参数获得更高的MMLU测试分数了。
不过小模型毕竟是小模型,也不可避免存在一些弱点。
微软透露,模型本身参数中没能力存储太多事实和知识,这一点也可以从TriviaQA测试分数低看出来。
缓解办法就是联网接入搜索引擎增强。
总之,微软研究院团队是铁了心了要在小模型 数据工程这条路上走下去,未来还打算继续增强小模型的多语言能力、安全性等指标。
对于开源小模型超过ChatGPT这回事,不少网友都认为压力现在给到OpenAI这边,需要赶快推出GPT-3.5的继任者了。
参考链接:
[1]https://arxiv.org/abs/2404.14219
赵明回应荣耀和雅顾合作:单纯的联名没有价值
5月27日晚,备受瞩目的荣耀200系列手机在万众期待中正式登场。此次,荣耀不仅带来了全新的手机系列,更与巴黎雅顾摄影工作室携手,共同打造了一款名为“雅顾光影写真大师”的技术合作项目。发布会上,荣耀CEO赵明对外透露了此次合作的深层考量。当被问及为何选择与雅顾合作,并是否改变了之前不搞联名的立场时,赵明明确表示,荣耀始终坚持不为单纯的联名所动摇,因为单纯的联名对他们而言并无实质价值。站长网2024-05-28 17:06:290000AI日报:抖音测试AI购物小助手;GPT-4o再秀神操作惊呆网友;华为“天生会画”App发布;小米大模型通过备案
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。1、抖音试水AI电商测试AI购物小助手站长网2024-05-16 16:01:130001为数据而生,为隐私而战:隐私计算产业加速崛起
数字经济时代,数据作为新的生产要素和战略性资源,是科技进步、政策制定和经济发展的重要动力。但是,只有在隐私和安全得到保障的前提下,数据的价值才能最大化。站长网2023-05-15 14:12:570000OpenAI CEO:以色列将在降低技术风险方面发挥「巨大作用」
以色列在减少人工智能风险方面将发挥重要作用,即使该国正在就ChatGPT背后的技术是否以及如何进行监管展开辩论,这是OpenAI首席执行官SamAltman周一的预测。SamAltman是科技界最重要的声音之一,敦促政府迅速制定法规,确保人工智能的负责使用。站长网2023-06-06 16:24:470001三星Galaxy Z Flip5国内发布:定制第二代骁龙8 无缝铰链 售7499元起
凤凰网科技讯(作者/郑乾坤)8月3日消息,三星于今日举办GalaxyZFlip5和GalaxyZFold5系列国行发布会,全系采用定制第二代骁龙8,重新设计无缝铰链。GalaxyZFlip5的起售价为7499元;GalaxyZFold5起售价12999元。三星GalaxyZFlip5/ZFold5国内发布站长网2023-08-03 21:36:310000