GPT-4o mini实力霸榜,限时2个月微调不花钱,每天200万训练token免费薅
Llama3.1405B巨兽开源的同时,OpenAI又抢了一波风头。从现在起,每天200万训练token免费微调模型,截止到9月23日。
Llama3.1开源的同一天,OpenAI也open了一回。

GPT-4o mini可以免费微调了,每天畅用200万训练token,限时2个月(截止9月23日)。

收到邮件的开发者们激动地奔走相告,这么大的羊毛一定要赶快薅。

另一边,GPT-4o mini在大模型竞技场LMSYS排名也出来了。
总榜单中,GPT-4o mini与GPT-4o并列第一。

Altman本尊激动地表示,我从未对任何一次评估如此兴奋过,GPT-4o mini与GPT-4o性能如此接近,而价格仅有其1/20!

同时,他表示,GPT-4o mini的微调现在上线了。

OpenAI能把如此强大的模型,放出来让大家免费用,实在是出人意料。
网友一度以为,这可能是最高级的钓鱼邮件。

每天200万token,GPT-4o mini免费微调
邮件中,OpenAI宣布现正式推出GPT-4o mini微调功能,为的是让最新小模型在特定用例上,表现更加出色。
7月23日-9月23日期间,开发者们每天可以免费使用200万训练token。

超过的部分,将会按3美元百万token收费。
到了2个月免费使用截止后,微调训练也将按照3美元百万token收费。

此外,OpenAI在邮件中给出了,每个人值得从GPT-3.5Turbo切换到GPT-4o mini的原因:
- 更实惠:GPT-4o mini的输入Token费用比GPT-3.5Turbo低90%,输出Tokens费用低80%。即使在免费期结束后,GPT-4o mini的训练成本也比GPT-3.5Turbo低一半。

- 更长的上下文:GPT-4o mini的训练上下文长度为65k Token,是GPT-3.5Turbo的4倍,推理上下文长度为128k Token,是GPT-3.5Turbo的8倍。
- 更聪明且更有能力:GPT-4o mini比GPT-3.5Turbo更聪明,并且支持视觉功能(尽管目前微调仅限于文本)。

最后,邮件中还提到,GPT-4o mini微调功能将向企业客户,以及Tier4和Tier5开发者开放,未来将逐渐扩大访问权限,扩展至所有级别的用户。
想要动手操作的小伙伴们,OpenAI已经放出了微调指南,可参见:
https://platform.openai.com/docs/guides/fine-tuning/fine-tuning-examples

一部分网友对此并不看好,他们正在保存我们的数据,来训练和改进AI模型。

「又名,把你的私人数据给我,我会收你很少的钱」。

网友用例
拿到资格的网友,已经迫不及待上手测试了。
开发者使用《经济学人》风格的头条数据集,对gpt-4o mini进行了微调。


然后,他比较了gpt-4o、gpt-4o min原始模型和微调后的模型在生成头条方面的表现。

小模型霸榜,堪比GPT-4o
GPT-4o mini发布一周后,在大模型排行榜中的成绩终于出来了。
共收到了4K 用户投票,GPT-4o mini小模型直接攀升至榜首,与GPT-4o并列第一。
最最重要的是,便宜20倍!

这对于众多开发者来说,是个好消息,能够以更低的成本,搭建更强大的应用。

在数学细分领域中,GPT-4o mini的性能有所下降,排在第9。

此外,在hard prompt评测中,GPT-4o mini依旧保持了稳健的性能,实力仅次于GPT-4o、Claude3.5Sonnet。

在编码领域,GPT-4o mini同样展现出强大的能力。

关于GPT-4o mini在Arena中排名如此高的原因,很多人提出了疑问。

官方对此解释是:
- Chatbot Arena根据不同领域的人类偏好进行评估。鼓励大家不仅关注总排行榜,还要查看各个类别的排名(如数学、编码等)。
- Arena评估是实时进行的。鼓励大家在Arena中亲自对比模型,实时验证自己的假设。
- 透明性是我们的核心价值;所有代码和分析都是开源的(https://github.com/lm-sys/FastChat)。我们定期发布20%的数据,保留其余数据以避免过拟合,维护基准测试的完整性。
- 我们将根据政策发布随机的20% GPT-4o mini对战数据,大家可以亲自查看答案。
不过,另有网友认为,gpt-4o-mini的胜利是一个实质性的证据,证明了普通人并不那么聪明。
而且,这是历史上首次,AI变得足够聪明可以愚弄我们。有点疯狂,也有点具有历史意义。


参考资料:
https://x.com/moyix/status/1815840634013639086
https://x.com/HamelHusain/status/1815848198927434019
https://x.com/sama/status/1815877987696533897
https://x.com/0xSMW/status/1815869241205350641
小冰公司与网易云音乐推出AI歌手音乐创作软件“网易云音乐·X Studio”
6月15日,小冰公司与网易云音乐宣布达成战略合作,双方联合推出的AI歌手音乐创作软件“网易云音乐·XStudio”已正式上线,面向广大音乐人和音乐爱好者免费使用。网易云音乐·XStudio支持Windows与macOS双平台,搭载了丰富的前沿性人工智能小冰黑科技,并经过双方深度合作定制调校。软件首发12名AI歌手,并将不断推新,扩充AI歌手阵营。站长网2023-06-16 14:38:550001ChatGPT 网站流量增长开始趋于平缓:3 月至 4 月增长 12.6%
站长之家(ChinaZ.com)5月9日消息:ChatGPT访问流量的指数增长似乎正在减缓,尽管它获得的全球流量比bing.com,nytimes.com和cnn.com还要高——虽然它被视为一种搜索引擎,但它仅得到Google.com流量的2%。站长网2023-05-09 10:16:560000多位网红博主遭AI换脸起诉运营公司
近年来,“AI换脸”等深度合成技术快速发展,在服务用户需求、改进用户体验的同时,也被一些不法人员利用,生成恶搞视频、色情视频在网上传播、出售。企查查APP显示,近期,上海鱼腥草信息科技有限公司新增多份肖像权纠纷裁判文书。据悉,该公司系某款换脸手机APP运营公司,未经原告许可擅自使用其影像作品,并制作融脸视频模板,提供给付费会员使用。站长网2023-05-22 14:55:350000新款iPhone15Pro/Pro Max异常发热 苹果称软件Bug导致
昨日,数百名用户在社交媒体平台和苹果公司的支持部门投诉称,他们新买的iPhone15Pro和iPhone15ProMax摸起来异常发热。有些用户甚至发布了iPhone温度计的照片,显示温度远远超过100华氏度(约38摄氏度)。对此,苹果公司周六回应称,关于新款iPhone过热的说法是由软件错误导致的,他们正在尽快修复。站长网2023-10-01 21:51:100000华为: HarmonyOS NEXT 鸿蒙星河版第四季度商用
在今日的鸿蒙生态千帆启航仪式上,华为终端云总裁朱勇刚发表了重要演讲。他宣布,为了进一步推动鸿蒙生态的发展,华为将把“耀星计划”的激励金额提高至70亿人民币,以持续激励鸿蒙原生应用、元服务、SDK等生态创新。朱勇刚表示,鸿蒙生态已经进入了第二阶段,华为期望能够携手更多的开发者,共同加速千行百业的应用鸿蒙化。他提到,预计到今年年终,将有5000款应用完成原生鸿蒙开发,未来的目标是支持50万款应用。站长网2024-01-18 17:28:060000