首页站长资讯GPT-4o成全球网友新玩具，秒秒钟纸质原型转录初始HTML，网友：谷歌你是一点流量摊不上啊

GPT-4o成全球网友新玩具，秒秒钟纸质原型转录初始HTML，网友：谷歌你是一点流量摊不上啊

站长网2024-05-16 14:02:571阅

好啊，不愧是OpenAI最新旗舰，打开各个社交软件，GPT-4o的上手测试都唰唰唰往我首页推。

请!看!

这，就是用上GPT-4o，花不到30s时间，通过单个prompt把一个电子表格中的内容生成了完整的图表和统计分析。

在过去，在Excel里做这玩意儿，不得花咱打工人好一阵子时间?

而下面这张图，是网友花了不到20s，用GPT-4o创建出的一张四腿桌子的3D模型的STL文件。

牛哇牛哇!

毕竟GPT-4o能力横跨听、说、看，主要是，它还免费啊!

就跟网友总结的一样，现在，每个用户都可以通过AI和简单的Prompt来生成非常了不起的东西。

不过，关于“如何生成复杂结构的东西”，还需要再摸索摸索。

一起来看，网友们都在怎么忘我地狂玩儿GPT-4o吧——

狂玩GPT-4o

在一年一度的谷歌 I/O 开发者大会前24小时，OpenAI突袭发布了GPT-4o。

“o”是Omni的缩写，意为“全能”。

敢起这么个名字，是因为GPT-4o接受文字、音频、图像的任意组合作为输入，并生成文字、音频、图像输出。

在5月14日的OpenAI官方演示中，用起来非常丝滑，甚至响应音频输入的速度赶上了人类。

抱着“我不信除非我试试”的态度，网友已经玩疯了。

爱因斯坦谜题

先声明，这个所谓的“爱因斯坦谜题”，很像咱小时候做的奥数题，是用来测试大模型逻辑能力的。

题目背景是这样的:

在一条街上，有五座房子，喷了五种颜色。每座房子里住着不同国籍的人。每个人喝不同的饮料，抽不同品牌的香烟，养不同的宠物。

提示:

（1）英国人住红色房子。

（2）瑞典人养狗。

（3）丹麦人喝茶。

（4）绿色房子在白色房子左面隔壁。

（5）绿色房子主人喝咖啡。

（6）抽Pall Mall香烟的人养鸟。

（7）黄色房子主人抽Dun Hill香烟。

（8）住在中间房子的人喝牛奶。

（9）挪威人住第一间房。

（10）抽 Blends香烟的人住在养猫的人隔壁。

（11）养马的人住抽Dun Hill香烟的人隔壁。

（12）抽 Blue Master的人喝啤酒。

（13）德国人抽 Prince香烟。

（14）挪威人住蓝色房子隔壁。

（15）抽 Blends香烟的人有一个喝水的邻居。

问题来了，谁养鱼?谁住蓝色房子?

前几天，网友在lmsys测试i-am-gpt2-bot（就是在大模型竞技场大杀特杀的神秘GPT-2）时，还没办法解答爱因斯坦谜题——而且也没有任何其他AI可以搞定这个问题。

但上手一试，GPT-4o光速回答对了。

大家可以自己动手测一下（手动狗头）。

自动选股器

前脚刚看到OpenAI说了，GPT不能用来选股，没有啥参考意义。

后脚就有网友在推特上发布了实现的GPT-4o自动选股器，并配文:强得可怕!

具体来说，他用GPT-4o实现了将两百多行选股指标自动改写成自动选股器、输出图表和数据归档。

图片来自推特博主：JerLin

而且只需1轮交互就能完成较为满意的效果，效率暴打GPT-4（哦?我揍前代我自己）

据他说，用GPT-4搞这玩意，需要反反复复修改，而且处理100行以上的代码非常低效。

对此，网友的评价非常精辟:

如果能100%预测那真的是完美!但如果预测不对那不如别预测……

纸质原型转录初始HTML

也有网友尝试利用GPT-4o，把写在纸上的原型转录为电脑内的初始HTML。

他白纸黑字是这么写的:

然后把这张图喂给了GPT-4o。

然后GPT-4o说:

然后就得到了:

网友本人对吐出的这个结果非常满意，他激动地在推特写下:

就像我们正在进行一场超越世界的对话，这真是Soooooo Cool～

不止他一个，另外有网友在Hacker News上表示，自己也能用GPT各个版本将原始动态数据动态转换为漂亮的HTML布局。

这样来制作低流量页面，如更改/审核日志，能节省大量的开发时间，还能在数据结构发生变化时保持HTML更新。

不过尝试并不是回回奏效，因为GPT-4-Turbo有时几乎完全忽略了上下文和说明。

OCR

不过，有网友表示对GPT-4o的OCR能力也有点牛气在身上的

事情是这样的，他扔给了GPT-4o一张这个图。

怎么说呢，确实密密麻麻，公司Logo又有图像又有文字，人类肉眼看都有点吃力。

GPT-4o的结果把测试者本人惊到了，他说:“它不断吐出连人类都难以识别的图中的内容。”

围观网友纷纷跟帖留言，不外乎是“将来，使用它的人和不使用它的人之间的工作似乎会有很大的区别”“如果您跟不上先进技术，您就会落后”之类的话。

拳打Google，但被马斯克脚踢?

OpenAI出手再次惊艳世界，谷歌果然坐不住了。

在今日凌晨的发布会上，谷歌带来了Project Astra，它家的最新大模型产品。

和GPT-4o一样，Project Astra能写会听会看会说，也能几乎没有延迟地和人类畅快交流。

不过英伟达科学家Jim Fan老师率先出来点评了一番:

首先，谷歌看起来似乎是多模态输入，但不是多模态输出。

谷歌旗下的图像生成模型Imagen-3以及音乐生成模型仍然作为独立组件，没有融合到当中去。

他提到自己的观点，那就是融合所有模态于一体是不可避免的未来趋势，当然了，还有一些他认为不可缺失的细节，具体如下。

启用诸如“使用更机械化的声音”“说话速度加快2倍”“迭代编辑此图像”和“生成一致的漫画”等任务选项;

不会丢失跨模式的信息，例如情感和背景声音。

开辟新的上下文功能，您可以教模型通过少量示例以新颖的方式组合不同的感官。

对比之下，GPT-4o做得不是完美，但大体上是正确的。

而谷歌呢?

Jim Fan老师不愧是老冲浪选手了，他说，谷歌做对的一件事是，“他们终于开始努力把AI集成到搜索框中”。

还有网友真上手了谷歌新鲜出炉的Project Astra，发了个横向评测视频:

内容我们听了，大体是说，他个人感觉谷歌发布会上的Demo展示环节不太好，他自己和另外三个人去摊位试玩了Project Astra，也只能玩儿2分钟左右。

玩下来的感受，就是大写的“谷歌打的是没准备好的仗”。

排在他前面的测试玩家让Project Astra对着一个事物讲一个故事，Astra信誓旦旦答应说好，然后就没有然后了……

不过让Astra识别画出来的帆船和笑脸，它还是能够胜任的。

相比较而言，他认为GPT-4o更丝滑，不过因为他还没自己上手过GPT-4o，所以不多妄作评价了。

大家的试玩狂欢中，还有一个戏剧性的事情。

那就是马斯克旗下大模型公司xAI的Grok，正确回答了Ilya离开公司的问题。

而OpenAI自己的大模型未能提供正确响应。

网友故意郑重其事地宣布:

突发事件!xAI的Grok1.0击败OpenAI新推出的GPT-4o。

当然了，这必须归功于xAI背后拥有推特（X）上的实时数据/帖子/新闻，没有什么比这更快、更丰富、更真实了。

还有个有意思的是，Hacker News上大家发起了一个神奇的讨论。

有人亮出了一个链接，跳转的是一个2021年发布的打油诗数据集Needle in a Needlestack（只能说世界之大无奇不有），称他坚信GPT-4o训练时，用了里面的数据，

事情的起因是这样的——

Needle in a Needlestack用于衡量大模型对上下文窗口中的信息的关注程度，包含数千首打油诗的提示，该提示询问有关特定位置的一首打油诗的问题。

简单来说就是一个有点意思版本的大海捞针。

不过目前而言，还没有谁家的大模型在这个测试中表现惊艳。

然而，GPT-4o却取得了突破!

这是一个接近完美的表现。

于是网友就开始激情讨论，OpenAI做了啥，让GPT-4o的表现从GPT-4-Turbo大幅跃升。

最主要的观点就如贴主所说，绝对是OpenAI用了Needle in a Needlestack来训练自己，不然数据集背后团队出来解释解释，是怎么检查并确保数据集没有被任何大模型用来作训练呢?

当然了，也有人发出了此前已经有的声音（我们在3月参加月之暗面发布会，以及采访上海人工智能实验室的领军科学家林达华都听过类似的发言）:

大海捞针测试对模型实际的长上下文功能的了解非常有限。

它之所以被广泛使用，是因为早期的模型在这方面表现很糟糕，而且很容易测试。

事实上，大多数最新模型现在在这一项任务上做得相当不错。

不过这次多了一点信息增量，不少人认为，大模型在执行超过32k tokens的长上下文时，进行任何复杂操作的能力都会大幅下降。

最后话说回来，OpenAI真的是人干事?

在谷歌 I/O 开发者大会前贴脸输出GPT新功能，等谷歌发布会结束立马又带来了重磅消息，沉寂半年之久的OpenAI首席科学家Ilya，真的如众人猜测那样官宣离职。

好消息:

Ilya还活着。

坏消息:

谷歌，你是一点流量都摊不上啊……

GPT4o成全球网友新玩具秒秒钟纸质原型转录初始HTML网友 谷歌你是一点流量摊不上啊

0001

评论列表

共(0)条

相关推荐

站长资讯
Kognitos发布生成式AI支持的业务自动化服务
Kognitos今天宣布了其新的自助式方法，使组织能够利用生成AI进行业务流程自动化。Kognitos一直在建立一个平台，允许组织使用自然人类语言来定义和启用BPA。这是该公司上个月在VBTransform活动上详细介绍的一种方法。这项新的提供，自助式生成AI适用于卓越中心和财务组织，扩展了该公司的平台，也是AI初创公司首次提供自助式服务，因为Kognitos旨在使商业用户更容易启用自动化。
站长网2023-08-09 10:55:26
0000
站长资讯
ChatGPT在32门大学课程中有 9 门的成绩或优于学生
本文概要:1.一项研究发现，ChatGPT在32门大学课程中的9门课程的表现可与学生相比或优于学生。2.ChatGPT在需要广泛事实知识的课程中表现尤为出色，而学生在数学和经济学任务中表现更好。3.用于区分人类和机器生成文本的AI文本检测器测试全部失败。最近一项针对ChatGPT的研究发现，其在32门大学课程的测试中，有9门的表现可与学生相比或甚至优于学生。
站长网2023-08-26 17:29:09
0000
站长资讯
余承东没吹牛！问界M7上市首月交付超20000台：创纪录了
快科技7月2日消息，问界新M7Ultra又创造了新纪录：新势力车型交付最快！据鸿蒙智行官方发布的海报显示，问界新M7Ultra上市首月交付辆超2万台，此时距离其交付破万台（6月20日）仅过去了12天，而交付第一个1万台用了18天，看得出来，产能提速非常猛。
站长网2024-07-02 18:22:10
0000
站长资讯
马里兰&NYU合力解剖神经网络模型反转用于解释AI生成图像
要点:1.神经网络模型中的一些神经元在训练过程中永远输出0，被称为"死节点"，而优化算法可以让这些节点生成诡异和恐怖的图像。2.研究人员使用新的类反转方法，称为"Plug-InInversion（PII）"，来生成可以最大化某个类别输出分数的可解释图像，适用于不同神经网络架构。
站长网2023-11-03 14:38:07
0000
站长资讯
大厂抢拍的短剧，不是稳赚不赔的生意
火了三年的短剧，依然被挖掘出了新增量。从内容质量上来看，无脑微短剧的流量红利可能在消失，但是精品化短剧的长期价值才刚刚开始。无数短剧从业者，要么离场要么探索新的内容输出。与此同时，字节、快手这些内容平台外，淘宝、京东、拼多多等电商平台，就连美团上都出现了短剧的身影，甚至360、华为、小米都跨界“短剧”，在市场上招兵买马。
站长网2024-08-16 09:18:07
0000