Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限
谷歌Gemini修改bug让网友大开眼界!
X一小伙分享,为测试Gemini1.5Pro,自己在编写一个网页的代码时故意留了3个bug,并分别录制了网页bug视频。
接着把代码库打包成文件连同视频一起输给了Gemini1.5Pro,提示它找到并修复代码中的所有bug,且要提供一个简要指南以及所做更改的说明。
没想到,Gemini1.5Pro还真就分分钟正确识别并修复了每一个bug。
小伙将这种玩法po出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。
其本人还在评论区强调,“这只是一个简单的例子,也将是它最差的表现”,Gemini这小汁前途不可限量啊。
有网友表示想起来一件事觉得有趣:英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”,那时候还有很多人反对称“AI不会取代程序员”。
但甭管怎么说,AI可以给程序员提供帮助是有目共睹的。
接下来我们展开来看Gemini1.5Pro修复bug的经过。
事件经过
正如开头提到的,网友先是在编写网页代码时故意写错了3处:
这就导致网页上的一些功能操作无法正常运行,于是小伙分别拍摄了3处无法正常运行的视频,每个视频十几秒。
然后将视频连同代码库一起输给了Gemini1.5Pro。
prompt为:
Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修复我代码中的bug,为我创建一个简单的Markdown指南以修复bug,然后编写实际的代码来修复。我需要完整的代码,就像它是为了一个完整的Pull Request一样,这样我才能进行更改。)
随后,Gemini1.5Pro立刻准确识别了3个bug:
点击一个待办事项并不会将其标记为完成/未完成
主题切换器不会切换主题
点击登录按钮不会触发任何操作
紧接着就分别给出了修复方案,附带代码:
小伙仔细对照自己敲的代码,确认Gemini1.5Pro给出的答案是正确的:
小伙还强调,这3个bug在代码库文件中其实离着很远,这也就意味着Gemini1.5Pro确实读完了完整的上下文。
“想要访问权限”
网友看到这一系列操作后激动搓手,直呼想要Gemini1.5Pro访问权限:
除坐等外,还有网友表示用GPT-4帮忙修复代码也很好使,顺带畅想了一下GPT-5:
接下来可能是实时交互?或许能与GPT-5进行屏幕共享?
而另一边已经获得访问权限的网友早就玩嗨了。
比如,一次性输给Gemini1.5Pro最新的10篇论文,让它从中找到一个作者的电子邮件地址。
结果Gemini1.5Pro第一次就成功找到了:
然后又让Gemini1.5Pro从超360000token的《哈利·波特与凤凰社》整本书中找到一句话的说话人,Gemini1.5Pro也成功找到了。
测试继续上难度,一次性输入三本书,Gemini1.5Pro最后用时约1分钟再次成功找到对应的说话人:
惊讶之余,这位测试者总结了Gemini1.5Pro的逻辑推理能力:
对于常规提示,接近GPT-4的性能。
但当我添加数十个例子时,Gemini的性能在提升,似乎没有上限。多示例提示成为了新的微调方法。
沃顿商学院教授Ethan Mollick也来整活了。输给Gemini1.5Pro一本352页的《太空60年》规则手册,约250000token,然后要求它扮演一个角色。
即使说明书分散在很多页上,而且非常复杂,但Gemini“似乎明白了”:
Ethan Mollick教授表示,对所有其他AI进行这项测试都是失败的,只有Gemini1.5Pro成功了。
这位网友想要编译整个X算法的代码存储库并将其上传到Gemini1.5Pro,正在线向网友征集想问的问题。
只见编译完成后,共310489token,Dogan Ural向Gemini1.5Pro提出了网友们关心的一系列问题,比如“在推特上扩大或者减少影响力的前5件事是什么?”
Gemini1.5Pro很轻松地给出了这样婶儿的答案:
你还见过哪些有趣的玩法?欢迎评论区分享~
亚马逊介绍与 Anthropic 合作提供支持的 AWS AI 芯片
站长之家(ChinaZ.com)10月18日消息:亚马逊日前与Anthropic宣布战略合作,推进生成式人工智能的发展。Anthropic选择AWS作为其主要云服务提供商,并将使用AWSTrainium和Inferentia芯片进行训练和部署未来的基础模型,充分利用AWS高性能、低成本的机器学习加速器。站长网2023-10-18 22:44:260000清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!
为了验证大语言模型的沟通、规划、反思等拟人化能力,清华研究团队发布了一篇名为“探索大语言模型在交流游戏中的应用:《狼人杀》实验”的研究论文。结果显示,通过ChatGPT(GPT-turbo-0301)构建的7个玩家,在《狼人杀》游戏中展示出了信任、对抗、伪装和领导的拟人化能力,而研究人员没有进行任何干预和教导。站长网2023-09-24 10:01:580000City walk走红,又是中产陷阱?
在被同事普及Citywalk这个概念之前,栗子都没有意识到,原来自己一直以来的旅行方式有了一个新名字。北京也好,重庆也好,她习惯在城市里漫无目的地行走。她在狭窄的胡同里不分东南西北地漫步,和几个小时前刚认识的新朋友一起远眺长江,在陌生的国家随意钻进一家其貌不扬的烘焙店,主打一个“寻找惊喜”,或许是拐角处碰到的一只小狗,是一杯好喝的咖啡,又或只是想在行走中放空自己。站长网2023-06-29 04:07:140000娃哈哈感谢信:会传承宗庆后务实精神 不断向前发展
娃哈哈集团今天通过其官方微博发布了一封感谢信,以表达社会各界对宗庆后先生逝世的深切悼念和追缅之情的感激之情。在感谢信中,娃哈哈集团提到宗庆后先生是集团的奠基人,他的一生都致力于制造业,将全部精力献给了中国的实体经济。娃哈哈表示,失去这位灵魂人物对他们来说是一次巨大的打击,但社会各界的哀悼和敬意为他们带来了巨大的慰藉。站长网2024-02-28 17:38:330000OpenAI宣布:如GPT-5太危险,董事会有权否决奥特曼的决定
要点:OpenAI宣布董事会有权否决决定,特别是对于GPT-5等前沿模型的安全风险,公司成立安全顾问团队,定期向管理层和董事会报告。公司成立三个安全团队,分别应对当下、不久的将来和遥远的未来的AI风险,主要跟踪网络安全、CBRN风险、说服风险和模型自主性风险。OpenAI在技术开发上设立了限制,对不同种类的AI风险要求模型安全得分达标后才能进入下一个开发阶段,发布了“前沿风险防范框架”。站长网2023-12-20 09:40:280000