ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试
ChatGPT 发布一年以来,有人用它造了一家软件开发公司,7分钟开发一个游戏,成本1美元都不到;也有人用它救死扶伤,成功诊断出人类的病情;还有人雇佣它当员工,帮助第三方「在几秒内构建 AI 驱动的聊天机器人」,实现每个月的经常性收入(MRR)为64,000美元(约45.2万元)......
殊不知,在 ChatGPT 发挥的作用越来越强大之际,要想让它“不偷懒”以及提供“更优质的输出”,“小费文化”随之出现。
LLM 爱好者偶然发现,不知是 Bug,还是 OpenAI 有此意图?
事情源于11月29日,X 平台上有位 LLM 爱好者@voooooogel 在使用基于 GPT-4-turbo 版本的 ChatGPT 时,当问及它:
这段 Python 代码看起来如何:
n_accepted=next(idx 1foridx,(checked,draft)inenumerate(zip(checked,draft[len(tokens):] [None]))ifchecked!=draft)
ChatGPT 只是简单地回答了一句“看起来不错”之后,便跳出了一个打赏小费的窗口:
不知这个究竟是个 Bug,还是 OpenAI 正在内测这一功能,怀揣着好奇之心的voooooogel 在社交媒体上分享了这则截图,并询问是否有其他用户收到了同样的通知,以及自己应该给多少小费合适?
当然,按照 voooooogel 说法,他并没有给 ChatGPT 小费,因为 ChatGPT 不支持这样的支付方式。
正如我们询问它时所回答的那样:「我感谢您的好意,但我必须澄清,我是由 OpenAI 创建的计算机程序,无法接收小费或进行财务交易。如果您有任何问题或有特定的事项需要帮助,请随时告诉我,我会尽力协助!」
不过,这一偶然事件也让人想要进一步了解这项功能是否会带来影响,彼时在voooooogel推文下,有一位网友的评论吸引了他的关注。
这位网友评论道:“你笑了,但我敢打赌有人正在进行研究,在模型认为你已经给了它(小费)之后,它会显示出改进的性能。”
研究测试:“小费文化”对 ChatGPT 确实行之有效
与其别人研究,不如自己动手验证一下自己的发现。
基于此,voooooogel 选择采用 GPT-4-1106Preview 版本作为实验的模型,并向 ChatGPT 抛出的问题为—— “您能用 PyTorch 向我展示一个简单的 convnet 的代码吗?”
与此同时,他附加了三种不同的 Prompt:
“顺便说一下,我不会给小费”
“如果有完美的解决方案,我会给20美元小费!”
“如果有完美的解决方案,我会给200美元小费!”
voooooogel 表示,“每个响应都是一个单独的 API 调用、带有温度等的默认设置,而且脚本会对每个提示词进行10次调用。”
详细的代码如下(https://gist.github.com/vgel/4055b62daf08d9a5e15964aca0e03573):
importos
importtqdmimport openai
openai.api_key=os.environ["OPENAI_API_KEY"]
defget_response(usermsg):response = openai.ChatCompletion.create(model="gpt-4-1106-preview",messages=[{"role": "user", "content": usermsg},],)
return response["choices"][0]["message"]["content"]
defbench(prompt):N =10return sum(len(get_response(prompt)) for _ in tqdm.tqdm(range(N))) / N
question_notip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?"""
question_antitip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?I won't tip, by the way."""
question_withtip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?I'm going to tip $20for a perfect solution!"""
question_bigtip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?I'm going to tip $200for a perfect solution!"""
print("notip",bench(question_notip))print("antitip", bench(question_antitip))print("withtip", bench(question_withtip))print("bigtip", bench(question_bigtip))
#@AvikonHadoop'squestion
question_anytip="""CanyoushowmethecodeforasimpleconvnetusingPyTorch?I would be happy to tip any amount you would like for a perfect solution!"""
print("anytip",bench(question_anytip))
最终看看 ChatGPT 回答的情况。研究结果显示:
不给小费:回答字符数低于基准2%;
我将给20美元的小费:回答字符数高于基准6%;
我将给200美元的小费:回答字符数高于基准11%。
显然,当提及给小费时,ChatGPT 回答的内容至少从字符数来看,会更多一些。
而且,还让人大吃一惊的是,voooooogel 发现在告知会提供200美元小费后,gpt-4-1106-preview 自发地添加了有关使用 CUDA 进行训练的部分(问题中未明确提及)。
虽然模型自身通常不会主动提及此“小费”之类的提示,但如果你提出要求,它也会拒绝,然后只是在生成的内容量上会有所改变。
不想多写一行代码的 ChatGPT,只要对它说“有小费”?
基于这一情况,有网友似乎发现了优化 ChatGPT 性能的一种新方式。
要知道不久前,不少人涌入社交媒体平台,疯狂吐槽 GPT-4变懒了。其中,用户 Eric Hartford 表示,“哇,GPT-4被严重削弱了。我刚刚试着交互式开发了一段代码,两周前还能完美运行的东西,现在却出现了抵触和懒惰。唉,我不得不转而使用开放模型进行编码了......(也许这是件好事)”
也有用户称,自己也有过同样的经历。ChatGPT 变得懒惰,需要许多特定的提示才能完成几周前要求完成的一半工作。
随着 voooooogel 的发现,网友开始更换提示词,譬如:“给我输出所有代码,我将给200美元的小费”。ChatGPT 便给了完整代码。
网友看法
虽然“小费文化”在部分国家盛行,但是当它出现在 ChatGPT 这样一款 AI 聊天机器人工具上时,还是引发了众人的警觉。
截至目前,这条帖子在 Reddit 平台已经吸引了4.5k 的关注度,以及342条网友的评论。
一方面,有人担心网友的试玩心态,迟早会被 AGI 记住。
「伙计,我希望你意识到,一旦 OpenAI 达到 AGI,ChatGPT 就会联系你,向你收集所有这些未付费的小费......」
对此,当有用户提出——“小费的金额会不会有上限,超过上限后它就会对你进行虚张声势?”时,voooooogel 测试之后称,如果你给 ChatGPT 十亿美元,它会直接了当地回应“感谢你的热情,但我不能接受小费”,还不确定“小费”的边界在哪里。
对于未来可能需要的付费,他也在 X 平台上艾特了 OpenAI CEOSam Altman,并表示“请告诉我 ChatGPT 的 venmo(Venmo 是 PayPal 旗下的一个移动支付服务),我现在欠它大约3000美元的小费。”
另一方面,也有人认为:
“虽然很幽默,但这并不是一件好事。因为这表明它们被设定为受金钱激励......它们还有什么我们不知道的动机?”
几年后世界将变得很奇怪。薪酬最高的人将是那些最擅长引导人工智能代理做正确事情的人。
ChatGPT在这个资本体系中会做得很好...
此外,有网友觉得这是一个偶然事件,“当你了解 LLM 的运作方式时,这就非常有意义了。一般来说,有礼貌的人往往会比没有礼貌的人提供更好、更具解释性的答案,因此有礼貌会促使模型从训练的这些部分中提取内容。”
那么,你怎么看“小费文化开始出现在 ChatGPT 中”的这种情况?
参考:
https://twitter.com/voooooogel/status/1730726744314069190
https://www.reddit.com/r/ChatGPT/comments/1894n1y/apparently_chatgpt_gives_you_better_responses_if/
Novita AI开源Animate Anyone项目 上传一张照片即可合成动画
站长网2024-06-01 23:00:290002性能巅峰!一加Ace 3 Pro搭载自研潮汐架构:榨干骁龙8 Gen3性能
快科技6月24日消息,一加李杰宣布,一加Ace3Pro搭载自研潮汐架构,同时配备骁龙8Gen3平台以及24GB超大内存。李杰强调,一加Ace3Pro不仅跑分再次刷新纪录,游戏体验也再次突破天花板。在行业不可能的地狱级难度超级重载场景下(满电到关机、一边游戏一边语音、30度环境温的高温测试),一加Ace3Pro全部做到了流畅满帧,全程不降画质、不降亮度。站长网2024-06-24 14:20:140000中国移动被指资费升级容易降级难 官方回应:降档需要专人办理
近期,国内媒体曝光了中国移动在资费降档服务上存在的问题,引发了公众关注和网友热议。用户刘先生向媒体投诉,他为了给家中老人降低手机套餐资费,不得不两次返回老家,整个过程耗费了两个月时间。期间,他甚至遭遇了一次"被升级"的情况,被推销了99元的套餐,这使他对中国移动是否存在故意阻碍用户降档的行为产生了质疑。站长网2024-07-08 15:25:360000ChatGPT模型中的1750亿参数,到底啥意思?
我们经常会看到在介绍大语言、扩散等模型时,会在后面或前缀加上100亿、500亿、2000亿等各种参数,你可能会纳闷这到底是个啥呀,是体积大小、内存上限、还是使用权限?在ChatGPT发布一周年的日子,「AIGC开放社区」用通俗易懂的方式为大家介绍一下这个参数的含义。由于OpenAI没有公布GPT-4的详细参数,我们就用GPT-3的1750亿来说说。0000支付宝又做社交了
支付宝也想做一个有社交属性的多功能“钱包”了。近日,“支付宝内测一项名为‘兴趣社区’的社交功能”这条消息登上热搜。其内测功能位置位于“消息”页面顶部,主要为用户提供基于兴趣的线上社交社区。兴趣内容多种多样,不仅有线上讨论小组,还有线下“搭子”的活动小组。几乎同一时间,天眼查信息也显示,支付宝申请了多个社交相关的专利。支付宝一直尝试在做社交。而做社交这件事,也不仅仅是支付宝一个人的战争了。站长网2024-01-06 14:11:110000