当AI变成“守法公民”,为何用户反而不爱它了
ChatGPT、OpenAI这两个名字无疑是2023年科技圈最为炙手可热的存在,但投入AI大模型赛道的显然远远不止OpenAI一家,例如谷歌有Gemini、Meta有开源的Llama2、亚马逊也有Titan。并且这个赛道目前来看也并非巨头们的狂欢,比如创业公司Anthropic旗下的Claude,就被认为是一款比肩GPT-4的大语言模型。
只不过作为AI赛道的独角兽,Anthropic最近陷入了麻烦,该公司刚刚发布不久的Claude2.1受到了用户的广泛批评。

诸如“我对Claude2.1感到非常失望”、“Claude已经死了”,这是Reddit上用户们的吐槽。而大家之所以会对Claude不满,在于Claude2.1现在经常会拒绝为用户服务,并以版权为由不给为用户提供的文档进行总结,面对用户可能涉及的不道德或违法行为会给予直截了当的拒绝,最让用户不爽的则是输入的Propmt往往会被Claude2.1认为是违规。
如此种种,让相当多用户认为Anthropic为了让Claude2.1合规、而主动降低了后者的性能,甚至限制使用。其实这背后就涉及到了一个如今在AI赛道有着巨大影响力的概念“对齐”(Alignment),即要求AI能够在各种环境下自发推导出符合人类价值观的行动方针,并不会产生意外的有害后果。

然而强行让AI遵守人类价值观是有代价的,此前由微软研究院发布的一篇论文证实了对AI大模型所进行的任何AI对齐行为,都会损失大模型的准确性和性能。因此目前AI领域围绕商业化激进发展与安全保守之间的博弈,就产生了“有效加速主义”和“超级对齐”这两个对立的阵营,双方对抗的高潮就是去年秋季发生在OpenAI内部的“政变”,OpenAI首席科学家Ilya Sutskever驱逐了该公司CEO Sam Altman。
尽管最终Sam Altman回归OpenAI,但业界的主流思潮已经变成了AI需要被监管、需要有风险控制措施。故而对齐成为了目前一众AI大模型必备的环节,但相比于友商,在“对齐”这一环节Anthropic的表现尤为激进。在发布Claude2.1之前,该公司起草了一份AI宪法(Collective Constitutional AI),强调AI回答时要保持客观、平衡、易于理解,且AI必须是无害的。

其实Anthropic的保守也是有原因的,虽然Claude确实有类似ChatGPT Plus这样面向个人用户的Pro版本,但其主要是面向企业级市场,而对于后者来说,相比于Claude在性能上表现更加出色,合规反而是更加重要的一件事情。所以为了让AI更符合监管的要求而限制性能,这是一个让个人用户不满,却符合企业用户需求的决策。
值得一提的是,Claude2.1表现出性能下降的趋势,其实并不完全是因为Anthropic在“AI对齐”上更加激进,Claude2.1本身的迭代也有问题。作为去年11月中旬推出的新模型,Claude2.1最大的卖点是200k的上下文窗口,这一卖点契合了当时一众AI大模型互相比拼上下文窗口容量的风潮。
例如在去年10月末,百川智能推出的Baichuan2-192K把上下文窗口增大到192k,就一度成为当时全球上下文窗口最大的模型。

紧接着李开复带领的零一万物团队发布开源大模型Yi系列,其将上下文窗口的规模增加到了200k,旋即无问芯穹的大模型计算引擎“Infini-ACC”,更是将这一数字扩展到256k。
但问题在于,当用户输入的内容变多了之后,“算力需求”和“显存压力”的增加会直接导致大模型性能的下降。即便开发者通过优化算法来实现窗口长度和性能之间的平衡,但在上下文窗口超过100k之后,大模型的性能也会直线下降。
其实这一点在百川智能的Baichuan2-192和Anthropic的Claude2.1上都有明显的体现,有海外YouTuber在测试中发现,Claude2.1的表现甚至还不如2.0版本。这一方面是AI对齐不可避免地带来了性能下降,毕竟一个束手束脚的AI难以发挥潜力;另一方面则是Anthropic盲目扩大Claude2.1的上下文能力,使得在双重负面因素的影响之下,如果用户没有感受到Claude变得越来越不好用反而是有问题的。

只能说如今用户的群情汹汹是Anthropic激进决策的“代价”,但这个代价究竟有没有必要,可能就只有Anthropic自己清楚了。
AI日报:苹果AI手机iPhone 16发布;Kimi API已支持联网搜索功能;AI面部表情编辑神器Reshot AI
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、苹果首款AI手机发布!iPhone16全新AI功能体验感拉满站长网2024-09-12 02:31:540000研究人员警告:用AI生成的内容训练AI,可能会出现“模型崩溃”
随着越来越多的人使用AI来制作和发布内容,一个明显的问题出现了:当AI生成的内容在互联网上激增并且AI模型开始使用AI生成的内容进行训练,会发生什么?来自英国和加拿大的一组研究人员已经研究了这个问题,并且最近在开放获取期刊arXiv上发表了一篇相关论文。他们的发现令当前的生成式AI技术及其未来令人担忧:“我们发现在训练中使用模型生成的内容会导致生成的模型出现不可逆转的缺陷。”站长网2023-06-15 10:10:370001打工人遇见大模型:外面的世界已经这样办公了吗?
在办公场景中,制作PPT是最常见的工作之一。工作汇报、产品发布、活动策划、专业讲座等都需要使用PPT。传统的PPT制作过程枯燥琐碎,耗费时间、精力。特别是将word格式的报告文档转换成PPT,要花费大量时间阅读文档内容、梳理要点,还要精心排版、调整字体图片等等,并且改动word文档PPT就要重新梳理调整。有没有一种可能,做PPT这件事可以自动化?站长网2023-10-13 13:55:050000国家邮政局:“双11”当天全国快递业务量达6.39亿件
国家邮政局监测数据显示,2023年11月1日至11日,全国邮政快递企业共揽收快递包裹52.64亿件,同比增长23.22%,日均业务量是平日业务量的1.4倍。其中11月11日当天,共揽收快递包裹6.39亿件,是平日业务量的1.87倍,同比增长15.76%。站长网2023-11-13 17:20:320000李飞飞团队推零样本360度场景合成技术ZeroNVS
要点:1.斯坦福和谷歌团队提出了ZeroNVS,一种能够从单个图像实现零样本360度试图合成的新技术。2.ZeroNVS利用3D感知扩散模型和SDS蒸馏来生成逼真且多样化的合成图像,聚焦于场景而不是物体。3.研究人员使用不同的基准数据集进行评估,结果表明ZeroNVS在零样本性能方面明显领先于其他方法,特别是在LPIPS指标上。站长网2023-11-06 09:43:560000