当AI变成“守法公民”,为何用户反而不爱它了
ChatGPT、OpenAI这两个名字无疑是2023年科技圈最为炙手可热的存在,但投入AI大模型赛道的显然远远不止OpenAI一家,例如谷歌有Gemini、Meta有开源的Llama2、亚马逊也有Titan。并且这个赛道目前来看也并非巨头们的狂欢,比如创业公司Anthropic旗下的Claude,就被认为是一款比肩GPT-4的大语言模型。
只不过作为AI赛道的独角兽,Anthropic最近陷入了麻烦,该公司刚刚发布不久的Claude2.1受到了用户的广泛批评。
诸如“我对Claude2.1感到非常失望”、“Claude已经死了”,这是Reddit上用户们的吐槽。而大家之所以会对Claude不满,在于Claude2.1现在经常会拒绝为用户服务,并以版权为由不给为用户提供的文档进行总结,面对用户可能涉及的不道德或违法行为会给予直截了当的拒绝,最让用户不爽的则是输入的Propmt往往会被Claude2.1认为是违规。
如此种种,让相当多用户认为Anthropic为了让Claude2.1合规、而主动降低了后者的性能,甚至限制使用。其实这背后就涉及到了一个如今在AI赛道有着巨大影响力的概念“对齐”(Alignment),即要求AI能够在各种环境下自发推导出符合人类价值观的行动方针,并不会产生意外的有害后果。
然而强行让AI遵守人类价值观是有代价的,此前由微软研究院发布的一篇论文证实了对AI大模型所进行的任何AI对齐行为,都会损失大模型的准确性和性能。因此目前AI领域围绕商业化激进发展与安全保守之间的博弈,就产生了“有效加速主义”和“超级对齐”这两个对立的阵营,双方对抗的高潮就是去年秋季发生在OpenAI内部的“政变”,OpenAI首席科学家Ilya Sutskever驱逐了该公司CEO Sam Altman。
尽管最终Sam Altman回归OpenAI,但业界的主流思潮已经变成了AI需要被监管、需要有风险控制措施。故而对齐成为了目前一众AI大模型必备的环节,但相比于友商,在“对齐”这一环节Anthropic的表现尤为激进。在发布Claude2.1之前,该公司起草了一份AI宪法(Collective Constitutional AI),强调AI回答时要保持客观、平衡、易于理解,且AI必须是无害的。
其实Anthropic的保守也是有原因的,虽然Claude确实有类似ChatGPT Plus这样面向个人用户的Pro版本,但其主要是面向企业级市场,而对于后者来说,相比于Claude在性能上表现更加出色,合规反而是更加重要的一件事情。所以为了让AI更符合监管的要求而限制性能,这是一个让个人用户不满,却符合企业用户需求的决策。
值得一提的是,Claude2.1表现出性能下降的趋势,其实并不完全是因为Anthropic在“AI对齐”上更加激进,Claude2.1本身的迭代也有问题。作为去年11月中旬推出的新模型,Claude2.1最大的卖点是200k的上下文窗口,这一卖点契合了当时一众AI大模型互相比拼上下文窗口容量的风潮。
例如在去年10月末,百川智能推出的Baichuan2-192K把上下文窗口增大到192k,就一度成为当时全球上下文窗口最大的模型。
紧接着李开复带领的零一万物团队发布开源大模型Yi系列,其将上下文窗口的规模增加到了200k,旋即无问芯穹的大模型计算引擎“Infini-ACC”,更是将这一数字扩展到256k。
但问题在于,当用户输入的内容变多了之后,“算力需求”和“显存压力”的增加会直接导致大模型性能的下降。即便开发者通过优化算法来实现窗口长度和性能之间的平衡,但在上下文窗口超过100k之后,大模型的性能也会直线下降。
其实这一点在百川智能的Baichuan2-192和Anthropic的Claude2.1上都有明显的体现,有海外YouTuber在测试中发现,Claude2.1的表现甚至还不如2.0版本。这一方面是AI对齐不可避免地带来了性能下降,毕竟一个束手束脚的AI难以发挥潜力;另一方面则是Anthropic盲目扩大Claude2.1的上下文能力,使得在双重负面因素的影响之下,如果用户没有感受到Claude变得越来越不好用反而是有问题的。
只能说如今用户的群情汹汹是Anthropic激进决策的“代价”,但这个代价究竟有没有必要,可能就只有Anthropic自己清楚了。
约79%的ChatGPT企业客户来自微软Azure OpenAI合作伙伴关系
划重点:-在OpenAI的生成式AI聊天机器人ChatGPT的企业客户中,大约70-79%来自Azure-OpenAI合作伙伴关系,而不是直接来自GPT-4或其他渠道。-ChatGPTEnterprise在推出不到四个月的时间内,全球范围内已经获得了22,000-25,000个客户。站长网2023-12-05 16:50:26000075后创始人做童鞋,打造类目第一品牌,年销20亿
新生代父母精细化育儿,催生了生意新机遇。对于产品专业细分、健康安全方面的更高需求,在童鞋赛道尤其体现得淋漓尽致。孩子从学步、走路,到奔跑、跳跃、体能加强等不同成长阶段,相应的产品需求也不同。在如今的父母眼中,一双适合的童鞋,是陪伴孩子不断“升级打怪”的刚需。童鞋品牌泰兰尼斯,似乎更早预见到了这一趋势。站长网2024-08-04 09:03:050000辣椒越皱,辣度越高?真相在这里!
其实和人会衰老、面部产生皱纹一样,植物因为各种各样的原因,也会在表面产生褶皱。辣椒表面的褶皱便吸引了科学家们探索其中的奥秘。图库版权图片,不授权转载01辣椒表面褶皱的形成原因辣椒因为干燥产生褶皱是日常生活中常见的现象,但是如果要细细分析为什么会产生这样复杂的褶皱,并不是一件简单的事情。站长网2023-05-24 21:25:330000享界S9OTA重磅升级!全新华为ADS 3.0来了:智驾强如老司机
快科技9月5日消息,上市一个月的享界S9今日迎来首次OTA重磅升级,主要升级了全新HUAWEIADS3.0,主动安全能力更强。据了解,HUAWEIADS3.0的城区智驾领航辅助让道路识别更准确,决策更果断,密集车流换道成功率更高,并且加速也更平稳,大幅提升享界S9驾乘舒适性,如同经验丰富的老司机控车。本次升级还新增车道巡航辅助增强,支持智能识别红绿灯,过路口时自主启停。站长网2024-09-07 12:50:390000新型声学攻击:AI可通过监听按键声窃取数据,准确率高达95%
本文概要:1.通过研究发现,无线键盘发出的击键声音可以被检测和解释,成为新型声学攻击方式。2.研究人员使用自注意力变换层训练了一个深度学习模型,可以通过监听附近手机记录的击键声中窃取数据,准确率高达95%。3.这项研究显示了通过现有设备和算法进行旁路攻击的实用性,未来可能开发更强大的技术。站长网2023-08-09 15:14:470000