亚马逊面向企业的 AI 聊天机器人 Amazon Q 或存在严重幻觉和数据泄露问题引发质疑
在发布不到一周后,Amazon Q —— 亚马逊对抗 Copilot 的生成式 AI 助手——已面临生存威胁,一份新报告显示这款 AI 助手可能产生「严重幻觉」。

据 The Platformer援引泄露文件报道,Q 正面临准确性和隐私问题,包括幻觉和数据泄露。值得注意的是,这一报道正值两项重要研究显示,大型语言模型(LLM)在连接企业数据库时高度不准确,且变得越来越不透明之际发布。
然而,据亚马逊一位发言人表示,Amazon Q 并未泄露任何机密信息。
「一些员工通过内部渠道和工单系统分享反馈,这是亚马逊的标准做法。那些反馈并未识别出任何安全问题。我们感谢收到的所有反馈,并将继续调整 Q,使其从预览产品过渡到普遍可用,」该发言人表示。
尽管亚马逊声称其为数百万人的工作伙伴,分析人士认为亚马逊 Q 可能还未准备好用于企业环境。
EIIRTrend & Pareekh Consulting 首席执行官 Pareekh Jain 表示:「如果存在幻觉,就不能在企业环境中用于决策。它适用于个人使用或获取信息,但不适用于决策过程。」
更多测试需求
亚马逊可能在其生成式 AI 助手准备好商业发布之前面临重大的测试挑战。Jain 强调了进行广泛内部试验以确保准备就绪的重要性。
「我认为他们需要先对内部员工进行更多测试,」Jain 补充道。「显然,这正是他们现在正在做的。最终,没有外部来源报告这些问题。这里有两个方面:一是数据,另一个是算法。他们必须看看这是数据问题还是算法问题。」
Q 利用了 17 年 AWS 的数据和开发经验,旨在作为企业的多功能工具。鉴于行业的发展方向,亚马逊在这款 AI 产品上投入了巨大的赌注。
尽管「幻觉」并不削弱生成式 AI 在消费者和企业用例中的潜力,但适当的训练至关重要,市场研究公司 IDC 的副总裁 Sharath Srinivasamurthy 表示。
「在更高质量数据上训练模型、提示增强(引导用户使用模型容易理解的预定义提示)、针对组织或行业特定数据和政策不断微调模型、在响应可疑时增加人工检查层,这些都是需要采取的步骤,以充分利用这项新兴技术,」Srinivasamurthy 说。
幻觉是否会促使迫切需要进行监管?
关于幻觉的报告引发了对监管需要和可能在某一时刻生效的规则严重性的担忧。然而,Greyhound Research 首席分析师兼 CEO Sanchit Vir Gogia 指出,任何由此产生的监管可能适得其反。
「事实上,任何监管都可能减缓数据的交换和利用,」Gogia 说。「因此,目前来说,这个行业越不受监管越好。这允许更容易、更顺畅地使用数据。以 OpenAI 的 GPT 为例——如果对可捕获数据设置严格的防护栏,那么它就不会取得成功。」
Jain 也建议,设置外部边界可能不是一个可行的想法,但公司本身可能会付出更多努力。
「监管可能存在,但重点主要是自我监管,」Jain 解释说。「尽管监管和指导方针是必要的,但对于能够执行的审核程度有一定的限制。重点应该是负责任的 AI,其中的逻辑可以向客户解释,而不是创建『黑箱』系统。然而,在我看来,有一个阈值,超过这个阈值,责任更多地转向企业如何作为安全问题来看待和实施这些措施。」
所有目光聚焦于亚马逊
虽然这些见解凸显了更强大的内部测试和自我监管倾向的必要性,但在企业环境中部署 AI 的道路充满了复杂性。现在亚马逊需要在这些挑战中找到方向,特别是因为它在这一领域的晚期进入。
「AWS 在这个领域有些落后,目前微软和谷歌正在领先,」Jain 补充道。「因此,人们对于聊天机器人和其他相关技术抱有更高的期望。」
有关 Amazon Q 的更多信息:https://top.aibase.com/tool/amazon-q
《英雄联盟》所有人聊天功能恢复 网友:史诗级加强
9月14日消息,《英雄联盟》国服今日13.18版本更新后,恢复了所有人聊天功能。游戏玩家除了可以与队友互动外,还可与对手聊天互动。但此前也有过所有人聊天功能短暂开启,目前尚不清楚国服后续是否会再度关闭所有人聊天功能。据了解,《英雄联盟》国服在2021年关闭了游戏内的所有人聊天功能。当时,《英雄联盟》称其对行为系统的主要关注点都与对局有关,如挂机和送人头等行为。站长网2023-09-14 21:52:060000Midjourney V6来袭!性能对标DALL·E 3,争夺地表最强作图AI称号
9月21日,OpenAI上线了DALL·E3,不仅绘画能力发生极大飞跃,而且还能「听懂」人话!全新升级后的DALL·E3,也无可争议地成为了AI绘画领域的扛把子。凑热闹的网友们也晒出了同一个Prompt用DALL·E3和Midjourney作画的对比图。可以看到,DALL·E3在「理解意图」上比Midjourney做得更好,它生成的图像更准确。站长网2023-10-02 15:54:400000特斯拉人形机器人Optimus擎天柱第二代将发布
特斯拉CEO马斯克宣布,Optimus第二代机器人(Gen2)将于2023年12月发布。根据视频,最新的OptimusGen2配备了两个自由度的颈部关节,使得机器人的头部能够更加灵活地转动和倾斜。其次,机器人的走路速度和稳定性也得到了提升,提高了30%。此外,OptimusGen2在不影响功能的前提下,总重减少了10公斤。站长网2023-12-13 11:22:060000最新研究表明,AI或为亚马逊和沃尔玛带来超5800亿美元额外利润
本文概要:1.IHLGroup的研究显示,到2029年,人工智能将可能给北美212家最大的公共零售商和餐馆带来超1.5万亿美元的额外财务增长。2.AI或为亚马逊和沃尔玛带来超过5800亿美元的额外利润,占总数的38.5%。3.人工智能的发展将为零售业带来巨大的机遇,尤其是在销售增长和费用减少方面。站长网2023-08-19 15:25:300000萝卜快跑招聘安全员优先录用老司机:负责数据跟踪采集、紧急情况处理
快科技8月19日消息,据媒体报道,有网友在工作招聘平台发现,萝卜快跑等多家企业正在热招自动驾驶安全员,有经验的老司机”成为自动驾驶安全员这个新职业的热门首选。0000