AI初创公司Galileo推新工具,可解释AI大模型的幻觉现象
文章概要:
1. 美国AI初创公司Galileo发布新工具,帮助用户更好地理解和解释大型语言模型(LLMs)的输出,特别是幻觉现象。
2. Galileo Studio现在具备实时监测功能,允许用户评估输入和输出,提供新指标和防护措施以优化LLMs的性能。
3. Galileo还引入了"接地性"指标,用于确定模型输出是否与训练数据相关,以区分幻觉和模型输出的真实性。
在人工智能领域,特定生成型人工智能模型(LLMs)产生幻觉现象的问题一直令人困惑。然而,旧金山的AI初创公司Galileo正在努力解决这一问题,并为用户提供了一系列新的监测和指标功能,以帮助他们更好地理解和解释LLMs的输出。
Galileo Studio是该公司旗下的工具,最新更新使用户不仅可以评估输入和上下文,还可以实时观察输出。这些新的监测功能使Galileo能够更好地解释为什么模型会产生特定的输出,并提供新的指标和防护措施来优化LLMs的性能。
图源备注:图片由AI生成,图片授权服务商Midjourney
Galileo的联合创始人兼CEO Vikram Chatterji在接受VentureBeat的独家采访中表示:“最近几个月的真正新功能是我们添加了实时监测,因为现在您实际上可以观察到出了什么问题。这已经成为一个端到端的产品,用于不断改进大型语言模型应用。”
LLMs通常依赖于应用程序向LLM发出API调用以获取响应。Galileo拦截了这些API调用,包括输入和生成的输出。通过拦截这些数据,Galileo能够向用户提供关于模型性能以及输出准确性的准实时信息。
当我们讨论生成的AI输出的事实准确性时,通常会涉及到幻觉现象,即生成了与事实不符的输出。Chatterji解释说,LLM实际上是在尝试预测下一个单词应该是什么,但它还有关于下一个备选单词的想法,并为所有这些不同的标记或不同的单词分配概率。
Galileo通过与模型本身连接,使其能够准确了解这些概率,然后提供额外的指标来更好地解释模型输出并理解为什么会出现特定的幻觉现象。通过提供这些见解,Galileo的目标是帮助开发人员更好地调整模型和微调以获得最佳结果。
除了幻觉问题,LLM基础应用程序提供的响应可能会引发一些问题,如不准确、不当的语言或机密信息泄露。为了解决这些问题,Galileo Studio还引入了新的"防护措施"指标。对于AI模型,防护措施是关于模型可以生成的信息、语气和语言的限制。
对于金融服务和医疗保健等领域的组织来说,存在与信息披露和语言使用相关的监管合规性问题。通过防护措施指标,Galileo用户可以设置自己的防护措施,然后监控和测量模型输出,以确保LLMs不会偏离正轨。
此外,Galileo还跟踪一项被称为"接地性"的指标,用于确定模型的输出是否符合其提供的训练数据的范围。如果一个模型在抵押贷款文件上进行训练,但提供了与这些文件完全无关的答案,Galileo可以通过接地性指标检测到这一情况。这使用户可以知道响应是否与模型的训练背景相关。
Galileo为用户提供了一套全面的指标,使他们能够更好地理解模型的输出并解释其真实性。这些指标不仅有助于发现幻觉现象,还以可视化的方式解释了模型在每个单词基础上的困惑,有助于开发人员优化模型以获得最佳结果。同时,通过防护措施和接地性指标,Galileo还帮助开发人员确保LLMs的输出不会引发问题,如不准确或不合规的响应。
百度推出AIGC营销新创意平台“擎舵” AI数字人平台限时免费
百度宣布推出AIGC营销新创意平台—擎舵,通过多模态内容生成,突破创意生产力瓶颈,可轻松实现文案生成、图片生成和数字人视频制作三大创意生产能力。基于擎舵平台,百度营销正在打造营销场景下的专属创意生成工具,高质高效输出创意内容,推动客户服务经营路径的变化,AI数字人平台是重要代表。站长网2023-06-21 16:57:550000产业级AI原生应用的「超级外挂」,应用已在200+行业场景落地
今年AI领域的热门词汇,非”AI原生应用”莫属。而现在,这个浪潮之巅的方向,又一件神兵利器有了成绩单证明——百度智能云千帆AppBuilder。作为百度智能云推出的产业级AI原生应用开发平台,AppBuilder致力于打通大模型到业务的最后一公里。短短推出半年以后,AppBuilder公布了成绩单:服务客户数已突破10万,应用已在200行业场景落地;站长网2024-06-08 12:43:050001高通宣布骁龙X Elite首发合作厂商 小米荣耀等在列
站长之家(ChinaZ.com)10月26日消息:10月26日消息,高通昨天召开的骁龙峰会上公布了首批将搭载骁龙XElite处理器的PC制造商名单,其中包括小米、荣耀、联想等9家知名品牌。高通产品管理高级总监NitinKumar透露,首批合作厂商将在2024年年中起陆续发布搭载骁龙XElite处理器的产品,包括笔记本电脑和二合一产品等。站长网2023-10-26 11:56:580000苹果官网 iPhone15 系列手机已发货 预计明天到手
根据苹果官方信息,首批iPhone15Pro已经进入发货阶段,预计将在9月22日送达消费者的手中。这意味着,已经预订的用户只需等待邮政快递的派送,即可在家中坐等收货。值得注意的是,除了苹果官网,天猫、京东和美团外卖等第三方平台也与苹果达成了合作。消费者在这些平台上也能购买到iPhone15系列,且预计到货时间可能比官网更快。然而,尽管第三方平台提供了便捷的购买方式,但官网下单仍具有独特的优势。站长网2023-09-21 16:57:000000AIGC独角兽宣布裁员,风口上的猪开始摔下来了?
作为全球最具影响力、最值得信赖的独立研究咨询公司之一,Forrester每年都会选出年度十大新兴技术。就在2023年刚刚过去一半时间后,Forrester方面就将生成式人工智能(下文简称为AIGC)及相关技术作为了今年的十大新兴技术之首。而他们的理由,则是“生成式人工智能在今年的榜单上的主导地位并不会让任何人感到意外,因为每个人都可以在众多公开可用的工具中观察到其惊人的能力”。站长网2023-07-26 09:59:230001