AI初创公司Galileo推新工具,可解释AI大模型的幻觉现象
文章概要:
1. 美国AI初创公司Galileo发布新工具,帮助用户更好地理解和解释大型语言模型(LLMs)的输出,特别是幻觉现象。
2. Galileo Studio现在具备实时监测功能,允许用户评估输入和输出,提供新指标和防护措施以优化LLMs的性能。
3. Galileo还引入了"接地性"指标,用于确定模型输出是否与训练数据相关,以区分幻觉和模型输出的真实性。
在人工智能领域,特定生成型人工智能模型(LLMs)产生幻觉现象的问题一直令人困惑。然而,旧金山的AI初创公司Galileo正在努力解决这一问题,并为用户提供了一系列新的监测和指标功能,以帮助他们更好地理解和解释LLMs的输出。
Galileo Studio是该公司旗下的工具,最新更新使用户不仅可以评估输入和上下文,还可以实时观察输出。这些新的监测功能使Galileo能够更好地解释为什么模型会产生特定的输出,并提供新的指标和防护措施来优化LLMs的性能。
图源备注:图片由AI生成,图片授权服务商Midjourney
Galileo的联合创始人兼CEO Vikram Chatterji在接受VentureBeat的独家采访中表示:“最近几个月的真正新功能是我们添加了实时监测,因为现在您实际上可以观察到出了什么问题。这已经成为一个端到端的产品,用于不断改进大型语言模型应用。”
LLMs通常依赖于应用程序向LLM发出API调用以获取响应。Galileo拦截了这些API调用,包括输入和生成的输出。通过拦截这些数据,Galileo能够向用户提供关于模型性能以及输出准确性的准实时信息。
当我们讨论生成的AI输出的事实准确性时,通常会涉及到幻觉现象,即生成了与事实不符的输出。Chatterji解释说,LLM实际上是在尝试预测下一个单词应该是什么,但它还有关于下一个备选单词的想法,并为所有这些不同的标记或不同的单词分配概率。
Galileo通过与模型本身连接,使其能够准确了解这些概率,然后提供额外的指标来更好地解释模型输出并理解为什么会出现特定的幻觉现象。通过提供这些见解,Galileo的目标是帮助开发人员更好地调整模型和微调以获得最佳结果。
除了幻觉问题,LLM基础应用程序提供的响应可能会引发一些问题,如不准确、不当的语言或机密信息泄露。为了解决这些问题,Galileo Studio还引入了新的"防护措施"指标。对于AI模型,防护措施是关于模型可以生成的信息、语气和语言的限制。
对于金融服务和医疗保健等领域的组织来说,存在与信息披露和语言使用相关的监管合规性问题。通过防护措施指标,Galileo用户可以设置自己的防护措施,然后监控和测量模型输出,以确保LLMs不会偏离正轨。
此外,Galileo还跟踪一项被称为"接地性"的指标,用于确定模型的输出是否符合其提供的训练数据的范围。如果一个模型在抵押贷款文件上进行训练,但提供了与这些文件完全无关的答案,Galileo可以通过接地性指标检测到这一情况。这使用户可以知道响应是否与模型的训练背景相关。
Galileo为用户提供了一套全面的指标,使他们能够更好地理解模型的输出并解释其真实性。这些指标不仅有助于发现幻觉现象,还以可视化的方式解释了模型在每个单词基础上的困惑,有助于开发人员优化模型以获得最佳结果。同时,通过防护措施和接地性指标,Galileo还帮助开发人员确保LLMs的输出不会引发问题,如不准确或不合规的响应。
月销破亿,被嘲“美丽刑具”,光腿神器是怎样炼成的?
如果提名今年热度最高的时尚单品,除了精准拿捏大学生的军大衣,让无数女孩疯狂下单的光腿神器一定榜上有名。随着天气逐渐转冷,淘宝、抖音、快手等各平台直播间纷纷上架不同款式、不同价位的光腿神器,吸引无数消费者下单。以抖音为例,据新榜旗下抖音数据工具新抖统计,光腿神器品牌小野和子近30天累计销售额破亿,觅橘、茉寻、她琳talin等品牌的月销售额也均在千万以上。0000首款3K 144Hz OLED平板!荣耀MagicPad 2官宣:还有全新AI护眼功能
快科技7月3日消息,荣耀MagicPad2平板即将在7月12日的旗舰新品发布会上亮相,今天荣耀官方发布了部分屏幕配置信息,称这将是业界首款搭载3K144HzOLED屏幕的平板电脑。根据介绍,这款平板将搭载一块12.3英寸的3K144HzOLED屏,并且支持AI离焦护眼功能,能够根据用户的用眼环境和习惯,智能调节屏幕显示,以减轻视觉疲劳,保护用户的视力。站长网2024-07-03 13:51:470000OPPO Reno12系列核心配置来了:首发天玑双芯 支持红外
快科技5月23日消息,OPPOReno12系列将于今天16:00正式发布,将带来OPPOReno12、OPPOReno12Pro两款机型。目前,该系列核心配置已经揭晓,价格将是最大悬念之一。两款机型均采用6.7英寸120Hz高刷OLED屏,首发OPPO全新形态屏幕等深四曲屏,分辨率为2412*1080。站长网2024-05-24 10:28:170000OpenAI CTO 剧透AGI关键词:十年内出现、极其先进、智能系统
7月初,在约翰霍普金斯大学,资深科技记者、播客Pivot的联合主持人KaraSwisher与OpenAICTOMiraMurati展开了一场火药味十足的对话,计算机科学家、斯坦福大学教授李飞飞也加入了提问阵营,他的另一个身份是Google云人工智能和机器学习首席科学家站长网2024-07-23 14:02:420003爱奇艺龚宇:AIGC加速应用 长视频行业将被颠覆
在2023年的爱奇艺悦享会上,爱奇艺的创始人和CEO龚宇强调,爱奇艺未来的发展主要依赖于两个关键因素:内容和科技创新。他表示,这两个方面不仅决定了爱奇艺的未来,也决定了整个行业的未来。站长网2023-09-21 17:20:420000