苏黎世联邦理工学院推出 LMQL:一种用于语言模型交互的编程语言
据国外媒体报道,近日来自瑞士的研究人员提出了语言模型编程(LMP)这一前沿概念。通过将语言模型提示的范围扩展到简单的文本提示之外,LMP 提供了两种方法的自然混合。
此外,LMP 允许您限制语言模型生成的结果。这允许语言模型的高度抽象,使其能够轻松适应各种活动。研究人员实施 LMQL(语言模型查询语言)以支持 LMP。LMQL 使用来自 LMP 提示的约束和控制流来生成有效的推理技术,从而减少对底层语言模型的昂贵调用的数量。它们展示了 LMQL 可以轻松捕获各种最先进的提示机制,尤其是那些促进交互式流程的流程,而这些流程很难用现有的高级 API 来实现。
检查表明,它们保持或提高了各种下游活动的准确性,同时大大减少了计算时间或财务支出(在付费使用 API 的情况下)。
由于其声明性性质,LMQL 仅指定任务所需的结果,并将逻辑控制流的细节留给另一种语言。它借鉴了 SQL 的思想,但构建在 Python 之上。用户可以向模型提供文本和可编程问题。
该报告确定了该语言语法的五个主要组成部分。解码器的工作是找出文本生成算法背后的秘密。它是一些将数据转化为有用的东西的代码,比如更高质量、更多样化的措辞。
与语言模型交互的基本工具是 Python 语法编写的 Query 块。查询块顶层的每个字符串代表一个单独的查询。查询的目标模型在 Model/from 子句中标识。这指定了生成文本的语言基础,另一方面,Where 子句允许人们设置控制结果的参数。它指定语言模型必须生成什么来维持必要的属性。
LMQL 用户可以对语言模型生成的结果设置复杂的逻辑约束。令牌级预测掩码是根据这些约束自动生成的,因此可以在文本生成一开始就严格执行它们。因此,可以仔细执行各种约束,并且模型将仅生成满足标准的内容。由于改进的输出格式保证,多部分提示和集成变得更加容易。
主要贡献
本研究的作者已经发现并解决了当前 LM 提示方法的几个问题,他们引入了语言模型编程的创新范式。脚本化提示和输出限制是 LMQL(一种 LM 高级查询语言)提供的两个功能。对最终和后续抽象的正式描述,用于急切的部分评估语义。这样,仅给出一些一般准则,就可以自动生成用于 LM 解码的模型特定标记掩码。对 LMQL 的全面分析展示了如何将各种基本和复杂的提示方法表达为简短、易于理解的 LMQL 程序,由于 LMQL 能够将推理成本和执行时间降低多达80%,因此运行速度更快、更准确。
研究人员所做的案例研究表明:
LMQL 的高水平表达能力意味着许多现代、最先进的技术可以用比基于 Python 的同类技术少得多的代码行来实现。使用 LMQL 大大提高了模型查询的数量,从而大大提高了效率和运行时间。得益于 LMQL 的令牌级验证功能,人们可以动态地强制执行约束,而无需采用逐块解码和回溯。LMQL 对模型的准确性没有影响。在某些情况下,施加的限制会导致精度稍微提高。
此外,研究人员还证明,由于观察到计费代币的减少,在付费、API 门控模型中使用 LMQL 可以节省大量资金。最后,他们指出这些案例研究与 LMQL 的综合用户研究是分开的,其中语言的影响和可用性是与现实世界的提示工程师一起评估的。重要的是要记住,缺乏这样的研究会威胁到实用性主张的可信度。
总之,专家们将语言模型编程视为与(巨大)语言模型交互的一种新方法。引入了 LMQL,一种语法简单的高级查询语言。LMQL 的评估语义得到了高效开发,可实现快速查询处理。他们通过案例研究证明了自己的观点,展示了如何将复杂的提示方法转化为简单、清晰、快速的 LMQL 代码,从而可以将计算费用削减多达80%。
三星电子确认第五代 HBM3E 产品命名为「Shinebolt」:为下一代 AI GPU 铺平道路
站长之家(ChinaZ.com)10月19日消息:HBM3e在行业中的意义是巨大的,因为它将为下一代AIGPU铺平道路,而这对于实现高计算性能至关重要。据BusinessKorea报道,三星电子已确认将其第五代HBM3E产品命名为「Shinebolt」。随着三星加快HBM3E的开发和营销,预计它将紧随该领域的领先者SK海力士。站长网2023-10-19 16:40:050000美团外卖加大直播投入 邀请明星带货
据报道,5月19日,美团外卖举办了一场神券节的官方直播活动,邀请了明星和艺人参与直播间带货。据了解,参与活动的品牌商家中,茶百道整体交易额已超过一亿;奈雪的茶订单量较上周增长了173%,品牌新客数量增长了249%;麦当劳订单量较上周增长了52%,品牌新客数量增长了153%。站长网2023-05-19 18:15:170000小米澎湃OS全新标识发布 人车家全生态正式闭环
小米创办人董事长兼CEO雷军,在微博上分享了两个重要信息。首先,小米澎湃OS启动了新标识,将以全新的形象与大家见面。其次,随着即将发布的小米汽车,小米的“人车家全生态”正式闭环,迎来了“跨越”一刻。小米澎湃OS的新标识以“星系迸发”为设计理念,表达为中心旋开的点阵。这种设计让点阵中的人与设备都以鲜活的形态,在澎湃宇宙中完成感应与连接。站长网2023-12-27 13:55:040002消息称谷歌正在测试一款利用AI技术制作新闻报道的产品
据纽约时报报道,知情人士透露,谷歌正在测试一款利用人工智能技术制作新闻报道的产品,向包括《纽约时报》《华盛顿邮报》和《华尔街日报》母公司新闻集团在内的新闻机构推销。知情人士称,该工具在内部被称为“Genesis”,可以获取信息--比如时事细节--并生成新闻副本。知情人士表示,谷歌认为它可以作为记者的个人助理,自动完成一些任务,从而为其他人腾出时间。站长网2023-07-20 16:17:560000人工智能模型透明度评估:Llama 2位列第一,GPT-4透明度不佳
要点:1.十大主流AI模型的透明度正在受到关注,其中Llama2在透明度评估中位列第一,而GPT-4等模型的透明度不佳。2.斯坦福大学、MIT、普林斯顿大学等团队提出了“基础模型透明度指数”,对十个主流模型的透明度进行评估,结果显示透明度普遍不高。3.尽管有开源模型如Llama2等获得较高评分,但整体而言,AI行业的透明度不足,对模型构建过程、数据来源和劳动力等关键方面缺乏透明。站长网2023-10-21 10:26:110001