一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权站长之家转载发布。
半年时间,月之暗面把 AI 模型支持的上下文长度提升了一个数量级,实现了200万字上下文的「无损压缩」。
一个能读200万字的 AI 助手是什么概念?这意味着,它可以一口气读完整个《甄嬛传》剧本,然后和你讨论剧情。或者一口气读完一本厚厚的中医诊疗手册,给你提出诊疗建议。对于人类来说,成为某个领域的专家可能需要10000个小时的学习,但对于这个 AI 来说,只需要10分钟就够了。
将甄嬛传全集几十万字的剧本传给 AI 助手,然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。它能在不同时间段、各个场景的故事情节中,深入挖掘甄嬛、果郡王的情感线以及他们孩子的真相,堪比一个看了好几十遍电视剧的「甄」学家。
上传一份完整的近百万字中医诊疗手册,这个 AI 助手可以针对用户问题给出诊疗建议。
这是国内大模型创业公司月之暗面(Moonshot AI)刚刚官宣的新突破。他们打造的Kimi 智能助手目前已经支持200万字超长无损上下文,并于即日起开启产品「内测」。
Kimi 智能助手于去年10月份正式亮相,那时就已经能够支持20万字的上下文窗口,是当时全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度(参见《大模型开启「长」时代,杨植麟的新公司把对话框容量做到了世界第一》)。但令人没想到的是,仅仅过了半年,月之暗面就将这一数字提升了10倍。
为什么要死磕超长无损上下文这件事?创始人杨植麟曾经解释说,「通往通用人工智能(AGI)的路上,无损的长上下文将会是一个很关键的基础技术。从 word2vec 到 RNN、LSTM,再到 Transformer,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度…… 上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。」
在实际使用场景中,超长无损上下文带来的好处也是显而易见的。在支持20万字的时候,你就已经能够用它进行专业学术论文的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解 API 开发文档…… 如今,这个数字提升了一个数量级,你能拿它做的事情就更多了。
在媒体沟通会现场,月之暗面展示了一些超长无损上下文的使用场景示例。例如,你可以上传几十万字的经典德州扑克长篇教程后,让 Kimi 扮演德扑专家为自己提供出牌策略的指导。
上传英伟达过去几年的完整财报,让 Kimi 成为英伟达财务研究专家,帮你分析、总结英伟达历史上的重要发展节点。
上传一个代码仓库里的源代码,可以询问 Kimi 关于代码库的所有细节,即便是毫无注释的陈年老代码也能帮助你快速梳理出代码的结构。
也就是说,如果你有一份想要快读学习的资料,你可以把它上传给 Kimi,让它帮助你练习专业技能,或者启发新的想法。如此一来,快速学习任何一个新领域都会变得更加轻松。
不过,有时,这些文本是分布在不同的文档中的,这就需要 AI 助手具备跨文档处理的能力。据悉,Kimi 现在能够一口气精读500个,甚至更多数量的文档,帮助你快速分析所有文档的内容,并且支持通过自然语言进行信息查询和筛选,大大提高了信息处理效率。例如,公司 HR 可以基于业务需求,让 Kimi 快速从最近的500份简历中找出有某个行业从业经历,同时从计算机类专业毕业的求职者,更加高效地筛选和识别合适的候选人。
在技术上,由于没有采用常规的渐进式提升路线,月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能,月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走「滑动窗口」、「降采样」等技术捷径,攻克了很多底层技术难点,才取得了新的突破。
基于这些突破,Kimi 在智能搜索场景也展现出了优于传统搜索引擎的能力。比如,你可以让 Kimi 主动去搜索和对比两家同领域上市公司的最新财报数据,它会根据你的问题,分析和总结最相关的多个页面,生成更直接、更准确的答案。这离不开其背后大模型的无损长上下文能力。具体来说,对于主动搜索得到的多篇资料,Kimi 会作为上下文的一部分交给模型去推理。正是因为 Kimi 大模型支持的上下文窗口足够长,窗口内的信息损失足够低,Kimi 智能助手才能输出高质量的结果,为用户带来截然不同的搜索体验。而传统的搜索引擎通常只能根据用户的问题,返回一些参杂着广告信息网页链接。
另一项与大模型的无损上下文能力息息相关的指标是指令遵循(Instruction Following)能力。指令遵循能力主要体现在两个方面:第一,模型在多轮对话中是否能够始终遵循用户的指令,理解用户的需求;第二,模型是否能够遵循复杂指令,有时候复杂指令可能长达几千、上万字。从产品推出以来的用户反馈来看,Kimi 智能助手的多轮交互和超长指令遵循能力,也同样具备显著优势。
「我们相信,大模型无损上下文长度的数量级提升,也会进一步帮助大家打开对 AI 应用场景的想象力,包括完整代码库的分析理解、可以自主帮我们完成多步骤复杂任务的智能体 Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等等。」月之暗面工程副总裁许欣然在媒体沟通会上表示,「无论是内存、算力还是网络带宽,历史上每一次基础技术的升级,都会解锁新的产品形态和应用场景。我们对200万无损上下文的 Kimi 可以带来哪些超出想象力的创新机遇充满期待。」
据 AI 产品榜(aicpb.com)的统计数据,Kimi 智能助手2月份的访问量已经突破300万。月之暗面也刚刚收获10亿美元的融资,成为估值25亿美元的 AI 独角兽。
如果你也有对超长无损上下文能力的需求,可到 Kimi 智能助手网页版 kimi.ai 首页申请抢先体验。
AI招聘平台「智聘」获百万元种子轮融资 此前已发布ZHIPIN-TLLM大模型
据36氪消息,AI招聘平台「智聘」获得无锡逆熵资本投资的数百万元种子轮融资。智聘「北京爱智聘数字科技有限公司」成立于2023年4月,是一家专注于人工智能技术开发、服务与咨询的数字科技公司。其愿景是采用新一代行业垂直大模型推动全球人力资源智能化转型,打造国内首家智能人力资源平台。站长网2023-06-09 23:45:300000夸克App推出“夸克健康助手”大模型应用
近日,夸克App宣布全面升级其健康搜索功能,推出名为“夸克健康助手”的大模型应用,并在部分搜索结果和功能板块中引入了全新的内容交互方式。据介绍,夸克已经与200多位权威医学专家、60多家全国知名公立三甲医院和40多家医学机构建立了合作关系。这些合作伙伴为夸克提供了丰富的健康内容资源,包括病症原因、用药建议、就医指南等。0000Stable Diffusion「偷」代码建起10亿美元帝国?Stability AI创始人骗局被扒皮
【新智元导读】「借用」他人代码,建起10亿美元帝国?StablityAI创始人EmadMostaque,最近被福布斯「扒皮」了!福布斯在一篇长文中爆料,让StabiliytAI名声鹊起的StableDiffusion,源代码其实是另一组研究人员写的。站长网2023-06-08 06:55:140000Verce发布AI SDK 3.0 推出生成式UI功能
近日,Verce发布了最新的AISDK3.0,此次更新的最大亮点在于引入了生成式UI功能。这一新功能将极大地丰富聊天机器人的交互体验。生成式UI功能的核心在于,它可以让聊天机器人的回答界面更加丰富和生动。以往,聊天机器人的回答通常只包含文字信息,而有了生成式UI功能后,聊天机器人可以直接回复一个功能界面给用户。体验地址:https://sdk.vercel.ai/demo站长网2024-03-04 20:05:480001问界新M5正式发布:售价 24.98 万元起 标配华为高阶智驾
今日,华为余承东在问界新M5发布会上震撼揭晓,全新问界新M5车型正式登场,三款车型闪亮登场,起始售价仅为24.98万元。更令人兴奋的是,5月15日即可批量交付,为消费者带来前所未有的驾驶体验。站长网2024-04-23 17:20:360000