AI正在改写互联网,也在改变「生产力」
不久前,iOS 上一个第三方 ChatGPT 客户端「OpenCat」支持了键盘扩展,用户可以在任意 App 中使用 ChatGPT 的回答进行快速的输入。新特性上线后,用户就在不同的场合进行尝试:在购物 App 中用来生成好评、在微信聊天中生成回复、在社交网络上用它「对线」。
技术社区 Hacker News 上还有用户指出,一家网红营销机构网站上的一篇博文中,出现了「抱歉,作为一种 AI 语言模型,我无法预测未来的事件或趋势」的提醒,类似的话语还出现在卡塔尔的购物中心目录和芬兰的一家电子产品商店的网站等地方。
IBM 公开表示要暂停数千个岗位的招聘计划,因为这些岗位可能在未来几年被 AI 取代;一些小公司裁掉了客服和文案团队;还有人用说唱歌手 Drake 的声音生成新的音乐作品,即便你不了解 Drake 在全球乐坛和潮流文化中的影响力,也一定在各种梗图或迷因中看过这个身穿羽绒服的男人。
这些都只是生成式 AI 改写互联网的一角。从文本生成图像的 DALL-E、Midjouney、Stable Diffusion 到 ChatGPT,生成式 AI 在全球范围内引起的浪潮还在愈演愈烈。
与其同时,也有很多人已经主动将 AI 用于改造或是优化自己的工作流程,并且越来越多的办公软件开始陆续引入生成式 AI,微软 Office、印象笔记、WPS、钉钉,还有飞书、谷歌 Workspace 等,所有人都不想放过生成式 AI 的机会,也不想失去先机。
AI 正在改变我们这个时代的「生产力」。
AI 在生成
就在4月18日,印象笔记、WPS、钉钉三家同日官宣接入 AI 助手,飞书也宣布即将推出 AI 助手「My AI」。而在稍早前,微软带着 Microsoft365Copilot 而来。紧随着搜索引擎,办公软件也在大规模进入 AI 应用的阶段。
与搜索场景不同,办公软件核心的一块使用场景在于内容生成,这恰恰也是这一轮技术周期中 AI 最擅长的能力之一。
笔者体验了率先落地并实现大规模商用的「印象AI」,在印象笔记内,用户选择合适的「模板」之后只要输入想写的内容或主题,AI 就会自动生成相应的内容和样式,比如活动方案、产品需求评议会、工作日报等,再根据自身的实际情况进行更改和调整即可。当然,用户也可以基于主题和背景让 AI 写一份提纲,或是写一篇新闻稿和文章。
很多情况下,AI 生成的内容都很难「一次通过」,普遍需要用户进行手动调整,不管是针对生产内容的直接改动还是对提示词的修改。但相对而言,AI 能以极高的效率完成人类的一部分工作,也极大地提高了使用者的生产力。
另一方面,AI 的引入,更大的意义在于人机交互方式的变革。我们一般通过各种软件与机器沟通,而软件的进步由交互方式的进步所牵引,从早期的字符界面,到后来的图形用户界面,现在我们可以直接通过自然语言与机器进行对话以及操作。
在4月中旬的那场发布会上钉钉总裁叶军坦言,钉钉的产品非常臃肿,但智能化给了一个机会去实现换道超车。金山办公CEO 章庆元也说,Office 一直是很复杂的,很多功能的学习成本很高,AI 能大幅降低使用门槛。
当人机交互从图形用户界面向自然语言迁移,不仅意味着未来软件设计的颠覆,过去以图形用户界面为基础开发的软件也获得了一次新生的机会。尤其是在办公软件上,过去随着迭代不断加入新的功能,虽然满足了用户在功能上日益增长的需求,但长此以往也造成软件的繁重和复杂,表现到实际体验上就是用户要面对大量的选项、功能以及学习成本。
这也是笔者为什么一向对 Office 类软件敬而远之,反而更倾向于更多功能简单的软件。但 AI 的引入以及新的交互方式可能改变一切,用户不需要再去跟着教程学习复杂的软件使用方法,在一个又一个选项层次中寻找可能需要的功能,AI 不仅能通过自然语言理解用户需求,还能直接满足需求。没有多少人能够拒绝。
人类在思考
毫无疑问,目前 AI 的底层基座和软件应用还处在快速变化的早期阶段,各家都在探索新的技术和应用。印象笔记副总裁、产品负责人刘璨说,印象 AI 并不局限于写作这一单一场景,未来还会扩展到知识管理的各个环节,从信息的收集,到理解分析和组织连接。
实际上,除了辅助用户生成文字内容,印象 AI 已经支持在「扫描宝」上对 PDF 文件进行智能分析,并以对话形式呈现分析结果。按照刘璨的说法,后续其他产品如印象笔记也会支持 PDF 及其他文档的分析理解,包括用户剪藏的长文章,此外还会考虑引入多模态的数据和支持。
而包括印象笔记、出门问问以及金山办公等公司在内,都在指出了个人专属 AI 助手的发展可能。印象研究院院长常诚告诉我们,印象 AI 未来一个可能的发展方向就是结合印象笔记作为知识管理产品的定位,让每一个用户可以选择用私人语料训练和部署自己的专有语言模型。
未来每个企业甚至每个人都可能拥有一个专属的大语言模型,AI 会在大模型的基础上,对用户过往的私人数据进行差异化处理,提供给每个用户更个性化、更准确的回答和服务。
但 AI 技术会走向哪个路线?AI 应用又应该是什么形态?现在即使抛给人工智能方面的专家,大概也会出现很多截然不同的观点,因为没有人可以笃定,也因为 AI 的进化太快、太大。
就算在当下,办公软件们对于大模型发展路径也莫衷一是。有些 AI 助手直接接入了OpenAIGPT-3.5、百度文心一言等通用大模型,另一些 AI 助手则选择自研的发展道路。比如印象 AI 就是印象笔记自研的轻量化大模型大象 GPT,在 BLOOM、OPT 等开源大模型的基础上,引入了自行加工的指令数据集,并针对自身的用户场景进行了微调。
区别于接入通用大模型,自研大象 GPT 可以针对核心的知识管理场景进行更深入的针对性调整,同时也能基于用户的提示文本以及使用反馈持续地迭代,再将这些改进积累到大象 GPT 之中,以此形成独特的优势。不过,印象 AI 后续也不会排除在合规的前提下接入国内外的通用大模型。
就像常诚指出,AI 的迭代速度之快,三年后的发展就很难想象,百度集团总裁、奇绩创坛创始人陆奇也说跟不上技术的发展速度,论文和代码都看不过来。
我们也要看到,这场办公软件的 AI 变革不过才刚刚开始,已经接入大模型能力的软件还在探索 AI 的应用可能,而更多的办公软件公司也在研究如何接入大模型能力。在不远的未来,AI 会更广泛、更深远地改变我们这个时代的生产力。
智源研究院推出text-to-3D生成模型 GeoDream
近日,智源研究院联合清华和北邮团队推出text-to-3D生成模型GeoDream,能够将输入的文字描述转化为高质量和多视角一致性的3D资产。与传统的方法不同,GeoDream通过解耦的方式利用2D和3D先验,解决了3D结构不一致性的问题,并支持导出高保真的texturemeshes和高分辨率的渲染图片。站长网2024-01-16 10:08:170000苹果正式发布首个空间计算设备 Vision Pro 和全新 visionOS 系统
苹果公司今天正式发布了首款混合现实头显设备「VisionPro」以及全新的设备操作系统visionOS。站长网2023-06-06 16:24:440000苹果再次妥协:iPadOS 18开放侧载
快科技6月25日消息,苹果正式上线iPadOS18Beta2,在新版iPadOS中,苹果在欧盟开放侧载。和iOS侧载情况类似,苹果允许用户在iPad上使用第三方应用商店,允许使用第三方支付、第三方浏览器引擎等等。0000阿里推AtomoVideo文本+图片生视频模型,媲美Gen-2和Pika
划重点:1.🌐AtomoVideo介绍:阿里技术团队推出的文本图片生成高保真视频模型,通过简单的文本提示和高清图片即可生成逼真高清视频。2.🚀技术创新:AtomoVideo融合多粒度图片注入和时间建模,利用VAE编码器和CLIP编码器提高细节信息和文本语义的一致性,同时在时间维度上进行创新以学习时序动态模式。站长网2024-03-11 09:12:530002微信视频号、小程序支持数字人民币支付
微信宣布,即日起,微信用户可以在数字人民币APP内的钱包快付功能下开通“微信支付”,选择将任意运营机构——如微众银行(微信支付)——的钱包推送到微信支付,就可在视频号、小程序场景内支持数字人民币的商家中使用数字人民币进行交易。目前,支持数字人民币支付的小程序商户已覆盖出行、餐饮、零售、便民服务等众多场景。微信表示,下一步更多小程序商家也将陆续支持使用数字人民币。站长网2023-04-26 10:26:290000