2023年AI行业大事件盘点:从GPT-4到百模大战,从AI孙燕姿到OpenAI“宫斗”大戏
最近GPT商店正式上线,AI玩家们又热闹了起来,钻研着怎么做个GPT上架赚钱。
自从ChatGPT引爆大模型热潮,2023年,在全球范围内,生成式AI技术的突破和应用不断刷新着我们的认知。从大型语言模型的迭代升级到多模态AI、Agent的兴起,再到AI在各个行业的深入融合,AI领域的竞争愈发激烈。
在国内,各大科技公司纷纷推出自家的AI产品,掀起“百模大战”,众多AI创业者开始“卷”AI创新应用,政策层面也逐步完善对AI技术的监管和引导。
制图:NUPD
“头号AI玩家”按时间整理了2023年AI行业大事件,并从中选出十大热门事件,在下文展开回顾。以OpenAI为代表的海外AI玩家正引领着AI技术的前沿发展,国内这些内容平台的AI功能虽然在应用范围和讨论热度上不及头部产品,但考虑到平台的用户规模和在国内的影响力,这些依然是值得注意的尝试。
AI行业日新月异,随着AI技术的不断成熟,我们将看到更多AI原生的应用玩法,AI也将更加深入地融入我们的日常生活,从工作助手到生活伙伴,从内容创作到决策支持,AI会逐步成为推动社会进步和创新的重要力量。
史上最强大模型GPT-4登场
2023年3月15日,OpenAI发布大型多模态模型GPT-4,可以接收图像和文本输入,输出文本,虽然它在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上与人类水平相当。
GPT-4博客地址:https://openai.com/research/gpt-4
GPT-4技术报告地址:https://cdn.openai.com/papers/gpt-4.pdf
相比上一代GPT-3.5,GPT-4拥有更广的知识面和更强的解决问题能力,在创意、视觉输入和长内容上的表现也都更好了。
GPT-4能理解梗图
GPT-4能根据草图快速生成网页HTML代码
附OpenAI重要发布时间线:
2022年11月,OpenAI悄然发布GPT-3.5,ChatGPT随之推出
2023年2月,ChatGPT Plus订阅计划推出,每月20美元起
2023年3月,ChatGPT API、GPT-4、ChatGPT插件先后发布
2023年5月,免费的ChatGPT iOS应用程序上线,支持语音输入
2023年7月,ChatGPT新增“自定义指令”功能,安卓版ChatGPT上线
2023年8月,ChatGPT Enterprise推出
2023年9月,OpenAI发布DALL-E3,并将其集成至ChatGPT
2023年11月,OpenAI在DevDay上发布GPT Builder、GPT-4Turbo、Assistants API等更新
百度发布文心一言,打响“百模大战”
随着ChatGPT的一鸣惊人,互联网大厂、科研机构、AI创业公司等国内玩家纷纷上场,开启了“百模大战”。
2023年2月7日,百度宣布在筹备大模型新项目——文心一言(英文名ERNIE Bot),到了3月16日,文心一言开放测试,展示了在文学创作、商业文案创作、数理推算、中文理解和多模态生成五个场景中的表现,打响了国内大模型竞赛的第一枪。
文心一言官网
其基础模型文心大模型在10月升级到4.0版本,同时,百度发布了全线重构的新搜索、新地图等十余款AI原生应用。截至2023年12月底,文心一言的用户规模已突破1亿。
百度创始人、董事长兼首席执行官李彦宏被《时代》周刊评为“全球AI领袖”,他预言:“我们即将进入一个AI原生的时代。”在12月16日举办的极客公园创新大会2024上,他再次强调“卷AI原生应用才有价值,大模型进展对大多数人不是机会”。
AI孙燕姿席卷华语乐坛
2023年5月,“AI孙燕姿”惊艳出道,网友用AI音色转换技术Sovits4.0(全称So-vits-svc)训练复刻了她的嗓音,翻唱起周杰伦的《发如雪》、云南山歌《朝你大垮捏一把》等歌曲,B站相关视频播放量累计超千万。
不过,这类合成的AI歌手存在侵犯版权的风险,比如未经授权使用他人的声音素材训练生成AI音频并发布,涉嫌构成著作权侵权。
孙燕姿本人的回应将事件推向新的高潮,她说:“你跟一个每几分钟就推出一张新专辑的人还有什么好争的。”
她认为,AI耸现并将威胁到成千上万个由人类创造的工作,包括唱歌,“讽刺的是,人类无法超越它已指日可待”,“你并不特别,你已经是可预测的,而且不幸你也是可定制的”。
从积极的角度看,生成式AI的发展使AI音乐制作和翻唱的门槛进一步降低,平台也开始与创作者拥抱AI,将AI音乐规范化,比如YouTube和Charlie Puth、Troye Sivan等歌手合作测试Dream Track功能,可以模仿歌手风格生成音乐片段。
妙鸭相机爆火,AI写真产品兴起
2023年7月17日,妙鸭相机小程序正式上线,迅速在朋友圈刷屏。
用户只要上传一定数量的照片,选择好模版,就可以一键生成AI风格化写真,包括证件照、艺术照等。虽然首次生成需要支付9.9元的数字分身制作费,但爆火初期仍有上千人深夜排队等待生成。
妙鸭相机出自阿里大文娱团队,阿里内部评价它为“国内AIGC领域第一个爆火的C端产品”。此后国内涌现出诸多同类AI写真产品,B612咔叽、美图秀秀、轻颜相机等APP也有类似的AI写真/头像功能。
这类工具型产品要面临的难题是如何在竞争中维持住热度,持续吸引更多的用户。妙鸭相机在之后几个月内不断上新写真模板,其中一部分与品牌合作联名,此外还推出了发型设计、AI修脸、拍合照的新功能,并和阿里系其他业务进行联动,比如冠名综艺《这就是街舞6》。
《生成式人工智能服务管理暂行办法》公布
过去一年,“狂飙”的AIGC产业迎来了国家级规范性政策。
2023年4月11日,国家网信办就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见,我们在第一时间进行了重点解读。7月,《生成式人工智能服务管理暂行办法》(以下简称《办法》)公布,自8月15日起施行。
《办法》提出国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。
对于生成式AI领域的监管问题,全球各国都处于探索之中。《办法》是中国立法者的一次先行“试水”,为后续更为全面、细致的立法工作做了铺垫。目前人工智能法已被列入我国2023年立法计划,这意味着未来AI统一监管立法已提上日程。
更聪明的AI画图神器:DALL·E3 ChatGPT
DALL·E3是OpenAI在2023年9月推出的AI绘图模型,原生构建在ChatGPT之上,用户可以在对话中将自己的想法转化成准确的图像,甚至还能画出正确的文字。
用户问ChatGPT“我5岁的孩子说的超级向日葵刺猬,它应该长什么样子”,ChatGPT立马写了四段不同风格的提示词,并生成对应图像
对于不擅长写提示词的普通玩家来说,这一改进大大降低了AI绘画门槛。
与Midjourney相比,DALL·E3的交互式绘图比较直观方便,能直接读懂大段文字自动作图。而且与OpenAI深度合作的微软已将DALL·E3集成在Bing中,可以免费使用。
从被苹果扫地出门到王者归来,乔布斯花了12年时间。而AI时代的“乔布斯”只用了4天。
美国时间2023年11月17日午间,OpenAI突然宣布领导层换届,首席执行官Sam Altman被开除了,因为他“在与董事会的沟通中始终不坦诚,阻碍了董事会履行职责的能力”。
消息一出,震惊整个AI圈。这场闹剧之后经历了几次反转,上一秒Sam Altman回到公司谈判,似乎有望重返OpenAI,下一秒微软就宣布Sam Altman及其同事将加入微软,领导一个新的AI研究团队。最终Sam Altman还是在众多同事的支持和微软的推动下回来了,董事会成员大换血,新增一名无投票权的观察员——微软副总裁Dee Templeton。
目前这场高层震荡的起因依旧众说纷纭,不过OpenAI的发展已回到正轨,正式发布GPT商店,不断构建AI商业生态。
Pika1.0发布,AI视频元年来了
2023年11月28日,AI视频生成产品Pika1.0发布,官宣推文浏览量1天内就破了一千万。
Pika内测版支持输入文字或图像来生成各种风格的视频,此次Pika1.0新增局部实时重绘、扩展视频尺寸等功能,效果不输Runway Gen2,甚至在易用性、3D动画生成上更胜一筹。
我们也尝试用ChatGPT、Pika等AI生成工具创作了一条圣诞动画,对于没有专业学习过动画制作的爱好者来说,现在AI可以帮助实现7、8成的故事脚本了。
Pika一夜爆火,而令人惊讶的是其团队只有4个人,创立6个月就在Discord上吸引了50万用户,公司估值超2亿美元。
目前AI视频生成领域的动作进展较快,不乏新玩家入局,除了Pika,还有Meta发布了Emu Video,Stability AI发布了首个AI视频开源模型SVD,Midjourney也即将发布视频生成模型。
《纽约时报》起诉微软和OpenAI侵权
这或许是OpenAI史上最难的AI版权诉讼。
2023年12月底,《纽约时报》因版权侵权起诉微软和OpenAI,220000页附件,罗列了多达100个铁证,证明ChatGPT输出的内容与他们的新闻内容几乎一模一样。
👈左边为GPT4的输出,右边为《纽约时报》的新闻👉
为此,《纽约时报》要求OpenAI和微软销毁侵权材料的模型和训练数据,并对非法复制和使用《纽约时报》独有价值的作品造成的“数十亿美元的法定和实际损失”负责。
OpenAI发布公告回应称,公司使用公开的互联网材料训练人工智能模型是合理的,OpenAI已提供了退出的选择。并指出,《纽约时报》没有讲述完整的事实,暗示AI“抄袭”原文的情况是故意操纵提示词,让模型“反刍”(Regurgitation)的结果。
AI模型和训练数据的版权之争颇受关注,此次诉讼或将成为影响AIGC领域走向的重大事件。
结语
通过以上精选的重要事件,我们回顾了2023年AI行业的蓬勃发展,我们有理由相信,2024年将有更多激动人心的技术创新和应用落地。
“至少在未来的五年或十年内,这项技术将处于一个非常陡峭的成长曲线上。现有这些模型都将变成最愚蠢的模型。”正如Sam Altman最近在访谈中所说的,多模态、可定制性和个性化很重要,AI还可以做更多复杂的事情,真正提升生产力。
AI将继续在内容创作、医疗健康、教育等多个领域发挥其潜力,同时,随着AI技术的不断进步,我们也将面临新的挑战,包括伦理、隐私和安全等问题,我们需要尽快适应并确保让技术的力量服务于全人类。
MathVerse:全方位可视化数学基准,对多模态大型语言模型进行公平和深入的评估
划重点:🔍MLLMs在视觉情境下的表现异常出色,但解决视觉数学问题的能力仍需全面评估和理解。🔍MATHVERSE提出了一个创新性的基准,旨在严格评估MLLMs在解释数学问题中的视觉信息理解能力。🔍研究发现大多数现有模型需要视觉输入来理解数学图表,甚至可能表现更好,这表明需要更先进的数学专用视觉编码器。站长网2024-03-26 17:37:300000如何区别BI、大数据、信息化和数字化转型
商业智能BI可以实现业务流程和业务数据的规范化、流程化、标准化,打通ERP、OA、CRM等不同业务信息系统,整合归纳企业数据,利用数据可视化满足企业不同人群对数据查询、分析和探索的需求,从而为管理和业务提供数据依据和决策支持。站长网2023-05-25 01:28:310000雷军:我当上金山CEO不是我厉害 是武大赋予我的勇气
6月20日,在武汉大学2023年毕业典礼上,小米CEO雷军代表优秀校友发言。他表示,他在28岁成为金山集团CEO并不是因为自己本身有多么厉害,而是因为每次做出决定时,他都受到了武大赋予的勇气。雷军说,在武汉大学的几年里,他学到了一项非常重要的能力,就是学习能力比知识更重要。他还鼓励武汉大学的学生们,无论何时何处,都要始终保持自信。站长网2023-06-21 14:36:180000贝莱德减持英伟达和谷歌 增持苹果持仓总市值达 2016 亿美元
据全球最大资管之一贝莱德(BlackRock)公布的13F文件显示,二季度贝莱德再度增持苹果,数量为463万股,为其Q2最大增持个股,持仓总市值来到2016亿美元。亚马逊、Meta、特斯拉也分列增持榜前几位。站长网2023-08-14 10:14:400000DialMe:一个自动化面试平台
DialMe是一个旨在改善面试流程的革命性平台。DialMe的目标是摆脱传统的文字填写表格方式,而是通过人工智能引导真实对话,为您提供深入的见解。不再让人们感到无聊,让AI引领对话,让您更快地了解应聘者或受访者。站长网2023-09-25 18:15:070000