GPT商店已至,AI的爆款应用还有多远?
什么,还必须要关注“技术”想要什么。
昨天凌晨,整个AI界发生了一场地震,在被视为“首届AI春晚”的OpenA开发者大会上,GPT-4进行了史诗版本的更新。
128K的超长上下文、成本更低的tokens、全新的Assistants API、新增的多模态功能以及文本转语音(TTS)技术,都让新版的 GPT-4Turbo 模型变得性能更强大,同时也更具扩展性。

图源备注:图片由AI生成,图片授权服务商Midjourney
然而,除了上述功能外,最令人惊艳的,莫过于GPT商店的问世。

CEO山姆·奥特曼现场登台演示,全程不到3分钟,无需任何编程操作,只需在对话框内告诉GPT自己的需求,一个“创业导师GPT”就应运而生。
是的,所有想实现的功能,都能通过聊天构建!

不仅如此,OpenAI还宣布,GPT商店将在本月晚一点的时候推出。
这意味着,任何人都能靠制作专属GPT来赚钱了!
此言一出,网友即刻群起沸腾,并纷纷惊觉:AI的致富之路,真的对所有人敞开了!

那么,在这种百花齐放的应用生态中,AI时代的爆款应用,是否会就此诞生?而由此催生的应用生态,又将打造怎样庞大的市场?
1
如何建立壁垒?
自从互联网时代以来,几乎每一次技术的迭代,都会造就一批爆款。
而总结这些爆款的特征时,人们往往会发现如下的共同点:
它们不仅有长期的留存率,能构建商业模式,且有一定的护城河。虽然当时很难估算市场规模,但未来可能就是千亿美金的公司,可遇不可求。
例如移动互联网时代的抖音,就是个典型的例子。
而现在,GPT商店的推出,无疑为这类AI时代的“抖音”,提供了诞生的土壤。
然而,兴奋过后,冷静下来的人们也发现了个问题,那就是:在目前OpenAI打算构建的GPT商店 中,那一个个上架的应用,刚需点和壁垒究竟何在?
是的,无门槛的开发,意味着人人都能上,可既然人人都能上,那谁又会为别人制作的GPT而付费呢?
大家想要什么功能,自己做不就完了吗?
为了解开这一悖论,我们有必要对当前GPT商店所构建的这种UGC生态,与前AI时代的UGC生态进行一个对比。

如果说,要想在前AI时代,为GPT商店的这种UGC模式,找一个最接近的例子,那恐怕最先入选的,就是以Roblox、蛋仔派对为代表的各种游戏类UGC社区。
在Roblox中,用户可以使用平台提供的易用的编辑工具,创建游戏场景、角色和道具,并将这些游戏资产发布到平台上,供其他用户玩耍、购买。
在这样一种生态中,所有的玩家,都是基于同一个平台或工具进行创作,谁也不会比谁拥有更多先天的、硬性的优势。

这样的特点,与GPTs通过对话创建专属GPT,从而抹平用户创作门槛的做法,几乎如出一辙。
而且由于“玩法”、“创意”之类的东西是抽象的,是依赖于用户灵感,而非知识、技能的,因此在Roblox这类UGC社区中,所谓的“壁垒”从根本上说是没有的。
可既然没有壁垒,为何人们仍然愿意为其他玩家/用户创作的内容付费?而不是自己创作?
其实原因很简单,因为在这类UGC生态中,用户创造的内容,是一种“易学难精”的东西。
换句话说,表面上看人人都可以创造,但精品的、高质量的内容,却很难复制。
具体地说,在这类UGC社区中,用户/玩家虽然可以使用游戏内的编辑器,创造出各种道具、地图等虚拟物品,但真正受欢迎的、爆火的内容,往往需要付出很大的心血,或是需要天才的构思。
于是乎,最后懒得细细打磨的人,就会选购买别人创作好的、现成的游戏内容。

然而,尽管Roblox这样的UGC模式,给将来GPT商店上的创作者提供了一个启示,但它同样有回答不了的问题,那就是:
Roblox这类平台,终归是个以娱乐为主的游戏平台,而游戏是不讲究“实用性”的,只要做得有趣,即可让人掏钱。
但在GPT商店这种明显带有工具性、实用性的平台上,各类基于GPT的应用,该怎么找到自己的“刚需”点呢?
2
“刚需”的误区
很多人在讨论大模型(LLM)与“刚需”问题时,往往会陷入一个误区:那就是以当下的、静止的视角,来看待人们对LLM的需求。
实际上,如果用“刚需”的逻辑来看待当初的抖音、快手,那它们根本就不应该存在。
因为以当时的标准来看,它们根本就不“刚需”。
其实,所谓的需求,不是一成不变的,今天很多理所当然的“刚需”,也不是当时就产生的。
它本质上是一个随着技术逻辑运动,而不断发展的结果。
具体来说,抖音、小红书这样非工具性、非刚需的APP之所以会出现并爆火,本质上是移动互联网技术逻辑的一种运动结果。
在移动互联网的技术逻辑中,最重要的有两点,一是便捷性,二是个性化。
便携性,使得用户可以随时随地访问互联网,获取信息。
这种情况下,用户的时间变得更加碎片化了。在等待、通勤、休息等场景下,用户希望利用碎片时间进行娱乐、学习或购物等活动。
于是,人们使用手机等移动设备的需求,开始变得越来越多样了。那么,面对如此多样的内容,用户该如何选择?
这时,推荐算法和大数据登场了。
移动互联网的普及,使得用户在移动设备上产生了大量的数据,这些数据为推荐算法和大数据分析提供了丰富的数据来源。
通过对这些数据的分析,各大APP可以更好地了解用户的兴趣和需求,从而提供个性化的内容和推荐。
于是乎,在便携性和个性化两大技术逻辑的推动下,抖音、小红书这些爆款APP就诞生了。
它们可以说是移动互联网技术逻辑的一种终极体现,必然结果。
由此可见,在分析某种新兴技术是否能满足“刚需”时,我们除了关注“人”想要什么,还必须要关注“技术”想要什么。
那么,按照这样的逻辑,今天以ChatGPT为首的LLM,究竟想要什么呢?
从最近大半年LLM的发展趋势,以及昨日OpenAI发布会的情况来看,目前的LLM,至少显现出了两大越来越明显的倾向:
一是想“看”到和“听”到更多,即多模态方向的发展;
二是想与更多的“同伴”协作,即智能体(Agent)方向的发展。
而这两大愈发明显的倾向,就构成了未来LLM发展的两大技术逻辑——信息融合和自主决策。

信息融合,意味着LLM可以通过融合多种模态的信息(如视觉、听觉等),实现对跨模态、跨领域任务的深入理解,从而更好地胜任不同场景的需求。
而自主决策,则通过多个智能体之间自动化的协作、配合,使LLM能实现在复杂环境、任务中的自主决策和行动,从而大大地解放了人类的时间、心智。
正如移动互联网的诞生,催生了碎片化时间的场景一样,上述两大逻辑的演化和推进,也终将催生出一些人们从来没见过的,新的场景与需求。
3
可能的应用形态
在自主决策和信息融合催生的新场景与需求中,最能代表其本质的,就最有可能产生新时代的“抖音”。
从上述技术逻辑的特点来看,至少有两个方向的需求,可能性是最高的。
一是个性化的智能助理。
由于多模态技术的存在,这样的智能助理,将很有可能脱离单一领域,或单一模态的限制,从而最大限度地深入人们的生活。

举例来说,如果某人使用了某个翻译类的GPT,那么该用户也许在翻译之外,还希望该应用兼具机票预订的功能,帮跨境出行做好准备,又或是在此基础上,成为一个智能的跨境电商的助手,对比不同国家、地区的商品。
第二个方向的需求,则是智能决策支持
如果一种技术,用与不用有很大区别时,它就会逐渐成为一种“刚需”。而智能决策,也许正在创造这样的需求。
自动化的智能体系统,最大的意义,不在于让打工人每天节省那么几个小时的时间,干些批量处理文档之类的“牛马活”,而在于其通过快速、高效和多角度的分析,为用户提供“单一大脑”所难以得出的洞见。

例如,最近一家名为Fantsy的企业,就用了类似于ChatGPT和Bard的机器学习技术,创建了一些具有详细背景和思想、性格的智能体,让它们在虚拟的小组中进行讨论,从而对尚未发布的产品进行评估。
同样的,类似的技术思路,也可以用于个人的财务规划、职业规划中,从而为个人在现实中的生活、工作,提供高质量的辅助决策。
综上所述,GPT商店的出现,虽然为各类AI应用的繁茂生长提供了土壤,但所谓“爆款应用”,却并非完全靠人为的、主观的“穷思竭虑”就能想出来的。
所谓爆款的诞生,本质上仍然要遵从技术发展的一般规律,唯有参透了这样的规律,并在此基础上思考、构建产品,才能长久地在智能时代扎下根脉。
小米眼镜官微上线:智能眼镜赛道要爆发
快科技2月6日消息,有网友发现,小米眼镜官微已经上线,认证主体为小米通讯技术有限公司。据悉,小米首款AI眼镜已经获得入网许可,型号是M2442G1,爆料称这款设备原定于2025年3月至4月发布,现提前至2月,与小米15Ultra同台亮相。关于小米AI眼镜的具体细节暂时不得而知,考虑到小米会在月底举办发布会,相信小米AI眼镜很快就会官宣。站长网2025-02-07 02:59:110000微软Edge将使用AI实时翻译你观看的YouTube视频内容
划重点:⭐微软Edge将推出实时翻译功能,可在观看YouTube等视频时进行实时翻译⭐该功能将支持多种语言和多个视频网站⭐翻译将在用户设备上完成,不会离开用户设备或在云端处理站长网2024-05-24 10:09:050000Semafor记者将利用人工智能来策划新闻
Semafor希望通过让记者使用定制的人工智能搜索工具来策划更多新闻,使其主页更有价值。Semafor编辑BenSmith于2023年4月10日在纽约市举行了Semafor媒体峰会上的发表演讲。在网络上构建新闻产品再次成为热潮,随着社交流量下降和搜索引擎调整,出版商们开始重新关注他们的网站作为目的地。站长网2024-02-06 09:36:250000Meta 发布新型「类人」人工智能图像生成模型「I-JEPA」:填补图像缺失部分更准确
Meta周二宣布,将向研究人员提供一种新的「类人」人工智能模型的组件,该模型可以比现有模型更准确地分析和填补未完成的图像。图片来自Meta该名为I-JEPA的模型利用对有关世界的背景知识理解来填补图像中的缺失部分,而不仅仅是像其他生成型AI模型一样只关注图像附近的像素。站长网2023-06-15 09:55:320000首个ChatGPT版网站开发平台dora AI上线,输入文本3分钟生成一个网站
要点:1、首个生成式AI网站开发平台doraAI全面开启公测,用户通过文本提示快速开发网站,平均3分钟一站点。2、doraAI与传统模版不同,每个页面根据用户文本提示生成,可视化编辑操作简单高效。3、doraAI提供免费试用,用户通过文本提示快速创建商务、科技、营销等多种类型网站。站长网2024-03-21 19:15:440001