Yann LeCun:生成模型不适合处理视频,AI 理解视频得在抽象空间中进行预测
站长网2024-01-23 14:57:180阅
根据图灵奖得主、Meta 首席 AI 科学家在世界经济论坛上的讲话,生成模型不适合处理视频,AI得在抽象空间中进行预测。在互联网文本数据即将枯竭之际,很多 AI 研究者将目光转向了视频。但如何让 AI 理解视频数据成了新的难题。
斯坦福大学教授指出了理解因果关系对于构建未来AI系统的重要性。
Yann LeCun认为,适合用来处理视频的模型并不是我们现在大范围应用的生成模型,新的模型应该学会在抽象的表征空间中预测,而不是在像素空间中。

图源备注:图片由AI生成,图片授权服务商Midjourney
视频预测的难题主要在于像素空间的复杂性,以及对于物体摆放方式和运动轨迹的预测。这些具体的像素空间预测都很困难,导致传统生成模型在视频处理中效果不佳。视频输入需要新的架构来处理,以在抽象表征空间中进行预测。
AI系统需要在抽象表征空间中进行预测,而不是在具体的像素空间,同时也需要理解因果关系。当前模型中缺失的重要能力是理解因果关系,尤其在与物质世界的交互中更为重要。
为了解决视频处理中的难题,需要创造新的科学方法和技术,使AI系统能够像人类一样利用信息。这将需要一些科学和技术上的突破,对于在制造业、生物学等领域进行常识推理都具有重要意义。
0000
评论列表
共(0)条相关推荐
百度全面收回快速收录和sitemap提交权限 仅面向VIP站点开放
站长之家(ChinaZ.com)12月6日消息:此前百度站长平台宣布2023年11月30日将回收站点的“快速收录”和“Sitemap提交”权限,此举是为了全面升级搜索资源平台的权益体系。根据百度在12月1日发布的公告《热点问题追踪之消失的权益》,这一决定与使用《站长推送工具》无关。站长网2023-12-06 09:30:430000马来西亚正考虑制定人工智能监管法案
马来西亚科学、技术和创新部考虑制定人工智能法案,以监管人工智能应用程序的使用。该法案将包括对由人工智能生成的材料进行标记,以保证透明度和知情消费。马来西亚将与技术专家、法律专业人士、利益相关者和公众合作,确保法案的稳健性和相关性。法案还将涵盖数据隐私和公众对人工智能使用的意识等关键方面。站长网2023-07-24 17:15:260002性能之王!一加Ace 3 Pro启用全新Logo
快科技6月15日消息,{tag_keyurl_3}李杰预告,一加Ace3Pro将在下周正式开启预热。为了迎接一加Ace3Pro的到来,一加Ace系列启用全新Logo,李杰表示,AcePerformance代表着最强的性能实力,关于这个标志,还有一些小故事,我后面和大家聊聊。站长网2024-06-17 01:54:360000小红书618抢跑,小商家陪跑当“炮灰”?
今年的618,来得更早了些。当天猫在“五一”小长假后,官宣取消预售,5月20日8点“现货开卖”;快手跟进取消预售,大主播公布618玩法;小红书也将618提前至5月19日启动,并且从5月10日起,推出618小红书电商学习周,试图通过多场直播为商家解读活动玩法和扶持政策等等,从而吸引商家报名活动。站长网2024-05-24 21:14:320000Pika推视频画面扩充功能 支持调整视频风格
日前,Pika官方发推宣布推出视频画面扩充功能,用户输入文字生成图像后,若需要一些额外的画面,可以点击ExpandCanvas功能按钮扩展画面。比如,你生成了一个在森林里的美女,你想在它旁边再生成一匹马,只需输入提示后,点击ExpandCanvas就可以扩充画面。站长网2024-01-15 13:42:080001