Yann LeCun:生成模型不适合处理视频,AI 理解视频得在抽象空间中进行预测
站长网2024-01-23 14:57:180阅
根据图灵奖得主、Meta 首席 AI 科学家在世界经济论坛上的讲话,生成模型不适合处理视频,AI得在抽象空间中进行预测。在互联网文本数据即将枯竭之际,很多 AI 研究者将目光转向了视频。但如何让 AI 理解视频数据成了新的难题。
斯坦福大学教授指出了理解因果关系对于构建未来AI系统的重要性。
Yann LeCun认为,适合用来处理视频的模型并不是我们现在大范围应用的生成模型,新的模型应该学会在抽象的表征空间中预测,而不是在像素空间中。
图源备注:图片由AI生成,图片授权服务商Midjourney
视频预测的难题主要在于像素空间的复杂性,以及对于物体摆放方式和运动轨迹的预测。这些具体的像素空间预测都很困难,导致传统生成模型在视频处理中效果不佳。视频输入需要新的架构来处理,以在抽象表征空间中进行预测。
AI系统需要在抽象表征空间中进行预测,而不是在具体的像素空间,同时也需要理解因果关系。当前模型中缺失的重要能力是理解因果关系,尤其在与物质世界的交互中更为重要。
为了解决视频处理中的难题,需要创造新的科学方法和技术,使AI系统能够像人类一样利用信息。这将需要一些科学和技术上的突破,对于在制造业、生物学等领域进行常识推理都具有重要意义。
0000
评论列表
共(0)条相关推荐
腾讯发布2023年第一季度财报:营收1499.9亿元 同比增长11%
据腾讯控股今日发布的2023年第一季度财报显示,公司实现营收1499.9亿元,同比增长11%;净利润285.4亿元,同比增长10%;非国际财务报告准则下,净利润325.4亿元,同比增长27%。站长网2023-05-17 17:00:020006这份榜单,揭示了中外AI应用的“差距”
相比于国内的AI企业,海外的这些同行们,大部分都已经在AI的应用层,尤其是C端应用上实现了盈利。国内绝大部分应用,却仍集中在B端。a16z是一家美国硅谷的风险投资公司,成立于2009年,在科技界有着深厚的背景。由于其优秀的投资业绩和行业影响力,a16z已成为全球最有声望的风险投资公司之一。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-09-23 09:43:290000头部主播的好日子快到头了
直播电商行业,正陷入前所未有的危机。新规拟出台,全面禁止“最低价协议”没想到,今年双11最热闹的战场,居然是“舆论场”。先是10月24日天猫双11预售首日,#京东采销喊话李佳琦#事件冲上热搜,引发外界猜测李佳琦直播间是否和品牌方存在“底价协议”;当天在美ONE方面否认后,主播大杨哥又在“疯狂小杨哥”直播间称李佳琦控价控库存,挟持商家;站长网2023-11-03 13:57:440000继龙骨、龙鳞、龙晶之后 小米申请“小米龙脊”商标
小米科技有限责任公司近日申请注册了2枚“小米龙脊”商标,涵盖了金属材料和运输工具类别。这是小米继“小米龙骨”、“小米龙鳞”、“小米龙晶”等商标之后的又一动作。值得一提的是,小米在其新发布的手机产品中已经开始应用一些与“龙”字相关的技术。例如,小米14Pro采用了“小米龙晶玻璃”,据官方数据显示,其抗跌落性能提升了10倍,耐刮性能提升了1.32倍,比华为的昆仑玻璃和苹果的超晶瓷玻璃更硬。站长网2024-01-22 15:27:120000Meta AI 负责人:当前的 ChatGPT 等人工智能还不如狗聪明
当前的人工智能系统(如ChatGPT)并没有人类级别的智能,甚至不如狗聪明。这是Meta的AI负责人在关于这种快速发展技术危险的论坛中表示的。ChatGPT是由OpenAI开发的,它基于所谓的大型语言模型。这意味着该AI系统经过大量的语言数据训练,用户可以通过问题和请求与其进行对话,而聊天机器人则用我们能理解的语言回答。站长网2023-06-16 16:45:180000