写真视频击败Sora?人大自研全新多模态大模型Awaker 1.0震撼登场
站长网2024-04-29 16:59:142阅
在人工智能领域,人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型,标志着向通用人工智能(AGI)迈出了重要一步。该模型在写真视频效果上超越了Sora,展现了其在视觉生成方面的卓越能力。

4月27日,在中关村论坛的通用人工智能平行论坛上,智子引擎展示了这款业界首个真正实现自主更新的多模态大模型。Awaker1.0采用了创新的MOE架构,具备自主更新能力,能够生成高质量的多模态内容,模拟现实世界,同时在执行任务中将场景行为数据反哺给模型,实现持续更新与训练。
在视觉问答和业务应用任务上,Awaker1.0的基座模型超越了GPT-4V、Qwen-VL-Max和Intern-VL等国内外先进模型。此外,它还在描述、推理和检测任务上达到了次好的效果,证明了多任务MOE架构的有效性。

结合具身智能,Awaker1.0被认为可能成为实现AGI的可行路径。它通过自主探索环境,发现新策略和解决方案,提升具身智能的适应性和创造性。Awaker1.0的自主更新机制包含数据主动生成、模型反思评估和模型连续更新三大关键技术,使其能够实时持续地更新参数。

智子引擎自主研发的类Sora视频生成底座VDT,作为现实世界的模拟器,展现了Transformer技术在视频生成领域的潜力。VDT能够处理多种视频生成任务,如无条件生成、视频后续帧预测等,并在写真视频生成任务上取得了比Sora更好的质量。

Awaker1.0的发布是智子引擎团队向实现AGI目标迈进的关键一步。团队认为,AI的自我探索、自我反思等自主学习能力是智能水平的重要评估标准。Awaker1.0在理解侧和生成侧都实现了效果突破,有望加速多模态大模型行业的发展,最终让人类实现AGI。
0002
评论列表
共(0)条相关推荐
OPPO Reno12系列宣布支持发布实况照片
站长之家(ChinaZ.com)5月20日消息:今日,OPPO官方宣布OPPOReno12系列手机将支持发布实况照片LivePhoto,这不仅标志着安卓手机阵营中首款能够直接发布实况照片的机型诞生,更为用户带来了全新的拍摄和分享体验。OPPOReno12系列的实况照片功能堪称全面,支持小红书平台直接发布,全焦段拍摄,美颜效果,以及封面编辑和封面帧ProXDR显示。站长网2024-05-20 22:10:590000白宫报告称美国10%的员工面临高度暴露于人工智能的风险
划重点:-🤖10%的美国员工处于与人工智能高度暴露且绩效要求较低的岗位-📉20%的美国员工处于与人工智能高度暴露的职业中-💼AI可能会改变工作方式而非完全淘汰岗位站长网2024-03-23 00:22:310000时薪高达342元,特斯拉为机器人招募“人类老师”,明确要求:身高170-180cm,每天步行7+小时
有一份工作,时薪高达48美元(约人民币342元),要求你日常负重30磅(约27.2斤)、每天步行7小时以上——这样的工作,你愿意干吗?站长网2024-08-21 09:10:410000从“人带剧”到“剧捧人”,2024年国产剧的纠偏之路
不知不觉,又到了人们总结2024年,展望2025年的时间节点。回顾过去一年的国产剧市场,我们惊喜地发现,2024年可能是近年来观众们“吃得最好”的一年。0000百度萝卜快跑无人出租车上热搜 何小鹏:建议赶紧改端到端
近期,百度在武汉推出的萝卜快跑无人出租车服务受到了广泛关注和热烈追捧,不仅吸引了众多国内乘客,甚至连外国人也纷纷前去体验。这一现象不仅让萝卜快跑成为热门话题,也显著提升了百度的股价。站长网2024-07-11 15:33:180000