写真视频击败Sora？人大自研全新多模态大模型Awaker 1.0震撼登场

站长网2024-04-29 16:59:142阅

在人工智能领域，人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型，标志着向通用人工智能（AGI）迈出了重要一步。该模型在写真视频效果上超越了Sora，展现了其在视觉生成方面的卓越能力。

4月27日，在中关村论坛的通用人工智能平行论坛上，智子引擎展示了这款业界首个真正实现自主更新的多模态大模型。Awaker1.0采用了创新的MOE架构，具备自主更新能力，能够生成高质量的多模态内容，模拟现实世界，同时在执行任务中将场景行为数据反哺给模型，实现持续更新与训练。

在视觉问答和业务应用任务上，Awaker1.0的基座模型超越了GPT-4V、Qwen-VL-Max和Intern-VL等国内外先进模型。此外，它还在描述、推理和检测任务上达到了次好的效果，证明了多任务MOE架构的有效性。

结合具身智能，Awaker1.0被认为可能成为实现AGI的可行路径。它通过自主探索环境，发现新策略和解决方案，提升具身智能的适应性和创造性。Awaker1.0的自主更新机制包含数据主动生成、模型反思评估和模型连续更新三大关键技术，使其能够实时持续地更新参数。

智子引擎自主研发的类Sora视频生成底座VDT，作为现实世界的模拟器，展现了Transformer技术在视频生成领域的潜力。VDT能够处理多种视频生成任务，如无条件生成、视频后续帧预测等，并在写真视频生成任务上取得了比Sora更好的质量。

Awaker1.0的发布是智子引擎团队向实现AGI目标迈进的关键一步。团队认为，AI的自我探索、自我反思等自主学习能力是智能水平的重要评估标准。Awaker1.0在理解侧和生成侧都实现了效果突破，有望加速多模态大模型行业的发展，最终让人类实现AGI。

写真视频击败Sora人大自研全新多模态大模型Awaker1 0震撼登场

0002

评论列表

共(0)条

相关推荐

站长资讯
安卓 15 新设计！音量调节面板功能大改
在最新的Android15开发者预览版中，谷歌带来了全新的音量调节面板设计。这一设计与之前版本相比有了明显的变化。
站长网2024-04-06 14:16:15
0000
站长资讯
免费在线AI工具LeiaPix:一键将图片转3D动画
Leia是一家总部位于美国的领先供应商，专注于裸眼3D显示硬件和软件解决方案。他们旗下的LeiaPixConverter是一款由AI技术驱动的图像处理工具，可以将静态的2D图像转换为动态的3D图像。体验地址：https://convert.leiapix.com/
站长网2023-08-14 14:35:51
0002
站长资讯
1Password瘫痪了大约一个小时，导致部分用户无法登录
划重点:1.🔒1Password遭遇故障，导致部分用户无法登录，公司正在调查。2.🛠️1Password在确认问题后的一小时内发布了修复补丁。3.🌐故障影响全球用户，尤其是欧洲、美国、加拿大等地，涉及单点登录、跨设备同步以及密码保存等问题。
站长网2024-02-06 09:48:36
0000
站长资讯
“高压锅”除了用来炖肉还能干嘛？
俗话说，人往高处走，水往低处流。自古以来，人们就对高处的地方有着无穷的向往。对于物理学家来说，除了可以攀爬地理上山峰以外，也要不断攀登科学的高峰，这意味着需要不断创造更极限的实验环境。众所周知，生活在平原或者低海拔地区的人在进入高原后，由于气压降低，氧气含量降低，同时可能受紫外线、气温低等因素影响容易出现高原反应。
站长网2023-05-24 16:00:26
0000
站长资讯
雷军宣布小米内部精英驾驶培训12月招募：首批开放Ultra用户
快科技11月17日消息，日前，小米CEO雷军宣布，小米内部的精英驾驶培训将逐步向用户开放，首批先开放给Ultra小定用户，12月开始招募。雷军还询问大家希望学哪些驾驶课程？高级驾驶技巧、赛道训练、赛车证培训、漂移等。据了解，雷军曾在发布会和直播中提到，未来将考虑对小米车主朋友们开放小米公司内部的高级驾驶培训、赛道驾驶培训、漂移培训三类课程。
站长网2024-11-17 12:45:53
0000