写真视频击败Sora?人大自研全新多模态大模型Awaker 1.0震撼登场
站长网2024-04-29 16:59:142阅
在人工智能领域,人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型,标志着向通用人工智能(AGI)迈出了重要一步。该模型在写真视频效果上超越了Sora,展现了其在视觉生成方面的卓越能力。
4月27日,在中关村论坛的通用人工智能平行论坛上,智子引擎展示了这款业界首个真正实现自主更新的多模态大模型。Awaker1.0采用了创新的MOE架构,具备自主更新能力,能够生成高质量的多模态内容,模拟现实世界,同时在执行任务中将场景行为数据反哺给模型,实现持续更新与训练。
在视觉问答和业务应用任务上,Awaker1.0的基座模型超越了GPT-4V、Qwen-VL-Max和Intern-VL等国内外先进模型。此外,它还在描述、推理和检测任务上达到了次好的效果,证明了多任务MOE架构的有效性。
结合具身智能,Awaker1.0被认为可能成为实现AGI的可行路径。它通过自主探索环境,发现新策略和解决方案,提升具身智能的适应性和创造性。Awaker1.0的自主更新机制包含数据主动生成、模型反思评估和模型连续更新三大关键技术,使其能够实时持续地更新参数。
智子引擎自主研发的类Sora视频生成底座VDT,作为现实世界的模拟器,展现了Transformer技术在视频生成领域的潜力。VDT能够处理多种视频生成任务,如无条件生成、视频后续帧预测等,并在写真视频生成任务上取得了比Sora更好的质量。
Awaker1.0的发布是智子引擎团队向实现AGI目标迈进的关键一步。团队认为,AI的自我探索、自我反思等自主学习能力是智能水平的重要评估标准。Awaker1.0在理解侧和生成侧都实现了效果突破,有望加速多模态大模型行业的发展,最终让人类实现AGI。
0002
评论列表
共(0)条相关推荐
vivo大模型云端方案vivo_Agent_LM_7B亮相
近日,vivo的大模型云端方案也已经出现在C-Eval排行榜上。该排行榜是一个全面的中文基础模型评估套件,包含13948个多项选择题,涵盖人文、社科、理工等多个学科和不同难度级别。从C-Eval给出的信息来看,vivo_Agent_LM_7B是由vivoAI全球研究院自主研发的大规模预训练语言模型,拥有70亿参数。站长网2023-08-16 09:05:130006OPPO Find N3折叠屏手机将于10月19日发布
OPPOFindN3折叠屏手机将于10月19日全球发布,标语为“影像新世代,也是折叠下一代”。刘作虎表示,此次OPPOFindN3将摒弃以往折叠屏手机的短板,力求在轻薄质感、影像效果、屏幕素质、系统交互和大屏体验上实现全面提升。站长网2023-10-12 10:32:470000陈小春领衔代言!西山居《剑侠世界:起源》9月26日全平台公测
西山居剑侠情缘26年传承之作《剑侠世界:起源》9月26日10:00全平台公测,400万剑侠玩家预约,共赴江湖。《剑侠世界:起源》今日官宣品牌代言人陈小春、徐少强,经典武侠明星X剑侠情缘26年传承之作,带你梦回江湖起源时代!站长网2023-09-21 11:23:040000区块链百科全书IQ.wiki推出基于ChatGPT的搜索引擎“IQ GPT”
IQ.wiki是一个基于区块链的百科全书,现已推出基于OpenAI的ChatGPT技术的搜索引擎,以帮助加密货币用户搜索各种来源的信息。站长网2023-08-11 16:15:290000YouTube称只是减缓广告拦截器的使用 Firefox加载速度不受影响
据TheVerge报道,YouTube表示其不会减缓Firefox的速度,只是会减缓广告拦截器的使用。一些用户抱怨在Firefox上加载YouTube视频需要更长的时间,YouTube表示这是为了保持广告流畅而采取的措施。站长网2023-11-22 09:59:110000