中科院正打造“紫东太初”2.0全模态大模型 实现图像、文本、语音三模态相互生成
站长网2023-05-08 15:20:441阅
在今天的华为昇腾AI开发者峰会上,中国科学院自动化研究所“紫东太初”大模型研究中心常务副主任、武汉人工智能研究院院长王金桥博士介绍了“紫东太初”2.0全模态大模型。
该模型由自动化所和武汉人工智能研究院联合打造,基于华为全栈国产化软硬件平台昇腾AI和开源AI框架昇思MindSpore。

2021年7月,自动化所发布了全球首个千亿参数多模态大模型“紫东太初”,实现了图像、文本、语音三模态数据间的“统一表示”与“相互生成”。
而新版的“紫东太初”2.0全模态大模型可以实现不同模态的统一表征和学习,包括文本、图片、语音、视频、3D点云和传感信号,同时优化了语音、视频和文本的融合认知以及常识计算等功能,进一步突破了感知、认知和决策的交互屏障。
此外,“紫东太初”大模型还开放了基于昇腾和昇思的3.8B图像-文本-语音多模态模型,并推出了紫东太初大模型服务平台。该模型已在多个行业场景领域显示出落地潜力,包括手语教学、法律咨询、交通出行、广电、医疗机器人和医学影像判读等。
0001
评论列表
共(0)条相关推荐
产业链人士:苹果 iPhone 15 Pro 系列取消固态按键设计属实 延后可能性大
日前分析师郭明錤分享的最新信息称,下一代iPhone15Pro和iPhone15ProMax将不再采用固态按钮,原因是「在大规模生产前尚未解决技术问题」。站长网2023-04-13 08:58:340000微信PC版发布3.9.5版本:新增锁定功能 保护用户隐私
近日,微信开始向部分Windows用户推送3.9.5版本更新。该版本新增了锁定功能,使得用户可以在电脑端更加安心地使用微信。站长网2023-05-24 17:06:2200002025年,黄仁勋画了个更大的饼
物理AI,或许将成为2025关键词之一。刚刚结束的CES大会上,黄仁勋表示,「AI下一个前沿就是物理AI,蕴藏着价值数万亿美元的机会」。早前,黄仁勋不止一次强调过,“AI的新一波浪潮是物理AI”。物理AI,顾名思义就是物理AI,通俗地理解,就是人工智能反馈的内容要符合物理规律。站长网2025-01-10 09:16:360000张大仙跳槽抖音,头部游戏主播还有新故事吗?
同一天,字节放弃游戏业务,而抖音迎来了头部游戏主播张大仙。只是,抖音不是不能播王者荣耀吗?似是早已预料到跳槽抖音会引起的疑惑,张大仙发了微博,关键信息是:将会继续播王者荣耀。还有消息称,下个月起,抖音将可以播王者荣耀和英雄联盟。腾讯和抖音围绕游戏直播版权的纷争,终于结束了?而随着头部游戏主播换平台、寻求新出路,他们还有新故事吗?张大仙官宣抖音开播“正式加入抖音直播啦,让兄弟们久等了。”站长网2023-11-29 16:35:040000生成式AI之战,谁能破局而出?
随着腾讯的入局,国内生成式AI大模型赛道集齐BAT三大巨头,竞争日趋白热化。4月14日,腾讯云发布面向大模型训练的新一代高性能计算集群,搭载英伟达最新一代H800GPU,服务器互联带宽高达3.2T,算力性能较上一代提升3倍,号称目前国内性能最强的大模型计算集群。站长网2023-04-20 21:38:220001