首页站长资讯中科院正打造“紫东太初”2.0全模态大模型实现图像、文本、语音三模态相互生成

中科院正打造“紫东太初”2.0全模态大模型实现图像、文本、语音三模态相互生成

站长网2023-05-08 15:20:441阅

在今天的华为昇腾AI开发者峰会上，中国科学院自动化研究所“紫东太初”大模型研究中心常务副主任、武汉人工智能研究院院长王金桥博士介绍了“紫东太初”2.0全模态大模型。

该模型由自动化所和武汉人工智能研究院联合打造，基于华为全栈国产化软硬件平台昇腾AI和开源AI框架昇思MindSpore。

2021年7月，自动化所发布了全球首个千亿参数多模态大模型“紫东太初”，实现了图像、文本、语音三模态数据间的“统一表示”与“相互生成”。

而新版的“紫东太初”2.0全模态大模型可以实现不同模态的统一表征和学习，包括文本、图片、语音、视频、3D点云和传感信号，同时优化了语音、视频和文本的融合认知以及常识计算等功能，进一步突破了感知、认知和决策的交互屏障。

此外，“紫东太初”大模型还开放了基于昇腾和昇思的3.8B图像-文本-语音多模态模型，并推出了紫东太初大模型服务平台。该模型已在多个行业场景领域显示出落地潜力，包括手语教学、法律咨询、交通出行、广电、医疗机器人和医学影像判读等。

中科院正打造紫东太初2 0全模态大模型实现图像文本 语音三模态相互生成

0001

评论列表

共(0)条

相关推荐

站长资讯
产业链人士：苹果 iPhone 15 Pro 系列取消固态按键设计属实延后可能性大
日前分析师郭明錤分享的最新信息称，下一代iPhone15Pro和iPhone15ProMax将不再采用固态按钮，原因是「在大规模生产前尚未解决技术问题」。
站长网2023-04-13 08:58:34
0000
站长资讯
微信PC版发布3.9.5版本：新增锁定功能保护用户隐私
近日，微信开始向部分Windows用户推送3.9.5版本更新。该版本新增了锁定功能，使得用户可以在电脑端更加安心地使用微信。
站长网2023-05-24 17:06:22
0000
站长资讯
2025年，黄仁勋画了个更大的饼
物理AI，或许将成为2025关键词之一。刚刚结束的CES大会上，黄仁勋表示，「AI下一个前沿就是物理AI，蕴藏着价值数万亿美元的机会」。早前，黄仁勋不止一次强调过，“AI的新一波浪潮是物理AI”。物理AI，顾名思义就是物理AI，通俗地理解，就是人工智能反馈的内容要符合物理规律。
站长网2025-01-10 09:16:36
0000
站长资讯
张大仙跳槽抖音，头部游戏主播还有新故事吗？
同一天，字节放弃游戏业务，而抖音迎来了头部游戏主播张大仙。只是，抖音不是不能播王者荣耀吗?似是早已预料到跳槽抖音会引起的疑惑，张大仙发了微博，关键信息是:将会继续播王者荣耀。还有消息称，下个月起，抖音将可以播王者荣耀和英雄联盟。腾讯和抖音围绕游戏直播版权的纷争，终于结束了?而随着头部游戏主播换平台、寻求新出路，他们还有新故事吗?张大仙官宣抖音开播“正式加入抖音直播啦，让兄弟们久等了。”
站长网2023-11-29 16:35:04
0000
站长资讯
生成式AI之战，谁能破局而出？
随着腾讯的入局，国内生成式AI大模型赛道集齐BAT三大巨头，竞争日趋白热化。4月14日，腾讯云发布面向大模型训练的新一代高性能计算集群，搭载英伟达最新一代H800GPU，服务器互联带宽高达3.2T，算力性能较上一代提升3倍，号称目前国内性能最强的大模型计算集群。
站长网2023-04-20 21:38:22
0001