中科院正打造“紫东太初”2.0全模态大模型 实现图像、文本、语音三模态相互生成
站长网2023-05-08 15:20:441阅
在今天的华为昇腾AI开发者峰会上,中国科学院自动化研究所“紫东太初”大模型研究中心常务副主任、武汉人工智能研究院院长王金桥博士介绍了“紫东太初”2.0全模态大模型。
该模型由自动化所和武汉人工智能研究院联合打造,基于华为全栈国产化软硬件平台昇腾AI和开源AI框架昇思MindSpore。
2021年7月,自动化所发布了全球首个千亿参数多模态大模型“紫东太初”,实现了图像、文本、语音三模态数据间的“统一表示”与“相互生成”。
而新版的“紫东太初”2.0全模态大模型可以实现不同模态的统一表征和学习,包括文本、图片、语音、视频、3D点云和传感信号,同时优化了语音、视频和文本的融合认知以及常识计算等功能,进一步突破了感知、认知和决策的交互屏障。
此外,“紫东太初”大模型还开放了基于昇腾和昇思的3.8B图像-文本-语音多模态模型,并推出了紫东太初大模型服务平台。该模型已在多个行业场景领域显示出落地潜力,包括手语教学、法律咨询、交通出行、广电、医疗机器人和医学影像判读等。
0001
评论列表
共(0)条相关推荐
浏览器就能跑大模型了,陈天奇团队发布WebLLM,无需服务器支持
现在,只需一个浏览器,就能跑通“大力出奇迹”的大语言模型(LLM)了!不仅如此,基于LLM的类ChatGPT也能引进来,而且还是不需要服务器支持、WebGPU加速的那种。例如这样:这就是由陈天奇团队最新发布的项目——WebLLM。短短数日,已经在GitHub上揽货3.2K颗星。一切尽在浏览器,怎么搞?首先,你需要下载ChromeCanary,也就是谷歌浏览器的金丝雀版本:站长网2023-04-20 11:35:550002亚马逊推出新的生成式 AI 功能,帮助卖家创建产品描述
划重点:-🤖亚马逊引入生成式AI功能,让卖家通过提供网站链接,轻松创建高质量的产品详情页。-💼AI技术帮助卖家减少制作产品页面的工作量,提高页面质量,增加产品曝光率。-🌐新功能已开始推出,将在未来几周内提供给美国卖家使用。站长网2024-03-26 01:19:060002Stability AI推图像高清放大工具Creative Upscaler
StabilityAI推出了图像提升增强工具:CreativeUpscaler,能够将图像升级到4K分辨率,并创造出以前未有的新细节,为图像注入新的生命。产品入口:https://top.aibase.com/tool/creative-upscaler主要功能包括:分辨率提升:将图像升级至4K分辨率,无论原始图像大小如何。站长网2024-02-26 10:41:350000北大教授陈钟谈 AI 未来:逼近 AGI、融进元宇宙,开源是重中之重
去年11月底ChatGPT横空出世时,可能谁也没想到,一场规模庞大的变革将由此开启。凭借其强大的语言理解和生成能力,ChatGPT上线2个月突破1亿月活,吸引了工业界和学术界的广泛关注,以ChatGPT为代表的大模型技术更被认为开启了AI2.0时代:▶比尔·盖茨:ChatGPT有着重大的历史意义,不亚于互联网或个人电脑的诞生;0001专家:2024年有可能是更热的一年 极端天气或将更频繁更强烈
据国内媒体报道,国家气候中心气候服务首席专家周兵指出,今年已确定成为1850年以来最暖的年份。历史数据也显示,像2020年超级暴力梅等年份,南方地区都出现了洪涝灾害。这表明,2024年可能会更热,极端天气也会更频繁、更强烈。0000