新加坡华人团队开源全能「大一统」多模态大模型NExT-GPT
要点:
1、NExT-GPT支持任意模态的输入和输出,实现了从任一模态到任一模态的转换。
2、NExT-GPT通过组合开源的编码器、语言模型和解码器实现了全能的多模态能力。
3、NExT-GPT实现了端到端的训练和指令微调,具有较好的多模态表示对齐能力。
继各类单一模态输入的多模态语言模型后,新加坡国立大学的华人团队最近开源了全能多模态模型NExT-GPT。该模型支持任意模态的输入和输出,可以实现文本、图像、语音和视频之间的自由转换,是第一个实现从任一模态到任一模态转换的通用多模态系统。
项目地址:https://next-gpt.github.io
代码地址:https://github.com/NExT-GPT/NExT-GPT
论文地址:https://arxiv.org/abs/2309.05519
NExT-GPT的优势在于它实现了真正意义上的任意模态输入到任意模态输出,而不是仅仅支持某一种固定的输入输出模式。用户可以随意组合不同模态进行查询,NExT-GPT都可以进行理解并用请求的模态形式给出响应。这充分模拟了人类处理信息的能力,是向通用人工智能目标迈进的重要一步。
在技术上,NExT-GPT并没有创新算法,而是站在巨人的肩膀上,通过组合优化利用现有的各类开源模块实现全能目标。具体来说,模型包含三个层次:第一,使用各类模态编码器对输入进行编码;第二,语言模型负责复杂推理;第三,解码器生成各种模态输出。
NExT-GPT的独特之处在于实现了模态特征表达的端到端对齐训练,以及针对多模态输出做了指令微调。这保证了在输入理解、内部推理和输出生成各层次间特征的有效传递,从而实现了优秀的多模态理解与生成能力。
虽然NExT-GPT目前还有待进一步扩展,但其展示了构建通用多模态系统的可能性,为人工智能研究提供了宝贵的借鉴。后续工作可以考虑扩展更多模态,使用更大规模的语言模型基座,以及改进多模态生成策略等。
国产3A大作你买没!《黑神话:悟空》发邮件提醒玩家预购
快科技7月4日消息,备受玩家期待的国产3A大作《黑神话:悟空》已在Steam、Epic、腾讯WeGame等平台开启预购,游戏将于8月20日全球同步上线。日前,部分玩家收到了《黑神话:悟空》官方发出的宣传邮件,内容提及游戏预购的相关信息,提醒玩家预购游戏。《黑神话:悟空》提供数字标准版和数字豪华版两种版本,售价分别为268元和328元,DLC豪华升级包售价60元。豪华版额外包含:兵器铜云棒站长网2024-07-04 22:27:240000Stability AI发布移动端语言模型Stable LM 3B
StabilityAI发布了最新的语言模型StableLM3B,该模型是为便携式数字设备设计的,参数规模为30亿,比行业通常使用的70亿参数模型要小,具有更高的性能和可移植性。StableLM3B具有较小的体积和高效性的优势,需要更少的资源和较低的运行成本,使其对大多数用户来说更加可承受。与此同时,它的能效更高,减少了能源消耗,具有环保特性。站长网2023-10-09 09:25:240001这个除了会表达爱什么都不会的AI,凭什么能卖到7万块?
“它毛茸茸的,渴望得到关注。但更重要的是,它爱你。”乍一看,它就像果宝特攻里的角色,神似橙留香,或菠萝吹雪。上为LOVOT,下为果宝特攻所以在第一眼看到它时,会让人感到熟悉又好奇。它既是陈冠希喜爱的陪伴机器人。也曾出演日本已故知名演员三浦春马的最后一部影视剧《钱断情始》。站长网2024-08-16 18:12:520000华为 nova 12 系列手机即将加入先锋计划 将于12 月 26 日发布
华为终端宣布nova系列手机即将加入先锋计划,并由易烊千玺代言。其中,华为nova12系列将于12月26日亮相。余承东发文表示,nova将以更时尚潮流的ID设计、更加强大的综合体验回馈大家的期待。站长网2023-12-18 11:25:490000韩国KT将在首尔建设人工智能医疗研发创新区
文章概要:1.韩国无线运营商KT公司计划在首尔东大门地区建设人工智能医疗研发创新区。2.该项目是与Sahmyook医疗中心和医疗大数据公司Humanitas签署的协议的一部分,旨在创建高科技的AI医疗研发创新区。3.目标是在医院的闲置用地上建立紧急医疗系统,支持医疗数据的研发活动,计划于2028年完成。站长网2023-09-18 11:38:070000