新加坡国立大学开源多模态语言模型 NExT-GPT,助力多媒体 AI 应用发展
**划重点:**
1. 🌐 **多模态能力:** NExT-GPT 可处理文本、图像、视频和音频,为开发者提供强大的多模态语言模型。
2. 🧠 **架构与训练:** 采用三层架构,包括线性投影、Vicuna LLM 核心和模态特定的转换层。通过 MosIT 技术进行中间层的训练。
3. 🌟 **开源贡献:** NExT-GPT 的开源使得研究者和开发者能够创建能够无缝集成文本、图像、视频和音频的应用,潜在应用领域广泛。
新加坡国立大学(NUS)NExT 研究中心发布了开源多模态大语言模型 NExT-GPT,为处理文本、图像、视频和音频等多样化输入提供了强大支持,推动了多媒体人工智能应用的进一步发展。
NExT-GPT 提供了一个基于聊天的界面,允许用户输入文本、图像、视频或音频文件。该模型能够理解并针对这些输入做出回应,回答问题或生成相应内容。这一多模态人工智能系统融合了预训练的编码器和解码器,包括 Vicuna 和 Stable Diffusion,并通过 NExT 团队研发的 Modality-switching Instruction Tuning(MosIT)技术进行中间层的训练。
图源备注:图片由AI生成,图片授权服务商Midjourney
NExT-GPT 的架构分为三个层次:具有线性投影的编码阶段,负责生成标记的 Vicuna LLM 核心,以及具有模态特定的转换层和解码器的解码阶段。值得注意的是,在训练过程中,模型的大部分参数,包括编码器、解码器和 Vicuna 模型,都保持冻结状态,只有约1% 的参数会被更新。这一方法有助于降低训练成本同时保持性能水平。
该模型通过使用示例对话数据集进行训练,该数据集包含人类用户与聊天机器人之间涉及多模态输入和输出的情景,总共包括约5,000个对话。NExT-GPT 在多模态生成基准测试中取得了竞争性的结果,并在不同场景下通过人类评审获得了高分,其中图像生成场景的得分高于视频和音频。
NExT-GPT 独特之处在于其能够在用户请求特定类型内容(如图像、视频或声音)时生成模态信令标记。这些标记在语言模型的词汇表中是预定义的,并在训练期间被包含其中。
NExT-GPT 的开源发布为研究者和开发者提供了一个强大的多模态语言模型,可以处理各种输入和输出,为不同媒体类型的复杂人工智能应用铺平了道路。其开源可用性对于多模态人工智能是一项重要的贡献,使得开发者能够创建能够无缝集成文本、图像、视频和音频的应用。该模型在内容生成、多媒体分析以及能够理解并响应用户首选格式的虚拟助手等各个领域都具有潜在的应用前景。
反盗版组织下线AI训练数据集 “Books3” Meta大模型也曾使用
本文概要:1.反盗版组织成功要求在线盗版书籍资源库TheEye下线AI训练数据集"Books3"。2."Books3"数据集包含了37GB的文本,用于训练人工智能模型,已被多家公司使用。3.反盗版组织表示AI对版权产生了新的挑战,计划继续打击其他存有该数据集的网站。站长网2023-08-22 12:01:020000OpenAI 人工智能文本检测器正确率只有 26% 且有 9% 的误报
OpenAI日前关闭了一个本应用于区分人类写作和AI写作的工具,原因是准确率较低。在一篇(更新后的)博客中,OpenAI表示决定自2023年7月20日起停用其AI检测器。该公司表示:「我们正在努力吸纳反馈意见,并正在研究更有效的文本来源技术。」站长网2023-07-26 15:42:200001年度最大黑马!问界全新M7爆火:上市不到两月大定超86000台
快科技11月9日消息,今日晚间,华为智选车首款轿车智界S7预售发布会召开。余承东在会上表示,问界新M7发布会爆火,截止到昨天,问界新M7大订数已达到8.6万台,已成为年度最大黑马。而10月份,AITO问界系列交付新车12700辆,其中问界新M7交付新车10547辆,单车型单月交付破万,创历史新高。随着问界新M7的交付,第一批车主口碑也随之打了出来,对产品销售起到助推作用。0000中国快递协会回应新规落实情况:不要求必须上门投递
新修订的《快递市场管理办法》于今年3月1日正式生效,其中一项备受瞩目的规定是,未经用户同意代为确认收到快件的行为将受到处罚。这一新规在快递行业内引起了广泛的讨论,既有支持的声音,也有部分质疑。不少快递员表示,如果按照新规要求,每个快递都需要打电话或上门确认,将极大地增加耗时,降低整体效率,并且电话费用也会成为一笔不小的开销。站长网2024-03-15 17:29:080001华为 Mate XT 非凡大师官宣 或为新款三折叠屏手机
华为公司今日宣布了其即将推出的新款智能手机的名称——华为MateXT非凡大师。预计将是之前多次曝光的三折叠屏手机。据悉,昨日华为官方宣布,华为品牌盛典及鸿蒙智行新品发布会将于9月10日举行,届时将展示华为的最新科技创新成果。此次发布会将推出华为最具前瞻性、创新性和颠覆性的产品。、站长网2024-09-04 18:00:400000