Meta 宣布开源多感官 AI 模型 ImageBind:整合文本、音频、视觉等六种类型数据
Meta 宣布推出一个新的开源 AI 模型,可以连接多种数据流,包括文本、音频、视觉数据、温度和动作读数。
图片来自 Meta
该模型目前仅是一个研究项目,没有立即的消费者或实际应用,但它指向了未来可以创建沉浸式、多感官体验的生成式 AI 系统,并表明了 Meta 在对手 OpenAI 和 Google 日益注重保密的时候仍在分享 AI 研究。
该研究的核心概念是将多种类型的数据链接到一个单一的多维度索引中(或者使用 AI 术语中的「嵌入空间」)。这个想法可能有点抽象,但正是这个概念支持了生成式 AI 的最近繁荣。
例如,像 DALL-E、Stable Diffusion 和 Midjourney 之类的 AI 图像生成器在训练阶段都依赖于系统,这些系统在连接文本和图像时共同寻找视觉数据中的模式,并将这些信息与图像的描述相连。这是使这些系统能够生成遵循用户文本输入的图片的基础。许多生成视频或音频的 AI 工具也是如此。
Meta 表示,它的模型 ImageBind 是第一个将六种类型的数据组合到一个单一的嵌入空间中的模型。包括在模型中的六种类型的数据是:视觉(以图像和视频形式呈现);热量(红外图像);文本;音频;深度信息;以及最有趣的——由惯性测量单元(IMU)生成的运动读数。(IMU 可在手机和智能手表中找到,在那里它们用于执行各种任务,比如从横向到纵向切换手机,区分不同类型的体育活动等。)
这个想法是未来的 AI 系统将可以像当前的 AI 系统对文本输入一样交叉参考这些数据。例如,想象一下一个未来的虚拟现实设备,它不仅可以生成音频和视觉输入,还可以生成你在物理舞台上的环境和动作。你可以要求它模拟一次长途航海,它不仅会把你放在一艘船上,背景中有海浪的声音,还会让你感受到甲板的摇摆和海洋空气的凉爽微风。
Meta 在一篇博客文章中指出,未来的模型可以增加其他感官输入流,包括「触摸、语音、气味和大脑功能磁共振成像信号」。它还声称,这项研究「将机器带到了人类能够同时、全面、直接地从许多不同形式的信息中学习的能力更近了一步」。(当然,这取决于这些步骤的大小。)
当然,这一切都非常推测性的,目前应用这些研究的可能性将会更加有限。例如,去年,Meta 展示了一种由文本描述生成短且模糊的视频的 AI 模型。像 ImageBind 这样的工作展示了系统未来版本如何整合其他数据流,例如生成与视频输出匹配的音频。
对于业内观察者来说,这项研究也很有趣,因为 Meta 正在开源其基础模型——这是人工智能世界中越来越受到关注的做法。
反对开源的人——比如 OpenAI——表示这种做法对创作者是有害的,因为竞争对手可以复制他们的工作,而且这可能会有潜在的危险,使恶意行为者利用最先进的 AI 模型。支持者回应说,开源允许第三方审查系统的问题并改进其缺陷。他们注意到这甚至可能提供商业利益,因为它实质上允许公司招募第三方开发人员作为不付费的工作人员来改进他们的工作。
Meta 迄今一直坚定地站在开源阵营,虽然并非没有困难。(例如,它最新的语言模型 LLaMA 今年早些时候在网上泄漏。)在许多方面,它在人工智能领域缺乏商业成就(该公司没有与 Bing、Bard 或 ChatGPT 等聊天机器人竞争的实际产品)使其能够采用这种方法。对于现在,在 ImageBind 上,它继续这个策略。
图像生成工具LeonardoAI视频生成功能正式向所有用户推出
图像生成工具LeonardoAI的视频生成功能现已向所有用户推出,并且可以免费试用。这项功能基于SVD技术,效果非常出色。某些风格比Runway效果还要好。但是不能用外部图片生成只能用他们自己的工具生成的图片生成视频。官网地址:https://top.aibase.com/tool/leonardo-ai站长网2023-12-25 18:54:390000小红书为什么做了这个决定?
9月15日,小红书福利社发布了一封题为《是告别,更是开始》的用户信。这封信写到,为了更好地满足快速增长的用户需求,小红书将集中资源和力量,服务更多买手、主理人、商家和品牌在电商的发展。福利社将于10月16日停止商品售卖,11月16日正式关闭店铺。01为用户而诞生的福利社站长网2023-09-16 09:28:070000回到“掼蛋之乡”淮安,我理解了为什么1.4亿人都爱玩
作为一个淮安人,掼蛋的火爆让我在诧异中又带有一些惊喜。掼蛋起源于江苏淮安,是一个几乎人人都会玩的纸牌游戏。作为当地人,我从2017年高中毕业就开始接触掼蛋。每逢寒暑假期间,一定会和同学朋友四处约战,已经玩了近7年。2023年春晚,沈腾马丽合作的小品《坑》中有一句台词“回头发咱们掼蛋群里”,我的朋友敏锐地听到了这一句话并转发到了我们的好友群中,我们开玩笑说“掼蛋火了”。站长网2024-02-21 09:06:2400001米糖葫芦硬控年轻人,半个月爆卖超15万单
“冰糖葫芦甜又甜,红红山楂圆又圆”,你听过这首童谣吗?你吃过糖葫芦吗?如今,插在草垛上的糖葫芦变成了大街小巷的拍照景观。许多年轻人,举着“1米糖葫芦”,分享着自己甜蜜的心情。一米糖葫芦最早在东北街头被发现,现在已经扩展到全国多个城市和景点,成为网红小吃。哈尔滨的中央大街、北京的南锣鼓巷、西安的钟鼓楼、济南的芙蓉街,以及上海、浙江等地也都能看到它的身影。0000