Meta 宣布开源多感官 AI 模型 ImageBind:整合文本、音频、视觉等六种类型数据
Meta 宣布推出一个新的开源 AI 模型,可以连接多种数据流,包括文本、音频、视觉数据、温度和动作读数。
图片来自 Meta
该模型目前仅是一个研究项目,没有立即的消费者或实际应用,但它指向了未来可以创建沉浸式、多感官体验的生成式 AI 系统,并表明了 Meta 在对手 OpenAI 和 Google 日益注重保密的时候仍在分享 AI 研究。
该研究的核心概念是将多种类型的数据链接到一个单一的多维度索引中(或者使用 AI 术语中的「嵌入空间」)。这个想法可能有点抽象,但正是这个概念支持了生成式 AI 的最近繁荣。
例如,像 DALL-E、Stable Diffusion 和 Midjourney 之类的 AI 图像生成器在训练阶段都依赖于系统,这些系统在连接文本和图像时共同寻找视觉数据中的模式,并将这些信息与图像的描述相连。这是使这些系统能够生成遵循用户文本输入的图片的基础。许多生成视频或音频的 AI 工具也是如此。
Meta 表示,它的模型 ImageBind 是第一个将六种类型的数据组合到一个单一的嵌入空间中的模型。包括在模型中的六种类型的数据是:视觉(以图像和视频形式呈现);热量(红外图像);文本;音频;深度信息;以及最有趣的——由惯性测量单元(IMU)生成的运动读数。(IMU 可在手机和智能手表中找到,在那里它们用于执行各种任务,比如从横向到纵向切换手机,区分不同类型的体育活动等。)
这个想法是未来的 AI 系统将可以像当前的 AI 系统对文本输入一样交叉参考这些数据。例如,想象一下一个未来的虚拟现实设备,它不仅可以生成音频和视觉输入,还可以生成你在物理舞台上的环境和动作。你可以要求它模拟一次长途航海,它不仅会把你放在一艘船上,背景中有海浪的声音,还会让你感受到甲板的摇摆和海洋空气的凉爽微风。
Meta 在一篇博客文章中指出,未来的模型可以增加其他感官输入流,包括「触摸、语音、气味和大脑功能磁共振成像信号」。它还声称,这项研究「将机器带到了人类能够同时、全面、直接地从许多不同形式的信息中学习的能力更近了一步」。(当然,这取决于这些步骤的大小。)
当然,这一切都非常推测性的,目前应用这些研究的可能性将会更加有限。例如,去年,Meta 展示了一种由文本描述生成短且模糊的视频的 AI 模型。像 ImageBind 这样的工作展示了系统未来版本如何整合其他数据流,例如生成与视频输出匹配的音频。
对于业内观察者来说,这项研究也很有趣,因为 Meta 正在开源其基础模型——这是人工智能世界中越来越受到关注的做法。
反对开源的人——比如 OpenAI——表示这种做法对创作者是有害的,因为竞争对手可以复制他们的工作,而且这可能会有潜在的危险,使恶意行为者利用最先进的 AI 模型。支持者回应说,开源允许第三方审查系统的问题并改进其缺陷。他们注意到这甚至可能提供商业利益,因为它实质上允许公司招募第三方开发人员作为不付费的工作人员来改进他们的工作。
Meta 迄今一直坚定地站在开源阵营,虽然并非没有困难。(例如,它最新的语言模型 LLaMA 今年早些时候在网上泄漏。)在许多方面,它在人工智能领域缺乏商业成就(该公司没有与 Bing、Bard 或 ChatGPT 等聊天机器人竞争的实际产品)使其能够采用这种方法。对于现在,在 ImageBind 上,它继续这个策略。
美团 2023 年营收 2767 亿元 同比增长25.8%
美团今日公布了其截至12月31日的2023年第四季度及全年财报数据,展现出了稳健的增长态势。具体来看,第四季度营收达到了737亿元,同比显著增长22.6%。值得一提的是,净利润实现了扭亏为盈,达到22亿元,而去年同期则为亏损11亿元。经过调整后,净利润更是增长至43.7亿元,远高于去年同期的8.3亿元。站长网2024-03-23 05:18:470001AI生成的新闻主播正在成为印度头条新闻
人工智能生成的新闻主播在印度引起了轰动。据外媒报道,印度的新闻频道和数字平台OdishaTV最近测试了人工智能生成的新闻主播Lisa。Lisa的声音单调,眼睛眨眼时也不会完全闭上,她会定期播报网络新闻头条。Lisa是过去三个月印度新闻网络中添加的两个多语言聊天机器人之一。Sana是另一位人工智能生成的新闻主播,为《今日印度》集团旗下的AajTak网络“工作”。站长网2023-07-26 16:13:050000美团直播:排头兵先行,主力军未动
折扣给得扎实,用户薅得开心,商家进度“参差不齐”。“1.5元买到了甜啦啦的冰鲜柠檬水”“6元拿下原价16元一杯的Tims鲜萃咖啡,咖啡爱好者的快活”“抢到了6份一块钱的古茗,还有1份1块钱的瑞幸美式咖啡”在刚过去的7月18日美团“神券节官方直播间”开播当日,不乏有美团用户在小红书上兴奋得分享着“战利品”。继八年前的“外卖大战”后,“个位数点外卖”的“羊毛”又重出江湖了。站长网2023-07-21 22:05:350000iQOO WATCH支持手表独立通信 eSIM模式至高续航7天
iQOO手机即将在12月27日19:00举行新品发布会,届时将带来iQOONeo9系列以及全新的iQOOWATCH。据悉,iQOOWATCH将会支持手表独立通信,成为真智能通话助手”。在eSIM模式至高续航7天,蓝牙模式至高续航16天。此外,iQOOWATCH还搭载了vivo自研蓝河操作系统,号称天生更智慧、更流畅、更安全”。0000英特尔 CFO:预期 AI 的发展将超越 GPU 范围 涵盖到 CPU 领域产品
英特尔公司的股价上涨了约5%,这是在芯片制造商的首席财务官周三表示,公司有望达到第二季度收入预测的上限。在游戏和人工智能芯片公司英伟达季度收入预测震惊华尔街之后,半导体股在过去一周出现了反弹,该公司押注于人工智能工具的快速采用。站长网2023-06-03 13:06:070000