Databricks 以 13 亿美元收购 OpenAI 竞争对手 MosaicML:打造企业定制化生成式 AI 模型的未来
Databricks 同意以约 13 亿美元的估值收购生成式人工智能初创公司 MosaicML,此举旨在满足企业构建类似 ChatGPT 的工具的快速增长需求。

总部位于旧金山的数据存储和管理初创公司 Databricks 表示,此次交易将其支持人工智能的数据管理技术与 MosaicML 的语言模型平台相结合,使企业能够利用专有数据自行构建低成本的语言模型。目前,大多数企业依赖于在网络上公开数据中训练的第三方语言模型。
同样总部位于旧金山的 MosaicML 成立于 2021 年,将成为 Databricks 的一个独立服务。据 MosaicML 的联合创始人兼首席执行官 Naveen Rao 称,该公司专注于将使用生成式人工智能的成本从数千万美元降低到每个模型数十万美元。MosaicML 目前拥有 62 名员工,并已筹集了 6400 万美元的资金。
预计该交易将在 Databricks 截至于 7 月 31 日的第二季度结束时完成。
生成式人工智能应用程序旨在根据用户的自然语言提示生成原创文本、图像和计算机代码。自从 AI 初创公司 OpenAI 在去年 11 月推出 ChatGPT 在线生成式 AI 聊天机器人以来,企业对该技术的兴趣大幅增长。
像 Anthropic 和 OpenAI 这样的公司会向企业授权现成的语言模型,然后企业在其基础上构建生成式 AI 应用程序。由于这些模型的强劲商业需求,生成式 AI 市场迅速扩大,为像 MosaicML 这样的初创公司创造了机会,他们声称可以以更低的成本提供类似的 AI 模型,并根据公司的数据进行定制。
Databricks 首席执行官 Ali Ghodsi 表示:「如果你从零开始构建一个模型,就知道要为其提供什么内容。」Ghodsi 说,现成的模型因已在互联网数据上进行了训练,其中充斥着可能会扭曲结果的无关信息。他说,许多公司也担心与外部供应商共享其数据所涉及的隐私和安全问题。
一些机器学习专家和 AI 供应商表示,像 ChatGPT 这样的大型语言模型的计算和综合能力超过了小型模型,但后者在特定领域具有有限但强大的功能。毕马威美国人工智能负责人 Sreekar Krishna 表示,数据管理和确定哪些模型最适合特定的用途仍然面临持续的挑战。
「数据一直是成功的关键因素,」Krishna 说,随着大型语言模型的出现,对数据的需求只会增加。
企业技术领导者正面临着准备他们的数据,以用于 AI 模型的压力。数据是所有算法的基础,因为它们用于教授算法从中提取模式并做出预测。像 Replit 这样的公司,提供编程工具,已经在使用 Databricks 作为数据管道,并将这些信息传输到 MosaicML 来训练代码生成模型。
Databricks 技术被称为 Lakehouse,旨在为 AI 应用准备和管理企业数据,统一数据、分析和 AI 编程工具到一个系统中。Databricks 通过出租分析、AI 及其他基于云的软件,以利用 AI-ready 数据为构建企业技术系统提供「镐和铲子」,从中赚取收入。去年,Databricks 报告了超过 10 亿美元的年收入。
据 PitchBook 数据这家市场分析公司称,全球生成性 AI 市场的支出预计将在今年年底达到 426 亿美元,并以每年 32% 的复合年增长率增长到 2026 年的 981 亿美元。它表示,生成式 AI 初创企业获得的风险投资从 2022 年总额 48 亿美元增长到了 2023 年前 5 个月的 127 亿美元。
Databricks 成立于十年前,由加州伯克利的一组数据科学家创建,经过 2021 年 8 月的 16 亿美元筹资轮后,私募市场估值为 380 亿美元。它的投资者包括摩根士丹利的 Counterpoint Global、安德烈森·霍洛维茨、贝莱·吉福德、UC 投资以及 ClearBridge 投资。
生物制药服务公司 Syneos HeAlth 的首席信息和数字官 Larry Pickett 表示,专门的医疗数据训练模型的当前成本估计为 100 万至 200 万美元。分析人士说,那些「特定领域」的模型对公司来说比 ChatGPT 更有用,因为它们拥有更多行业术语和专业知识。
但 Pickett 期望 Syneos HeAlth 可以通过使用较小的预训练模型,而不是基于 OpenAI 完整数据语料库来构建的模型,花费显著的较少资金。「并非每个人、每个应用都需要 GPT-4,」Krishna 说,他指的是 OpenAI 的大型语言模型。大型语言模型正在变得精细,用于非常特定的应用,他说,「到了那个时候,它非常小,可以嵌入任何手机中」。
国产ChatGPT命名图鉴
很久不见这般热闹的春天。随着ChatGPT的威名席卷全球,大洋对岸的中国厂商也纷纷亮剑,各式本土大模型你方唱罢我登场,声势浩大的发布会排满日程表。有趣的是,在这些大模型产品初入历史舞台之时,带给世人的第一印象其实不是以亿为单位的参数规模,也不是那些遍布英文缩写的模型特征。事实上,人们第一眼见到的只是名字。具体来说,是一个又一个奇特甚至稍显玄奥的词组。站长网2023-04-26 18:17:530003解读快手直播两大政策迭代:新公会最高87%分成,优质主播最高1.8万现金保底
视频直播政策调整新公会最高享87%分成奖励新播场了解到,快手直播对娱乐公会的视频直播政策做出的调整。具体调整内容为——(1)新增了「新公会扶持任务」;(2)调整了「新主播任务」;(3)调整了「努力值任务」。随着这三项任务的调整,快手视频直播的基础政策也由此产生了新的变化。首先,新政策中增加了「新公会扶持任务」,该任务设置了最高17%的分成奖励。站长网2023-09-01 11:51:310000AI监管新思路 让AI相互监督!
生成式人工智能的发展速度已经超出了所有人的预期,我们在享受AI带来的便利的同时,对相关内容和技术的监管也成为一大难题。为此,有人提出了一种全新的AI监管角度:为每个AI注入「灵魂」,让AI相互监督、竞争和告密。当前AI的发展速度已超出预期,让人们对其监管感到担忧。然而,传统的监管方法可能无法跟上AI的步伐。站长网2023-07-20 11:07:590000深扒一个正被游戏行业「抢占」的流量帝国
距离2025只剩不到半个月,海外市场也将迎来近期最重要的一个营销节点:Q5。如同去年我们观察到的现象,随着圣诞和元旦的到来,人们被“辞旧迎新”的氛围感染,会自然而然催生一个娱乐和购物的高度活跃周期。尤其是对游戏产品而言,不仅玩家会更积极地接受新产品、新的付费项目,不少游戏的买量成本也会有所下降。比如Pangle等多个广告平台都观测到CPI下降的趋势。0000DeepMind新机器学习模型UniSim:模拟现实以训练机器人和游戏角色
划重点:-GoogleDeepMind与多所大学合作,研发出一款新的机器学习模型UniSim,用于创建逼真的模拟环境,用于培训各类人工智能系统。-UniSim的特点是能够模拟现实世界的互动,包括高级指令和低级控制,为其他需要真实世界数据的模型提供训练示例。-UniSim的应用潜力广泛,包括培训机器人、游戏角色,以及填补模拟和现实世界之间的鸿沟。站长网2023-10-18 21:24:290000