Meta 开放 LLaMA 2 模型使得人工智能竞赛可能结束比预期的早
最近的一项交易表明,人工智能领域可能会看到越来越多的合作伙伴关系,而不仅仅是一对一的竞争。Meta 早先本周在开放许可下免费提供其 LLaMA 2 大型语言模型,并将其引入微软的 Azure 平台。

这一决定突显了 AI 互操作性的好处,随着更多公司加入这个领域,这可能不会是最后一个类似的合作。
到目前为止,已知的 LLM 都相对孤立,以更受控制的环境提供,用户需要获得权限才能构建模型或使用数据。OpenAI 继续培训 GPT,在 3 月发布了 GPT-4,并向开发者提供付费 API 访问其最新版本的模型。苹果正在开发自己的 LLM,名为 Ajax,尽管细节不多,但它尚未公开,其开源状态也未知。谷歌的 LLM Bard 根本不是开源的。
LLaMA 最初并不对公众开放,只能通过 Meta 访问,而 Meta 还未透露其训练数据。但 LLaMA 一直被设想为开源,并且旨在「进一步实现普惠性 AI」。本周,Meta 在某种程度上兑现了这一承诺。封闭系统的用户必须支付许可费用才能访问模型所在的位置,并分发使用该模型的应用程序。
Meta 开放 LLaMa 并将其引入 Azure 具有商业意义,特别是如果 Meta 相信公开开发人工智能的话。这是让人们在平台上访问更多 LLM 模型并比较结果的第一步。有更多种类的 LLM 框架可供选择,也凸显了每个模型如何相互配合的问题。LLM 开发者希望人们使用他们的模型,因此在多种平台上提供这些模型将使它们更多地接触到用户。
即使是最具竞争力的大型科技公司也会彼此合作。Meta 与微软合作并不陌生,Meta 将微软的 Teams 产品引入了 Workplace by Meta,该平台已经运行 Office 365 套件。
开放性也存在风险。OpenAI 的联合创始人兼首席科学家 Ilya Sutskever 表示,2015 年成立时,他们更加开放,现在对于分享研究,他对此表示遗憾,担心竞争和安全问题。开放数据集使起诉版权侵权变得更容易,因为人们可以看到哪些来源被用来收集数据来训练模型。
但是,可以选择更多 LLM 框架对于 AI 互操作性的倡导者来说可能是个好消息。由于 LLM 默认情况下是彼此不同的,开发者通常必须选择使用哪个模型来构建应用程序。系统之间没有良好的交流方式。
封闭的生态系统对于大多数现代科技用户来说并不奇怪,但 AI 互操作性倡导者认为,AI 唯一能够成长和发展的方式不是通过封闭的生态系统,而是通过可以相互交流的开放结构。甚至微软也相信可互操作的 AI;它加入了其他科技公司,成为了开放神经网络交换(ONNX)的一员,该组织旨在推广 AI 互操作性的行业标准,使开发者能够「找到正确的工具组合」。
让 AI 系统相互协作可能会为搜索等方面带来更好的结果。能够在不同数据集上训练模型的公司可以提供更好、更全面的服务,如果一个模型出现错误,还可以避免对信息来源的过度依赖。能够在一个地方同时开发 LLaMA 和 OpenAI 的 GPT 模型也可以降低开发成本和时间。
目前,LLaMA 在 Azure 上可用并不意味着使用 LLaMA 创建的应用程序可以直接与运行在 OpenAI 的 GPT 模型的应用程序进行交流。目前还没有人创造出这样的桥梁。
此外,并不是所有人都认为 LLaMA 符合开源软件的所有要求,特别是因为它没有使用开源计划认证(Open Source Initiative)批准的许可证,并且限制了谁可以在不付费的情况下商业使用 LLaMA。根据其社区许可协议,每月活跃用户超过 7 亿的开发者「必须向 Meta 申请许可」。
但这对于开源和互操作性来说是朝着正确的方向迈出的一大步,即使仅仅是为了让开发者更容易在不同模型之间进行访问。良性竞争是可以接受的,但如果公司真的希望 AI 发展,合作是最好的选择。
阿里大模型又开源!能读图会识物,基于通义千问7B打造,可商用
阿里开源大模型,又上新了~继通义千问-7B(Qwen-7B)之后,阿里云又推出了大规模视觉语言模型Qwen-VL,并且一上线就直接开源。具体来说,Qwen-VL是基于通义千问-7B打造的多模态大模型,支持图像、文本、检测框等多种输入,并且在文本之外,也支持检测框的输出。举个例子,我们输入一张阿尼亚的图片,通过问答的形式,Qwen-VL-Chat既能概括图片内容,也能定位到图片中的阿尼亚。站长网2023-08-26 17:26:150001滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion
DeepSeek大爆出圈,现在连夜发布新模型——多模态Janus-Pro-7B,发布即开源。在GenEval和DPG-Bench基准测试中击败了DALL-E3和StableDiffusion。想必大家这几天完全被DeepSeek刷屏了吧。0000每周AI大事件 | 文心一言上线5大插件、OpenAI宣布首笔公开收购、GPT-4新增审核功能
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。PART1动态[国内要闻]1.B站称已将大模型应用于旗下业务站长网2023-08-19 01:13:090005Captury创新3D体积扫描技术 实现真实动态捕捉
Captury公司近日推出了一项革命性的3D体积扫描技术,通过高分辨率摄像头实时捕捉纹理和网格数据,能够创建人物或物体的真实3D模型,无论是静止还是运动中的状态。这项技术的推出,无疑将对3D建模、动画制作、游戏开发等领域产生深远影响。站长网2024-03-18 15:27:080001谷歌拟在 5 年内完成AI芯片自主研发 放弃博通供应
据国外媒体报道,知情人士透露,谷歌计划最早在2027年放弃芯片供应商博通,转为自主研发AI服务器芯片。今年早些时候,谷歌与博通就芯片定价问题未达成一致,导致谷歌做出放弃博通的决定。消息传出后,业内对谷歌的此举给予广泛关注。分析认为,自主设计TPU芯片有助谷歌每年节省数十亿美元成本。目前,谷歌正在大力投入AI技术研发,其中芯片研发成本Especially高。放弃博通供应,有助降低成本支出。站长网2023-09-22 11:14:320000