Llama 2 如何成为 IBM 战略的核心:具备潜在成功的所有要素
IBM 最近宣布将在 watsonx.ai 托管 Meta 的 Llama 2-chat 700 亿参数模型,并向选择的客户和合作伙伴提供早期访问权限。
企业现在正在采用生成式人工智能的趋势来增强他们的业务战略。为了有效利用其潜力,他们需要简化的方法来训练和构建自己的 LLM,利用他们多年积累的数据。为了解决这个挑战,包括 AWS 和 Azure 在内的各种云服务提供商已加紧提供帮助。
OpenAI 与微软合作获得了 GPT-4,而 AWS 则通过多 LLM 方法给出了可以选择使用像 AI21、Cohere、Anthropic Claude 2和Stability AI SDXL 1.0 等多个模型选项。除了知名云服务外,最近还出现了其他几家服务提供商。
企业寻求可信赖且值得信赖的解决方案。最近,人工智能爱好者已经开发出一些方法来训练和构建 Llama 2 模型,但关键问题仍然是:这些方法是否可以可靠地处理数据?
几天前,AI 专家 Santiago 发推文称「您现在可以在不到 10 分钟内测试 Llama 2」,介绍了 Monster API 这个新工具,它可以轻松访问强大的生成式 AI 模型,如 Falcon、Llama、Stable Diffusion 和 GPT J 等,而无需担心管理这些生成式 AI 模型或扩展它们以处理大量请求。
然而,像这样的新举措对于已经建立起来的公司来说太冒险了,他们还没有证明自己能够扩展业务。
IBM 赢得了客户的信任
IBM 致力于在引入其生成式人工智能功能时优先考虑信任和安全性。例如,在用户使用 watsonx.ai 中的 Prompt lab 中使用 Llama 2 模型时,他们可以激活 AI 护栏功能。这有助于自动过滤输入提示文本和模型生成输出中的有害语言。
IBM 印度及南亚技术首席技术官兼技术销售负责人 Geeta Gurnani 表示,IBM 正在推出一款预计今年晚些时候将正式发布的 AI 治理工具包,该工具包将帮助实施治理以减轻与手动流程相关联的风险、时间和成本,并提供驱动透明可解释结果所需的文档。
她说:「它还将具备保护客户隐私、主动检测模型偏见和漂移,并帮助组织满足其道德标准的机制。」
为什么选择 Llama 2 而不是 GPT-4
Llama 2 在企业中受到了欢迎。这可以通过它在 Amazon Sagemaker、Databricks、Watsonx.ai 甚至是微软 Azure 上都可用来作为专有 LLM GPT-4 的基础来证明。
此外,Meta 与亚马逊、Hugging Face、英伟达、高通、Zoom 和 Dropbox 等多家知名公司以及学术领导者之间的合作伙伴关系强调了开源软件的重要性。
即使是深度学习领域的著名人物 Karpathy 也无法抵挡使用 Llama 2 的诱惑,他创建了 Baby Llama(又称 llama.c),他一直在探索在一台计算机上运行大型语言模型 (LLM) 的概念。此外,他甚至暗示 OpenAI 可能会在不久的将来发布开源模型。
同样,AI 专家 Santiago 表示,Llama 2 具备潜在成功的所有要素:开源、拥有商业许可、成本效益高的 GPU 使用以及对整个利用过程的全面控制。
他表示:「我和两家初创公司交流过,它们正在从专有模型转向 Llama 2。还会有多少公司放弃商业替代品而选择 Llama 2 呢?」
GPT-4 只能通过微软 Azure OpenAI 服务进行访问,但企业也可以购买 OpenAI 提供的 GPT-4 API。然而,GPT-4 的限制在于其闭源性质,用户无法创建自己的模型或尝试修改其代码。与免费商用的 Llama 2 不同,GPT-4 API 是需要付费使用的。收费按照每 1000 个 tokens 计算,输入为 0.03 美元,输出为 0.06 美元。
根据 AIM Research 数据,在稍微复杂一些的应用场景中,一个月使用 GPT-4 API 进行推理可能需要花费 25 万到 30 万美元(16K 上下文长度)。因此,在使用 ChatGPT API 时必须注意标记使用情况并有效管理以控制成本。
最初观察到这一季度公司倾向于 Azure 来获取独占权访问 GPT-4,并进而提升了 Azure 云的收入。然而,当微软与 Meta 合作托管 Llama 2 时,情况发生了有趣的变化。这凸显出开源 LLM 具有独特优势,不容忽视。
重现当年AlphaGo神来之笔!DeepMind新AI发现提速70%排序算法,十年都没更的C++库更新了
DeepMind又双叒叕带着重磅成果登Nature了!这一次,他们又一强化学习AI,在计算机领域最最最基础的两个算法上做了新突破:一个是排序算法,发现了速度最高可提升70%的新实现;另一个是哈希算法,也找到了速度提高30%的新方法。不仅如此,该AI所用方法被称为“重现当年AlphaGo的神来之笔”,也就是看似违法直觉,实则一举击败人类高手李世石的那次。站长网2023-06-11 22:41:510000JoJoGAN:可一键生成艺术化面部图像的深度学习模型
JoJoGAN是一个深度学习模型,该模型可以将普通的面部图像转化为艺术化的作品,无需专业艺术家或设计师的干预。这项技术可用于各种应用领域,包括艺术创作、虚拟角色设计、社交媒体滤镜和广告营销。项目地址:https://www.aimodels.fyi/models/replicate/903681b6-e6d3-428c-b611-f6afb60b3d18站长网2023-09-19 10:38:380000微软开源GraphRAG:极大增强大模型问答、摘要、推理
7月3日,微软在官网开源了基于图的RAG(检索增强生成)——GraphRAG。为了增强大模型的搜索、问答、摘要、推理等能力,RAG已经成为GPT-4、Qwen-2、文心一言、讯飞星火、Gemini等国内外知名大模型标配功能。传统的RAG系统在处理外部数据源时,只是简单地将文档转换为文本,将其分割为片段,然后嵌入到向量空间中,使得相似的语义对应相近的位置。站长网2024-07-03 09:00:050001北京市消协发布端午节消费提示:抵制过度包装
今日,北京市消费者协会发布端午节消费提示,提醒广大消费者在假日期间理性消费,自觉抵制过度包装。北京消协称,端午节购买粽子产品,要尽量选择正规商场超市,不要被“低价”“优惠”等促销广告迷惑,不要购买过度包装的粽子产品。对于明显低于市场售价的粽子产品,或流动摊贩售卖的产品,应当谨慎选择。站长网2023-06-22 11:27:200000腾讯QQ发布25岁生日活动 转发消息可获得太阳头像挂件
站长之家(ChinaZ.com)2月7日消息:《今天是腾讯QQ的25岁生日,转发这个消息,你的QQ会获得一个限定版“太阳”。》2月10日,是QQ的25岁生日。为了感谢大家多年的陪伴与支持,QQ特意准备了一份特别的礼物——限定版“太阳挂件”。从2月7日开始,到2月13日结束,只要你在QQ上转发这条消息给你的好友或群组,就可以免费领取这个独特的挂件,让你的QQ更加独特和闪耀。站长网2024-02-07 14:23:160000