Llama 2 如何成为 IBM 战略的核心:具备潜在成功的所有要素
IBM 最近宣布将在 watsonx.ai 托管 Meta 的 Llama 2-chat 700 亿参数模型,并向选择的客户和合作伙伴提供早期访问权限。
企业现在正在采用生成式人工智能的趋势来增强他们的业务战略。为了有效利用其潜力,他们需要简化的方法来训练和构建自己的 LLM,利用他们多年积累的数据。为了解决这个挑战,包括 AWS 和 Azure 在内的各种云服务提供商已加紧提供帮助。
OpenAI 与微软合作获得了 GPT-4,而 AWS 则通过多 LLM 方法给出了可以选择使用像 AI21、Cohere、Anthropic Claude 2和Stability AI SDXL 1.0 等多个模型选项。除了知名云服务外,最近还出现了其他几家服务提供商。
企业寻求可信赖且值得信赖的解决方案。最近,人工智能爱好者已经开发出一些方法来训练和构建 Llama 2 模型,但关键问题仍然是:这些方法是否可以可靠地处理数据?
几天前,AI 专家 Santiago 发推文称「您现在可以在不到 10 分钟内测试 Llama 2」,介绍了 Monster API 这个新工具,它可以轻松访问强大的生成式 AI 模型,如 Falcon、Llama、Stable Diffusion 和 GPT J 等,而无需担心管理这些生成式 AI 模型或扩展它们以处理大量请求。
然而,像这样的新举措对于已经建立起来的公司来说太冒险了,他们还没有证明自己能够扩展业务。
IBM 赢得了客户的信任
IBM 致力于在引入其生成式人工智能功能时优先考虑信任和安全性。例如,在用户使用 watsonx.ai 中的 Prompt lab 中使用 Llama 2 模型时,他们可以激活 AI 护栏功能。这有助于自动过滤输入提示文本和模型生成输出中的有害语言。
IBM 印度及南亚技术首席技术官兼技术销售负责人 Geeta Gurnani 表示,IBM 正在推出一款预计今年晚些时候将正式发布的 AI 治理工具包,该工具包将帮助实施治理以减轻与手动流程相关联的风险、时间和成本,并提供驱动透明可解释结果所需的文档。
她说:「它还将具备保护客户隐私、主动检测模型偏见和漂移,并帮助组织满足其道德标准的机制。」
为什么选择 Llama 2 而不是 GPT-4
Llama 2 在企业中受到了欢迎。这可以通过它在 Amazon Sagemaker、Databricks、Watsonx.ai 甚至是微软 Azure 上都可用来作为专有 LLM GPT-4 的基础来证明。
此外,Meta 与亚马逊、Hugging Face、英伟达、高通、Zoom 和 Dropbox 等多家知名公司以及学术领导者之间的合作伙伴关系强调了开源软件的重要性。
即使是深度学习领域的著名人物 Karpathy 也无法抵挡使用 Llama 2 的诱惑,他创建了 Baby Llama(又称 llama.c),他一直在探索在一台计算机上运行大型语言模型 (LLM) 的概念。此外,他甚至暗示 OpenAI 可能会在不久的将来发布开源模型。
同样,AI 专家 Santiago 表示,Llama 2 具备潜在成功的所有要素:开源、拥有商业许可、成本效益高的 GPU 使用以及对整个利用过程的全面控制。
他表示:「我和两家初创公司交流过,它们正在从专有模型转向 Llama 2。还会有多少公司放弃商业替代品而选择 Llama 2 呢?」
GPT-4 只能通过微软 Azure OpenAI 服务进行访问,但企业也可以购买 OpenAI 提供的 GPT-4 API。然而,GPT-4 的限制在于其闭源性质,用户无法创建自己的模型或尝试修改其代码。与免费商用的 Llama 2 不同,GPT-4 API 是需要付费使用的。收费按照每 1000 个 tokens 计算,输入为 0.03 美元,输出为 0.06 美元。
根据 AIM Research 数据,在稍微复杂一些的应用场景中,一个月使用 GPT-4 API 进行推理可能需要花费 25 万到 30 万美元(16K 上下文长度)。因此,在使用 ChatGPT API 时必须注意标记使用情况并有效管理以控制成本。
最初观察到这一季度公司倾向于 Azure 来获取独占权访问 GPT-4,并进而提升了 Azure 云的收入。然而,当微软与 Meta 合作托管 Llama 2 时,情况发生了有趣的变化。这凸显出开源 LLM 具有独特优势,不容忽视。
OpenAI拟在11月6日推出重大更新 为开发者降低开发成本
据路透社报道,OpenAI计划在下个月为开发者推出新的重大更新,以降低基于其人工智能模型的软件应用的开发成本和时间。这些更新包括添加内存存储功能,可以节省高达20倍的成本,以及新的视觉功能,使开发者能够构建具有分析图像并描述它们的能力的应用。OpenAI计划在11月6日举行的首次开发者大会上推出这些新功能,旨在鼓励企业使用OpenAI的技术来构建基于人工智能的聊天机器人和自主智能体。站长网2023-10-12 08:24:400000百度文心一言响应速度一个月提高十倍 后台成本大幅降低
在昨日的人工智能专利运用助推产业发展论坛上,百度首席技术官(CTO)王海峰表示,百度是全球为数不多,进行全栈布局人工智能的公司。从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,再到自动驾驶、小度、智能云等应用,都有领先业界的自研技术。站长网2023-04-27 08:33:210000共建未成年人“清朗”网络空间承诺书
互联网已经成为未成年人学习、生活、娱乐和社交的重要空间,新冠疫情发生以来,在线教育迅速普及。为响应国家网信办“清朗”未成年人暑期网络环境专项整治行动,营造“清朗”网络空间,为未成年人提供一个绿色、健康、文明、和谐的在线教育和网络生活环境,作为厦门属地网站平台的代表,自愿履行以下承诺:一、净化网络环境,清朗网络空间,持续践行社会主义核心价值观,坚定“四个自信”,持续净化未成年人上网环境。0001科大讯飞携手华为启动AI存力底座联合创新项目
7月24日,科大讯飞携手华为数据存储,正式启动了AI存力底座的联合创新项目,旨在通过双方合作,共同打造面向AI大模型场景的最佳数据存储解决方案。为此,双方将依托联合创新,在数据存储服务可靠性、算力和存力协同体系研究、数据全生命周期管理等技术方向上寻求突破。通过AI存力在AI大模型时代的创新实践,为产业提供高价值的可借鉴经验。站长网2023-07-26 15:01:200000Adobe 正致力于开发「Project Fast Fill」生成式人工智能视频处理技术
站长之家(ChinaZ.com)10月13日消息:Adobe正在展示一个名为ProjectFastFill的新的生成填充功能,它可以借助AI的力量轻松在视频中添加或删除对象。这是该公司在今年的MAX大会上宣布的几项新的实验性AI功能之一。ProjectFastFill能够在运动中更换人物的服装配饰或从风景画的背景中删除游客。站长网2023-10-13 12:01:310000