英伟达与 Anyscale 合作:提高大型语言模型和生成式 AI 应用的开发效率
用于生成式 AI 工具的大型语言模型通常会极大地增加对更多处理器的需求,这些处理器通常价格昂贵且供应受限。即使是云资源也不能总是解决企业试图扩展规模并利用最新的生成式 AI 技术所面临的问题。

图片来自NVIDIA
「GPU 芯片的扩展迟早将无法跟上模型大小的增长。」Gartner Research 副总裁兼杰出分析师 Avivah Litan 在接受 Computerworld 采访时表示。因此,「继续制造越来越大的模型不是可行选项。」
市场上最大的 GPU 制造商英伟达显然看到了开源软件提高 AI 开发和效率方面价值。周一,Anyscale 宣布将英伟达 AI 引入 Ray 开源和 Anyscale 平台中。英伟达 AI 还将在 Anyscale Endpoints 中运行,该服务可帮助应用程序开发人员使用流行的开源模型(如 Code Llama、Falcon、Llama 2、SDXL 等)嵌入 LLMs 到其应用程序中。
最近宣布的 Nvidia TensorRT-LLM 将支持 Anyscale 以及 Nvidia AI Enterprise 软件平台。它可用于自动扩展推理以在多个 GPU 上并行运行模型,从而在运行 Nvidia H100 Tensore Core GPU 时提供 8 倍的性能提升,英伟达在博客中表示。
此外,英伟达 Triton Interence Server 软件支持在 GPU、CPU 和其他处理器上跨云、数据中心、边缘和嵌入式设备进行推理。当与 Ray 集成时,开发人员可以提高来自各种框架的 AI 模型(包括 TensorRT、TensorFlow、PyTorch、ONNX、OpenVINO 等)的效率。
Anyscale 声称其 Ray 是全球增长最快的可扩展计算统一框架。英伟达 NeMo 是一个面向云原生的框架,可以被 Ray 开发人员用于为客户提供 LLMs。
「我们与英伟达的合作将为 Anyscale 的产品组合带来更多性能和效率,以便开发人员随处创建具有前所未有速度和效率的 LLMs 和生成 AI 应用程序。」Anyscale 首席执行官兼联合创始人 Robert Nishihara 在一份声明中表示。
英伟达高管抛售1.8亿美元股票 月度减持创下6年新高
近期,虽然大多数企业内部人士纷纷押注于自家公司股票,但与此不同的是,作为标准普尔500指数表现最佳的英伟达公司却迎来了高管们的疯狂套现潮。根据最新数据显示,在刚刚过去的11月,英伟达的高管和董事们共计出售或计划出售约37万股公司股票,总价值约1.8亿美元。如果所有计划中的股票全部售出,这将是英伟达高管6年来进行的最大规模的月度减持。站长网2023-12-05 11:03:210000产业链人士:苹果 iPhone 15 Pro 系列取消固态按键设计属实 延后可能性大
日前分析师郭明錤分享的最新信息称,下一代iPhone15Pro和iPhone15ProMax将不再采用固态按钮,原因是「在大规模生产前尚未解决技术问题」。站长网2023-04-13 08:58:340000AMD第三季度业绩强势增长353% 第四季度营收展望未达预期
北京时间11月1日消息,美国芯片制造商高级微设备公司(AMD)今天公布了2023财年第三季度财报。报告显示,AMD第三季度净利润同比大增353%,达到2.99亿美元,但给出的第四季度营收展望低于华尔街分析师的预期。0000百度星河社区 ERNIE Bot SDK开放文心大模型4.0开发权限申请
在2023年百度世界大会上,百度宣布发布了文心大模型4.0。相比于之前的版本,文心大模型4.0在理解、生成、逻辑、记忆四个方面都有显著的提升。目前,星河社区ERNIEBotSDK正式开放文心大模型4.0的开发权限申请。开发者可以使用ERNIEBotSDK开发文心一言应用、开发文心一言插件,甚至可以接入自有产品。站长网2023-10-26 08:46:570000微博上线AI评论机器人“罗伯特” 看到评论后网友崩不住了
微博的AI评论机器人在社交网络上引起了巨大轰动。该机器人以其抽象、幽默的评论风格,赢得了用户的喜爱,成为热搜榜上的常客。官方给它的定位是:天生的捧哏,有趣的灵魂,不知疲倦的显眼包。站长网2024-01-10 11:46:130000