IBM 推出高效 LLM 基准测试方法，计算成本降低99%

站长网2024-06-04 14:56:300阅

划重点:

⭐️ IBM 研究推出了一种创新的 LLM 基准测试方法，可以将计算成本降低99%。

⭐️ 该高效方法利用微型化基准测试，显著减少了评估 LLM 所需的时间和金钱成本。

⭐️ 新方法已经引起 AI 社区的关注，并被广泛采用，有望推动人工智能模型评估领域的快速发展。

IBM 研究发布了一项突破性的 LLM（大型语言模型）基准测试方法，承诺将计算成本降低高达99%。传统的基准测试，如斯坦福的 HELM，需要耗费超过一天的时间，并且成本高达1万美元，这对开发人员和研究人员来说是一个昂贵的过程。随着 LLMs 能力的增强，基准测试的过程变得更加严格，需要大量的计算能力和时间。

IBM 的创新方法源自以色列的 IBM 研究实验室，由 Leshem Choshen 领导的团队开发了一种新方法，大幅降低基准测试的成本。他们并非运行全尺寸基准测试，而是设计了一个使用原始基准测试规模的1% 的 “微型” 版本。令人惊讶的是，这些微型基准测试已被证明几乎同样有效，可以在98% 的准确度内估计出全尺寸测试的性能。

该团队利用人工智能从完整基准测试中选择最具代表性的问题，包含在微小版本中。这种选择性方法确保较小的基准测试仍然高度预测整体模型性能，消除了不贡献有意义评估的冗余或无关紧要的问题。

IBM 的高效方法引起了 AI 社区的关注，尤其是在2023年 NeurIPS 的高效 LLM 比赛中。面临使用有限计算资源评估大量模型的挑战，组织者与 IBM 合作实施了一个名为 Flash HELM 的简化基准测试。这种高效方法使他们能够迅速淘汰表现较差的模型，并将计算资源集中在最有前途的候选模型上，从而进行及时和具有成本效益的评估。

Flash HELM 的成功展示了 IBM 高效基准测试方法的潜力，促使其在 IBM 的 watsonx 平台上评估所有 LLMs。成本节约可观;例如，在像 HELM 这样的基准测试中评估 Granite13B 模型可能耗费高达1000个 GPU 小时，但使用高效基准测试方法显著降低了这些成本。

高效基准测试不仅降低成本，还通过允许更快速地迭代和测试新算法来加速创新。IBM 研究人员，包括 Youssef Mroueh 在内，指出这些方法使得更快速、更经济的评估成为可能，促进了更加灵活的发展过程。

这一概念已经超出了 IBM 的范畴。斯坦福实施了 Efficient-HELM，这是其传统基准测试的简化版本，为开发人员提供了选择示例数量和希望分配的计算资源量的灵活性。这一做法强调了一个新兴共识，即更大的基准测试不一定意味着更好的评估。

“大型基准测试不一定通过变得更大而增加价值，”Choshen 说。“这是我们的见解，我们希望它能够引领更快速、更经济的 LLM 性能评估方法。”

IBM 的高效基准测试方法代表了人工智能领域的重大进步，为评估先进语言模型所需的不断增加的成本和资源需求提供了实际解决方案。

IBM推出高效LLM基准测试方法计算成本降低99

0000

评论列表

共(0)条

相关推荐

站长资讯
太快了！文生图片只需1秒，开源SDXL Turbo来啦！
11月29日，著名开源生成式AI平台Stability.ai在官网发布了，开源文生图模型SDXLTurbo。根据使用体验，SDXLTurbo的生成图像效率非常快，可以做到实时响应（可能小于1秒）。在你输入完最后一个文本后，图像就能马上显示，推理效率超过了Midjourney、DALL·E3以及Stability.ai自己开发的StableDifusion系列模型。
站长网2023-11-29 11:06:59
0001
站长资讯
英国将建造最快的超级计算机以引领人工智能
划重点:-英国政府公布了一台新的2.25亿英镑的人工智能超级计算机，由Nvidia和HPE的硬件提供支持。-这台名为Isambard-AI的超级计算机将设在布里斯托尔大学，使用HPE的CrayEX超级计算机和Nvidia的5，448个最先进的GraceHopper200Superchip。-该超级计算机将用于研究人员探索机器人技术、气候研究和药物发现等领域的人工智能应用。
站长网2023-11-02 14:25:03
0000
站长资讯
iPhone15ProMax或更名iPhone15Ultra 证实使用新静音按键
博主MaJinBu昨天在推特上发布了许多iPhone15系列手机保护壳的照片。他声称这些保护壳已经开始在中国生产。与此同时，原本属于“iPhone15ProMax”的旗舰机型的保护壳包装盒上已经印有“iPhone15Ultra”的字样。在最近的一条澄清推文中，泄密者明确表示“这些是复制品，不是官方产品”。这意味着这些保护壳可能不是来自苹果的供应商，实际上可能并非真正的产品。
站长网2023-08-07 12:00:51
0000
站长资讯
阿里巴巴称阿里云将继续分拆上市
阿里巴巴在港交所公告称，按照阿里巴巴集团于2023年6月20日宣布的计划，公司已于今日完成领导层交接，由蔡崇信接任公司董事会主席及吴泳铭接任公司首席执行官及董事。另外，公司宣布吴泳铭将接替张勇出任阿里云智能集团代理董事长兼首席执行官，委任于2023年9月10日生效。
站长网2023-09-11 08:26:23
0000
站长资讯
百度发布医疗大模型“灵医大模型”
9月19日，百度正式发布国内首个“产业级”医疗大模型——灵医大模型。发布会上，百度正式宣布面向大健康上下游产业开放灵医大模型测评、试用，推动医疗行业的数字化和智能化进程。据了解，灵医大模型已与固生堂、零假设等达成合作，并已定向向公立医院、药械企业、互联网医院平台、连锁药房等200多家医疗机构开放体验。
站长网2023-09-20 08:17:27
0000