马斯克19天建成世界最强AI集群!10万块H100「液冷怪兽」即将觉醒
凌晨4:20,大洋彼岸的最大超算训练集群开始轰鸣。
「420」也是马斯克最喜欢玩的梗,象征着自由、不受约束和反传统。
马斯克频繁把「420」用在他的产品定价,公司开会时间和星舰一发射时间上等等。
网友也在评论区打趣马斯克超绝仪式感,不到4:20不开工。
在最新采访中,马斯克透露了更多关于新建超算和xAI模型进展:
- Grok2上个月完成了训练,大约用了15K H100
- Grok2将于下个月发布,与GPT-4相当- Grok3正在新建10万块液冷H100超算上,开始训练- 预计Grok3将在12月发布,「届时将成为世界上最强大的人工智能」
10万块液冷H100,19天完成搭建
值得注意的是,这个全球最大的超算集群,大就大在拥有10万块H100,还是液冷的那种。
10万块H100是什么概念呢?
价格上来看,H100GPU作为AI的关键组件、硅谷的热门商品,据估计每块成本在3万到4万美元之间,10万块H100就是一笔40亿的大单。
而在全美TOP5的高校机器学习博士曾发帖说,实验室H100数量为0,要用GPU得靠抢。
李飞飞也在采访里表示,斯坦福的自然语言处理小组只有64块A100GPU。
而马斯克一出手就是10万块,这个数字令评论区垂涎欲滴。
算力上来看,算力大约是OpenAI用于训练GPT4的25000块A100的20倍左右。
耗电上来看,仅仅是让这个超级计算中心维持运转,所需要的电力总功率就达到70MW,相当于这是一座普通电厂的装机容量,可满足20万人的能源需求。
今年5月,马斯克就曾表示,希望在2025年秋季前建成「超算工厂」。
现在看来,为了加速超级集群的建设,他选择了购买当前一代的H100GPU,而不是等待新一代的H200或其他即将推出的基于Blackwell的B100和B200GPU。
尽管市场预期Nvidia的新Blackwell数据中心GPU将在2024年底前上市,马斯克显然没有耐心等待。
当前AI军备竞赛越发火热,唯快不破,谁能最快地推出产品就能迅速占领市场。
xAI作为一家初创公司,更是要是与其他巨头之战中先声夺人。
在之前,马斯克与甲骨文的百亿大单就谈崩了,马斯克嫌弃甲骨文速度太慢,认为对方没有以可行的速度构建计算集群。
而甲骨文则觉得xAI建超算选址承担不了电力的需求,随着百亿订单的谈判破裂, xAI和甲骨文停止了讨论扩大现有合作的可能性。
xAI只得田纳西州孟菲斯市建设自己的人工智能数据中心,与甲骨文的合作破裂意味着xAI要自己动手单干,通过10万块H100构建独立的数据中心,以摆脱甲骨文等云提供商能力的限制。
马斯克自己也表示,xAI拥有世界最强的AI训练集群,可谓遥遥领先。
世界最强Grok-3开训,年底发
在马斯克最新一则采访中,披露了建立超算的一些细节。
据大孟菲斯商会(Greater Memphis Chamber)主席Ted Townsend透露,马斯克只花了大约一周的时间就决定将xAI的新超级计算机建造在孟菲斯。
Townsend说,经过3月份的几天旋风式谈判之后,马斯克和他的团队选择了田纳西州的这座城市,因为这里有充足的电力和快速建设的能力。
并且,仅仅花费了19天超算中心就建造完成,马斯克也在推文中赞扬了团队优秀的工作。
Supermicro公司也为xAI提供了大部分硬件支持,其CEO Charles Liang也在马斯克的推文下发表了评论,赞扬了团队的执行能力。
如此之大的训练集群,目的就是为了训练Grok3。
本月初,马斯克就宣布8月底推出Grok2,在Grok-2尚未发布的情况下,马斯克也透露了Grok-3的部分细节,为最强模型Grok3造势。
马斯克在今年4月接受挪威主权基金负责人Nicolai Tangen采访时说,Grok2需要大约2万张H100来进行训练。
Grok3将于年底发布,可以预见,基于10万个GPU训练的Grok3性能方面将比Grok2更上一层楼。
如此巨大的超算中心,自然需要大量人才和技术的支持,马斯克也继续在推特上招兵买马,让数据优势、人才优势和算力优势全部扩张到极致。
参考资料:
https://x.com/elonmusk/status/1815325410667749760
https://x.com/tsarnick/status/1815493761486708993
亚马逊生成式 AI 增强语音助手:通过 Alexa LLM 改善智能家居的大脑
站长之家(ChinaZ.com)9月21日消息:亚马逊的Alexa即将迎来革命性变革,而其新面貌可能非常引人注目。在周三的秋季硬件发布活动中,该公司揭示了由其全新Alexa语言模型提供支持的全新Alexa语音助手。根据亚马逊设备与服务部门的现任高级副总裁DaveLimp所说,这个新的Alexa能够理解对话短语并做出恰当回应,更有效地解释上下文,并完成多个请求。站长网2023-09-21 09:41:540000Magnific AI正式发布升级内容 图像可放大 8 倍
图像放大应用MagnificAI近期发布了新的升级内容。这次的升级将带来一系列新功能和改进,让用户能够更加灵活地使用这一强大的工具。新版本的MagnificAI将把输出尺寸提升到10K*10K大小,这意味着用户可以直接将图像放大8倍,而不会出现失真或模糊。这一改进将为用户带来更高的图像质量和清晰度,使他们能够更好地处理大尺寸图像。站长网2024-01-09 10:10:250000Chato:基于AI技术 轻松定制个性化助理机器人
Chato是一款基于AI技术的对话机器人平台,可以帮助用户快速创建个性化、具有超强能力的助理机器人。用户只需上传学习素材或添加提示语,即可定制专属机器人,满足不同的业务需求。官网地址:https://chato.cn/?channel=qqaiyjsChato的核心功能包括:-快速创建机器人:用户只需花费20秒就可以快速创建一个机器人,无需编写代码或具备专业知识。站长网2023-07-27 11:58:110001Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
【新智元导读】GPT-4o发布不到一周,首个敢于挑战王者的新模型诞生!最近,Meta团队发布了「混合模态」Chameleon,可以在单一神经网络无缝处理文本和图像。10万亿token训练的34B参数模型性能接近GPT-4V,刷新SOTA。GPT-4o的横空出世,再次创立了一个多模态模型发展的新范式!为什么这么说?站长网2024-05-20 11:05:020000Persistent 与 Google Cloud 合作推出生成式 AI 解决方案
站长之家(ChinaZ.com)8月1日消息:Persistent宣布加强与谷歌云的合作伙伴关系,推出了一套由谷歌云驱动的生成式人工智能解决方案。这些解决方案将为客户提供帮助,让他们在AI的旅程中,从AI探索者到生成式AI颠覆者,通过理解如何成功地识别和实施这些先进技术,使其业务具备规模。站长网2023-08-01 10:43:360000