xAI的Colossus超级计算机集群使用了10万块英伟达Hopper GPU

英伟达揭示了xAI的“巨像”超级计算机集群是如何处理10万个Hopper gpu的——这一切都取决于该芯片制造商的Spectrum-X以太网网络平台。

该公司透露,Spectrum-X旨在通过其远程目录内存访问(RDMA)网络为多租户、超大规模的人工智能工厂提供大规模性能。

xAI的Colossus超级计算机集群使用了10万块英伟达Hopper GPU

该平台从一开始就部署在世界上最大的人工智能超级计算机“巨像”上。这家由埃隆·马斯克(Elon musk)所有的公司一直在使用该集群来训练其Grok系列大型语言模型(llm),这些模型为提供给X用户的聊天机器人提供动力。

该工厂与英伟达(Nvidia)合作仅用了122天就建成了,目前xAI正在对其进行扩建,计划部署总计20万颗英伟达Hopper gpu。

训练Grok需要强大的火力

Grok的人工智能模型非常大,Grok-1可以测量3140亿个参数,Grok-2在8月份推出时的表现超过了Claude 3.5 Sonnet和GPT-4 Turbo。

当然,训练这些模型需要显著的网络性能。使用Nvidia的Spectrum-X平台,xAI记录了零由于“流碰撞”或AI网络路径瓶颈而导致的应用程序遗留退化或数据包丢失。

xAI透露,Spectrum-X的拥塞控制功能使其能够保持95%的数据吞吐量。该公司补充说,这种级别的性能无法通过标准以太网在这种规模下提供。

TechRadar的头像TechRadar认证作者

相关推荐

  • 微软可能会为Windows 11电脑提供Copilot键的新选项——但还不用太激动

    微软可能很快会为那些键盘上有Copilot键的用户提供重新定义该键的功能,使按下该键时能够打开一个上下文菜单。 这是根据Windows相关传闻和事件的知名来源PhantomOfEarth在X(前Twitter)上的消息。 请记住,这只是一个关于微软可能在未来的Windows 11测试版本中进行此操作的猜测——很可能是基于泄露者在当前预览版本中发现的线索——并…

    2025年2月11日
    95
  • 在购买iPhone 16e之前——这是苹果去掉的功能

    iPhone 16e:苹果为其智能手机系列带来了一个新成员,而且它是最新系列中最便宜的型号。但为了达到更低的价格,苹果不得不做出一些妥协。虽然你依然能享受到像Face ID这样的实用功能,但有些其他选项就被舍弃了。因此,如果你正在考虑升级,不妨问问自己:哪些功能对你来说真正在乎?iPhone 16e或许能满足你所有的需求——但也有可能它缺少了一些你无法忍受的…

    2025年2月20日
    106
  • 这款奢华无线耳机将管式放大器高保真音响系统直接放在你的头上,并提供非常强大的高解析音频支持

    我们曾见过一些耳机放大器中使用小型真空管,承诺带来更温暖、更沉浸的音频体验,但新的Écoute真空管耳机决定跳过中间环节,将整个高保真系统直接放在你的头上。这款耳机在耳罩中内置了一颗Korg Nutube P61,带来正宗的管式音效和A/B类放大。 我们第一次在Kickstarter上看到了这款耳机,项目远超其融资目标。现在它们可以通过常规渠道购买,尽管价格…

    2025年1月30日
    77
  • Apple 确认 iPhone 14 Plus 相机问题,推出维修计划可免费更换零件

    对于发现在设计或生产上有缺陷的旧产品,Apple 会推出「维修计划」,就算是保养期已过都可以获得免费维修服务。最近 iPhone 14 Plus 的相机就确定了存在问题,可获免费维修。 据 Apple 表示,「极少数」的 iPhone 14 Plus 在使用后置相机拍摄时无法显示预览图像。受影响的手机製造日期在 2023 年 4 月 10 日至 2024 年…

    2024年11月3日
    146
  • 新的更便宜的蓝色OLED材料突破可能对OLED电视——以及所有其他设备——都是好消息

    对于那些渴望购买更便宜OLED电视的人来说,最新的科学突破可能为更便宜、更高效的OLED显示屏铺平道路,这将影响我们的智能电视、手机、平板电脑,几乎是所有地方——尽管这一影响可能对电视影响最大。 据报道,剑桥大学和曼彻斯特大学的研究人员发现了一种新的“噁二嗪”(oxadiazine)宿主材料,用于制造高效、低成本的蓝色OLED像素(通过OLED-info)。…

    2025年2月11日
    84

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注