Page 1 of 1

它由两个共享晶体

Posted: Thu Dec 05, 2024 8:58 am
by rubinaakter
20224 年 3 月的 GTC 上,NVIDIA 展示了全新的 Blackwell 芯片架构以及基于该架构的 B200 GPU 以及结合了两种架构的 Grace Blackwell GB200 芯片。

B200 GPU 具有 2080 亿个晶体管,而之前在数据中心部署的 H100/H200 则有 80 0 亿 个晶体管 印度尼西亚电话号码列表
,每个 GPU 提供 20 petaflops 的 AI 性能(相比之下,H100 为 4 petaflops)。这样的芯片将拥有 192GB 的 HBM3e 内存,带宽高达 8TBps。


Image

与传统 GPU 不同,Blackwell B200 是一种双处理器,因为它由两个共享晶体组成,工作方式类似于单个 CUDA 处理器,并以 10TBps 连接到 NV-HBI NVIDIA 高带宽接口。 Blackwell B200采用台积电4NP工艺制造。这些晶体采用 HMB3e 堆栈,每个堆栈具有 24GB 和 1TBps 的带宽。

目前宣布的最强大的解决方案是 GB200 芯片,由两个 B200 GPU 组成。

为了连接多个节点,Nvidia推出了第五代NVLink芯片,双向带宽为1.8 TBps,由500亿个晶体管组成,采用台积电4NP技术工艺制造。

每个 Blackwell GPU 有 18 个 NVLink 链接,比 H100 多了 18 倍。由于每个链路的双向带宽为 50 GBps,即每个连接 100 GBps,因此大量 GPU 节点的功能几乎就像一个巨大的 GPU 单元一样。

此外,具有新接口的芯片构成了NVIDIA B200 NVL72服务器,这是一个成熟的18服务器机架解决方案,包含18台1U服务器,每台服务器都配备GB200芯片,每两个GPU B200配备一个Grace CPU。这意味着 GB200 NVL72 的每个计算节点都有两个 GB200 超级芯片在 IFS Direct Connect 2024 上,公司代表谈到了采用 18A 工艺以及将使用高数值孔径 EUV 技术的 14A 工艺生产 Clearwater Forest 处理器晶圆。英特尔目前的目标是在四年内推出五种工艺。微软也出席了此次活动,代表们提供了有关其基于英特尔 18A 工艺的芯片的信息。

英特尔希望在未来6年内占据全球芯片工厂的领先地位。该计划不仅指直接生产处理器,还涉及提供冷却和封装/互连解决方案。该公司现在称为英特尔代工厂,并制定了既满足内部需求又满足外部客户的战略。可持续的供应链应该为所有规划区域提供相同的服务。

英特尔还为用户提供了使用该公司技术开发自己的人工智能芯片的新机会,让其感到惊讶。

英特尔处理器 4 和 7 已经上市,版本 3 也即将量产。 18A和20A工艺将生产配备PowerVia(电力传输系统)和GAA或RibbonFET环栅技术的创新芯片。新的电源系统可实现优化布线,并对晶体管密度和性能产生积极影响。 GAA 技术也会影响晶体管密度,但影响较小。

英特尔 Clearwater Forest 的最终版本正在准备投入生产。该芯片是首款基于18A工艺的大规模解决方案。该芯片采用3D Foveros封装技术,将18A CPU与Intel 3基晶结合在一起。

Clearwater Forest处理器采用最新的工业接口UCIe,用于连接芯片。这是开发中的重要一步,因为该接口得到了 NVIDIA、AMD、三星和其他 120 多家制造商的支持,以标准化芯片之间的连接。该解决方案有助于降低成本并构建来自不同制造商的组合芯片的大型生态系统。

英特尔的 14A 工艺将是第一个采用高数值孔径 EUV 工具的解决方案。这种光刻工具将允许印刷更小的芯片和更高的性能,从而对生产产生重大影响。英特尔将是第一家使用该工具的公司,但由于成本问题,该工具一直被推迟。,每个机架包含两个 Grace CPU 和四个 B200 GPU,具有 80 petaflops FP4 AI 和 40 petaflops FP8 AI 性能。

完整的 GB200 有 36 个 Grace CPU 和 72 个 Blackwell GPU,具有 720 FP8 petaflops 和 1440 FP4 petaflops。该服务器的130TBps多节点带宽可处理多达27万亿个AI语言模型参数。