英伟达寄出AI界最强芯片,老黄还拿出机器人大模型

| 分类: AI情报 | 热度: 10 ℃

近日,有人质疑人工智能只是瞬息万变的潮流产物,犹如过往3D电视或元宇宙般短暂流行。然而,人工智能实非转瞬即逝的热点,它正深度重塑科技行业的格局,并逐步开启对全球各领域的革新之路。在这个浪潮的最前端,英伟达以其卓越的技术创新能力引领风潮。

英伟达寄出AI界最强芯片,老黄还拿出机器人大模型

在今晚的GTC大会中,英伟达CEO黄仁勋身着招牌皮夹克,揭晓了一系列重大创新成果,其中最为瞩目的莫过于Blackwell GPU架构的发布及搭载该架构的自研系统的推出。首图展示的是基于Blackwell架构的B200 Tensor GPU,而“GB200”则代表搭载Blackwell超级芯片的核心系统。

英伟达寄出AI界最强芯片,老黄还拿出机器人大模型

【黑科技揭秘】

英伟达Blackwell GPU架构采用了一种创新设计,GB200集成两个相互连接并协同工作的Blackwell GPU,同时还与一个强大的72核心“Grace” CPU紧密结合。每个Blackwell GPU均配备先进的HBM3e内存,容量高达192 GB,而Grace CPU则支持最高480GB的LPDDR5X内存。整个系统通过第五代NVLink技术实现高效互联,后续我们将进一步详述这一关键技术。

英伟达寄出AI界最强芯片,老黄还拿出机器人大模型

【Blackwell核心技术】

面对台积电光刻机掩模尺寸的挑战,英伟达采取了一种新型接口策略,将两个芯片通过专有的“NV-HBI”高带宽接口无缝对接,从而构建出全功能的Blackwell GPU。据英伟达透露,两者间的连接速度高达10 TB/秒,实现了无损的完整性能输出。

英伟达宣称Blackwell在AI训练和推理方面取得了显著飞跃,训练效率较Hopper架构提升四倍,推理速度更是前代产品的三十倍,同时在能效方面提高了惊人的2500%,换算下来即提升了25倍效能。值得注意的是,尽管功耗也随之增长,每个Blackwell芯片最高可达1,200瓦,但这源于其在未缩小芯片尺寸的情况下大幅增加了晶体管数量,且基于英伟达定制的TSMC“4NP”工艺打造。

英伟达寄出AI界最强芯片,老黄还拿出机器人大模型

【六大技术创新】

Blackwell被英伟达誉为“新一代AI超级芯片”,这背后依赖于六项突破性技术的支撑,包括前所未有的晶体管数量、第二代变压器引擎、第五代NVLink高速互连技术、全新升级的可靠性、可用性和可维护性(RAS)引擎、强化的“机密计算”特性(含TEE-I/O能力)以及专设的高性能解压缩引擎,可实现每秒800 GB的数据解压速率。

英伟达寄出AI界最强芯片,老黄还拿出机器人大模型 英伟达寄出AI界最强芯片,老黄还拿出机器人大模型 英伟达寄出AI界最强芯片,老黄还拿出机器人大模型

【性能与连接的革新】

尽管目前英伟达尚未公布诸如CUDA核心数、内存接口规格等传统GPU参数,但重点在于Blackwell在AI性能方面的巨大进步,尤其是深度改良的张量核心与“第二代变压器引擎”。新的引擎支持FP4数据类型,理论上可在优化的AI模型上实现相比8位精度量化模型高达两倍的吞吐量。

英伟达寄出AI界最强芯片,老黄还拿出机器人大模型

针对现代AI模型日益增长的通信需求,Blackwell通过引入NVLink 5和新的800 Gb/s网络硬件解决瓶颈问题。NVLink 5的性能相较上一代翻倍,且Blackwell的连接密度也增至Hopper架构的两倍,共同带来1.8 TB/秒的总带宽,或单向900 GB/秒的传输速率,使得最多72个GPU能够形成一个统一的NVLink域,作为单一大规模并行计算资源。

英伟达展示了极具震撼力的GB200 NVL72系统,这是一个19英寸机架,表现为单个GPU形态,内部由36个Grace CPU和72个Blackwell GPU构建,搭配总计13.8 TB的HBM3e内存和高达1.44 EFLOPs的峰值AI推理性能。如今,exascale级别的计算能力已不再局限于全球屈指可数的超算中心,而是可以通过一台紧凑的机架服务器轻松实现。

此外,Blackwell还着重考虑了液冷系统的应用,此举大大降低了运营成本,提高了数据中心的空间利用率。GB200超级芯片计算托盘和NVLink Switch托盘均采用1U的设计,体现了极致的空间优化理念。

对于寻求多样化部署方案的客户,英伟达也将提供基于x86架构的HGX服务器,例如HGX B100系统,其兼容性出色,能够容纳优化过的Blackwell GPU。对于那些追求极限性能的大企业或政府机构,则可通过预配置的DGX SuperPOD GB200获得数百颗Blackwell GPU组成的超级集群。

【GTC大会不止Blackwell】

除Blackwell外,英伟达在大会上还公布了诸多其他创新成果。其中,cuLitho技术与TSMC和Synopsys合作,为半导体制造布局环节带来了40倍的生产效率提升。此外,公司还推出了支持800 Gbps速率的新一代网络硬件,包括BlueField-3 SuperNIC和Spectrum-X800以太网卡,以及ConnectX-8 SuperNIC和Quantum-X800 Infiniband适配器,后者拥有14.4 TFLOPS的网络内计算能力,令人瞩目。

英伟达寄出AI界最强芯片,老黄还拿出机器人大模型

至于Omniverse平台,英伟达持续探索“数字孪生”技术的应用潜力,比如用于规划下一代无线通信的NVIDIA 6G研究云,以及分辨率高达2公里、助力气象机构精准预测天气的地球气候数字孪生模型。

不仅如此,英伟达还宣布将在Omniverse网络模拟器中支持苹果Vision Pro头显,利用增强现实技术与数字孪生进行互动,有望开辟全新的应用场景。

最后,面向汽车和机器人行业,英伟达展示了其Jetson Thor应用处理器的强大实力。通过这款处理器,公司开发了名为GR00T的多模态基础AI模型,应用于“具身AI”领域,即控制实体机器人而非纯软件环境。GR00T能够理解和响应自然语言,通过模仿人类行为进行学习,进而实现在现实世界的自主导航与互动,尽管现阶段的演示略显稚嫩,但无疑展现了颇具前景的发展方向。

结语:

随着英伟达Blackwell GPU架构的横空出世,人工智能革命再次进入了崭新的阶段。这场技术盛宴不仅深刻改变了科技产业的发展轨迹,也为全球各行各业开启了无限可能的未来之门。敬请关注英伟达在GTC大会上的更多创新成果,它们将持续推动AI技术向着更高层次演进。

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论