PyTorch 2.4 现已支持 Intel Data Center GPU Max Series,这标志着在英特尔硬件上处理 AI 工作负载的效率得到显著提升。更新后的 PyTorch 在保持编程体验一致性的同时,进一步扩展了对流媒体设备的支持。
一致的编程体验,扩展功能支持
- 即时模式与图模式:无论是即时模式还是图模式,PyTorch 2.4 均能完全运行 Dynamo Hugging Face 的性能基准测试,为开发者提供了灵活的选择。
性能优化,支持多种数据类型
- 图形和操作符优化:通过 oneAPI 深度神经网络库 (oneDNN) 与 oneAPI 数学核心库 (oneMKL),对性能至关重要的图形和操作符进行了优化。
- 图模式:在图模式 (
torch.compile
) 中,英特尔显卡后端被激活,集成 Triton 并实施了特定优化。 - 数据类型支持:PyTorch 2.4 支持 FP32、BF16、FP16 以及自动混合精度 (Automatic Mixed Precision, AMP) 等多种数据类型。
面向未来的性能分析与改进
- PyTorch 2.5 的新特性:正在开发中的 PyTorch 2.5 将包括基于 Kineto 和 oneMKL 的全新 PyTorch 分析器,进一步提升英特尔显卡 的性能分析能力。
- 设备名称变更:用户可以轻松地从 CUDA 切换到 英特尔显卡,仅需将设备名称从 'cuda' 改为 'xpu'。
- 未来改进:PyTorch 2.5 将增加更多 Aten 操作符,全面支持 Dynamo Torchbench 和 TIMM,并在 torch.profile 中加入对 英特尔显卡的支持。
随着 PyTorch 2.4 的发布,我们期待它为 AI 开发者带来更多便利,同时为即将到来的 PyTorch 2.5 充满期待。
0条评论