
AMD加强GPU软件生态建设。AMD Advancing AI大会还发布了AMD ROCm 7.0软件平台,进一步缩小了与CUDA的生态差距。
ROCm是一套面向高性能计算与人工智能应用的软件平台,包含HIP框架等多项开发工具与底层编程接口。其设计理念与Nvidia的CUDA类似,但专为AMDGPU打造。自2023年推出其旗舰AI GPU加速器MI300X以来,AMD持续扩展ROCm对新型数据类型的支持、提升框架兼容性,并引入针对硬件的深度优化。
ROCm 7是AMD迄今最大的更新,不仅让最新芯片受益,同时也兼容较早发布的MI300系列加速器。与ROCm 6相比,MI300X的推理性能提升约3.5倍,模型训练中的有效浮点性能提升3倍。新版本还引入了AI张量引擎AITER,支持OCP微缩放数据类型,并改善了与主流框架的兼容性。
AMD在服务器CPU领域迅速崛起。PassMark数据显示,2025年AMD在服务器CPU市场的市占率首次达到50%,历史上首次超越英特尔。而在2017年时,AMD市场份额仅为2%。
谷歌、Meta、亚马逊、微软等正通过自研芯片推进算力自主化,旨在降低外部依赖、优化成本结构,推动产业向专用化、定制化发展
谷歌云(Google Cloud)的第一代TPU (v1)于2015年推出,最新已迭代至第7代。2025年Google TPU的全年出货量预计为250万片,其中,v5系列预计出货190万片,v6系列预计出货60万片。预计到2026年,总体TPU销量将超过300万片。在TPU设计上,谷歌主导整体架构与功能定义,博通参与了部分芯片的中后端设计工作。
在2025年谷歌云大会上,谷歌发布了第七代TPU,代号“Ironwood”。Ironwood是谷歌迄今为止性能最强、能效最高且最节能的TPU芯片,其峰值算力达到4614TFLOPs,内存容量为192GB,带宽高达7.2Tbps,每瓦峰值算力为29.3TFLOPs,首次支持FP8计算