
种类 定制化程度 可编辑性 算力 价格 优点 缺点 应用场景
通用型较强、适合大规模并行运算;设计和制 并行运算能力在推理段无 高级复杂算法和通用性人
GPU 通用型 不可编辑 中 高 造工艺成熟。 法完全发挥。 工智能平台。
FPGA 半定制化 容易编辑 高 中 可通过编程灵活配置芯片架构适应算法迭代,平均性能较高;功耗较低;开发时间较短。 量产单价高;峰值计算能力较低;硬件编程困难。 适用于各种具体的行业。
通过算法固化实现极致的性能和能效、平均性 前期投入成本高;研发时 当客户处在某个特殊场景,可以为其独立设计一
ASIC 全定制化 难以编辑 高 低 很强;功耗很低;体积小;量产后成本最低。 间长;技术风险大。 套专业智能算法软件。
资料来源:亿欧智库,国信证券经济研究所整理
GPU在训练负载中具有绝对优势,未来AI芯片将更加细分和多元。据IDC数据,1H21中国AI芯片市场份额中,GPU占比高达91.9%,依然是实现数据中心加速的首选;NPU、ASIC、FPGA占比分别为6.3%、1.5%、0.3%。随着非GPU芯片在各个行业和领域中被越来越多采用,高算力、低能耗且适应各类复杂环境的芯片将更受关注,IDC预计到2025年其他非GPU芯片整体市场份额占比将超过20%。
图93:1H21中国AI芯片市场份额(按加速卡类型)
资料来源:IDC,国信证券经济研究所整理
GPU能够并行计算的性能优势满足深度学习需求,目前主要由英伟达在全球GPU市场处于领先地位,而国产GPU厂商如燧原科技等已推出相关产品不断追赶。GPU
(图形处理器)最初承担图像计算任务,目标是提升计算机对图形、图像、视频等数据的处理性能,解决CPU在图形图像领域处理效率低的问题。由于GPU能够进行并行计算,其架构本身较为适合深度学习算法。因此,通过对GPU的优化,能够进一步满足深度学习大量计算的需求。目前国内GPU典型公司包括燧原科技,其产品包括云燧i20、云燧T20、云燧T21等。
公司名称 产品型号 发布时间 制程双精度浮点运算单精度浮点运算半精度浮点运算整型定点运算性能显存显存带宽最大功耗 性能(TFLOPS)性能(TFLOPS)性能(TFLOPS)(TOPS)
H100SXM 2022 4nm26511979(Tensor3958(Tensor80GB3.35TB/s700W Core)Core)
Nvidia A10080GBSXM 2020 7nm9.719.5624(Tensor1248(Tensor80GB2039GB/s400W Core) Core)
V100SPCle 2019 12nm 8.2 16.4 - - 32GB 1134GB/s 250W
云燧i20 2021 12nm - 32 128 256 16GB 819GB/s 150W
燧原科技 云燧T20 2021 12nm - 32 128 256 32GB 1.6TB/s 300W
云燧T21 2021 12nm - 32 128 256 32GB 1.6TB/s 300W
资料来源:英伟达、燧原科技官网,国信证券经济研究所整理
FPGA是一种硬件可重构的集成电路芯片,通过编程定义单元配置和链接架构进行计算,国产FPGA方面已有安路科技、紫光同创等公司布局。FPGA(现场可编程门阵列)具有较强的计算能力、较低的试错成本、足够的灵活性以及可编程能力,在5G通信、人工智能等具有较频繁的迭代升级周期、较大的技术不确定性的领域,是较为理想的解决方案。目前国内FPGA典型公司包括安路科技、紫光同创等,其产品包括PH1A系列、Logos-2系列等。