Agent及AI Coding带动需求端的结构性跃升,供需缺口推动算力租赁及云服务价格上修。随着Agent及AI Coding需求爆发,需求端出现结构性跃升,据OpenRouter,周度累计Token消耗量较一年前提升约7至8倍;据IDC预测,到2030年全球活跃AI智能体将达22.16亿,年度Token消耗将从2025年的0.0005 Peta Tokens飙升至15.2万Peta Tokens,增长超3亿倍。智能体时代的Token需求已经远远超出传统Chatbot或固定订阅模式的承载能力,需求快速增长,供给端瓶颈仍在,内存等零部件涨价增加采购成本,或使部分部署计划有所放缓,算力供需缺口期仍在延长,带动算力租赁及云服务价格上修。
供需两旺的背景之下,全球GPU云服务仍在加速扩容。据Verified Market Reports数据预测,2024年GPU云服务市场收入为67.8亿美元,预计到2033年将达到212.2亿美元,2026年至2033年的复合年增长率为13.8%。在2026年至2033年的预测期内,北美预计将在GPU云服务市场保持最大的市场份额,亚太地区将成为增长最快的地区。
2026年以来GPU租赁价格上修40%+,高性能算力卡供给偏紧。据纽约数据提供商Ornn,近几个月来英伟达全系列GPU在云端数据中心的现货租赁价格均大幅上涨,Blackwell系列芯片单小时租金已达4.08美元,较两个月前的2.75美元上涨48%。据SemiAnalysis,H100 GPU一年期租约合同价格已从2025年10月的低点每小时每GPU1.70美元急升至2026年3月的2.35美元,涨幅接近40%;Blackwell新集群的部署交期目前已延伸至2026年6-7月。