
但是与此同时,我们也看到随着2023年8月华为Mate60系列的正式发售,华为芯片的生产问题获得了突破。2023年10月,科大讯飞表示昇腾910B能力已经基本做到可对标英伟达A100。此外,华为拥有了对标CUDA的CANN、AI计算框架昇思、盘古大模型,形成了较英伟达更完整的产业布局。
2024年以来,英伟达在加快芯片发布频率的同时,也采取了一系列的反制措施,对竞争对手的发展进行阻碍,包括(1)2024年3月,英伟达在CUDA 11.6的用户许可中明确表示,禁止其他硬件平台上通过翻译层运行CUDA;(2)2024年5月,据路透社报道,英伟达大幅削减供应中国市场的H20人工智能芯片价格。
英伟达的缺位,给以华为为代表的国产AI芯片厂商提供了难得的发展机遇,让国内市场成为了国产芯片发展的小气候。根据英伟达的数据,中国大陆地区的收入约占比在20%以上,有足够的市场体量培养出与英伟达相抗衡的芯片企业。随着互联网厂商开始积极试用和采购国产芯片,国产生态环境有望逐步建立,最终帮助国产芯片和下游厂商突破CUDA的封锁。
2024年6月25日,OpenAI突然宣布停止向中国提供API服务。而在此前,OpenAI虽然没有对中国用户开放API服务,但是国内用户往往选择代理之类的方式绕过区域限制。但是随着中国用户开始收到OpenAI的邮件通知,这意味着OpenAI将采取更加严格的检测来限定国内客户的调用。
OpenAI的这一举动将利好于国内大模型厂商。6月25日,阿里云百炼宣布将为OpenAIAPI用户提供替代方案,并为中国开发者提供220万免费tokens和专属迁移服务。
从模型价格来看,国产厂商价格优势明显。通义千问GPT4级主力模型Qwen-plus在阿里云百炼上的调用价格为0.004元/千tokens,仅为GPT-4的50分之一。其他国产厂商也都