
资料来源:易百教程IT技术网站,东方财富证券研究所
2.2.三要素:数据、算法、算力
数据:数据特征高维、多模态趋势明显。移动互联网带来数据的大爆发,但垂直行业数据可能是宝藏数据。据InternationalDataCorporation(下简称IDC)统计和预测,2021-2026年,中国数据规模将从18.51ZB增长至56.16ZB,年均复合增长率达到24.9%,增速全球第一。
18.5
22.7
28.4
35.6
44.5
56.2
图表17:中国互联网数据规模(ZB) 250 200 150 100 50 0 202120222023202420252026
中国北美其他
资料来源:《2022中国大模型发展白皮书》,IDC国际数据公司,东方财富证券研究所
算法:chatGPT并非技术上有革命性突破,更多的是训练方法上的创新。大的框架几乎是一致的,差别在于细节。最终反映的是人才的竞争。根据智库MacroPolo的数据,虽然中国总体培养了大约30%的顶尖AI研究人员,但大多数流失到了美国。
GPT-3:拥有1750亿参数,无监督的预训练模型,有96层TransformerEncoder,而Bert-Large只有24层。具备生成难辨真假的新闻文章的能力。