
◼全球数据总量和算力规模高速增长。据IDC数据显示,2022年全球数据圈数据量规模达到103.66ZB,中国数据量规模将从2022的23.88ZB增长至2027年的76.6ZB,CAGR达到26.3%,增速有望位列全球第一。•大模型技术取得的突破离不开高质量数据的发展。数据已成为未来人工智能竞争的关键要素,人工智能正在从“以模型为中心”加速向“以数据为中心”转变。•人工智能发展驱动数据要素市场需求爆发。伴随着大模型时代的到来,大模型训练使用的数据集规模持续增长,更加需要大规模、高质量、多样化的数据集提升模型效果和泛化能力。如2018年GPT-1数据集约4.6GB,2020年GPT-3数据集达到了753GB,而2021年Gopher数据集已达10550GB,2023年GPT-4的数据量更是GPT-3的数十倍以上。