
AI大模型发展迅速,国内大厂纷纷入局。百度于2023年发布新一代知识增强大语言模型文心一言,关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。阿里2023年4月推出通义千问大模型,10月发布通义千问2.0。
华为于2021年4月发布华为云盘古大模型,目前已迭代至盘古3.0,包含五大基础模型:NLP大模型、CV大模型、多模态大模型、预测大模型、科学计算大模型,运用于商务、金融、预报等多个场景。腾讯于2023年9月发布其自研通用大模型混元大模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。科大讯飞于2023年5月发布星火认知大模型,目前已迭代至V3.5。最新的模型文本生成、语言理解等七大能力全面升级,其中数学、中文超过GPT-4 Turbo,代码达到96%水平,多模态达到91%水平。商汤科技于2023年3月发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破。
算力规模持续增长,智能算力增长迅速。经中国信息通信研究院测算,2022年我国计算设备算力总规模达到302EFlops,全球占比约为33%,连续两年增速超过50%,高于全球增速。基础算力稳定增长,基础算力规模为120EFlops,增速为26%,在我国算力占比为40%,其中2022年通用服务器出货量达到384.6万台,同比增长3%,六年累计出货量达到2091万台。此外,我国智能算力增长迅速,2022年智能算力规模达到178.5EFlops,增速为72%,在我国算力占比达59%,成为算力快速增长的驱动力。