
(1)基础层主要涉及“硬件基础设施”和“数据资源、算力基础、生产工具(算法模型)”这三大核心要素。通用大模型规模扩大往往需要高性能的硬件设备、海量的学习数据、强大的算力基础以及不断优化的算法模型,其中不断优化的算法模型是AI学习能力提升的关键。
(2)技术层主要涉及模型的构建。目前,Transformer架构在AI大模型领域占据主导地位。AI大模型包括NLP大模型、CV大模型、多模态大模型等。这些模型采用预训练和微调的策略,先在大量无标注数据上学习基本的语言或图像,然后针对特定任务进行微调。
(3)应用层主要涉及到AI技术与其他行业或产品的融合。AI大模型拥有多模态生成能力能够向外赋能,包括通过开放API的形式,降低AI应用开发门槛,提高落地部署效率和精度等,进而降低AI规模化部署的成本,可以广泛的与电商、医疗、家居、物流、教育、金融以及传媒行业进行融合,或者嵌入智能机器人、智能终端、智能汽车等产品,进一步推动人工智能进入工业化发展阶段。