智东西4月25日报道,今日,华为云推出盘古系列超大规模预训练模型,包括全球最大视觉(CV)预训练模型和全球最大中文语言(NLP)预训练模型。
全球最大视觉(CV)预训练模型包含30亿参数,首次兼顾了图像判别与生成能力,既能提升测试精度,又能平均节约90%以上研发成本。
全球最大中文语言(NLP)预训练模型由循环智能、鹏城实验室联合开发,包含千亿参数、40TB训练数据,刷新了CLUE三项榜单世界纪录。
后续,华为云还将陆续发布多模态、科学计算等超大预训练模型。
预训练大模型是解决AI应用开发定制化和碎片化的重要方法。华为云人工智能领域首席科学家、IEEE Fellow田奇称,华为云盘古大模型可以实现一个AI大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,并使用ModelArts平台,让AI开发由作坊式转变为工业化开发的新模式。
一、 最大中文语言预训练模型: 千亿参数、40TB训练数据
盘古NLP大模型是全球最大的千亿参数中文语言预训练模型,涉及千亿参数、40TB中文文本训练数据,对算法、算力、海量数据处理、并行优化都提出了很大挑战。
在算法方面,华为云的算法团队与循环智能(Recurrent AI)的NLP团队经过数月联合攻关,突破了大模型微调的难题。
在算力方面,鹏城实验室的国内最大规模AI训练集群鹏城云脑II,为盘古NLP大模型训练提供了强大的AI算力基础。
该模型通过在预训练阶段引入基于Prompt的任务等多项创新方案,经由行业数据的样本调优,提升模型在场景中的应用性能。