2023年7月7日,被外界猜测、讨论、期待了很久的华为盘古大模型3.0终于揭开了它神秘的面纱。华为常务董事、华为云CEO张平安公开明确了华为在大模型领域的定位,不做“”类产品。他表示,盘古大模型3.0是一个完全面向行业提供服务,以行业需求为基础设计的大模型体系,并强调称“华为做AI的方向始终是AI for (工业人工智能)”。
其实,早在今年5月,华为盘古大模型就因提前五天预报出台风”玛娃”的路径而受到中央气象台的肯定。7月6日,国际顶级学术期刊《自然》()杂志正刊上发表了华为云盘古大模型研发团队研究成果 《三维神经网络用于精准中期全球天气预报》。
据说华为云盘古气象大模型让气象预报提速10000倍以上,几秒内就能预警气候的位置、湿度、风度、温度等。欧洲中期预报中心也指出,华为云盘古气象大模型在精度上有不可否认的能力,纯数据驱动的AI天气预报模型,展现出了可与数值模式媲美的预报实力。
华为云盘古气象大模型的这一能力,恰恰印证了华为盘古大模型3.0正在为大模型的落地应用勾勒出一幅全新的版图——不聊天不作诗不作画,拒绝做中国版。
没有诗和远方,只面向行业
“没有诗和远方,只面向行业”,是华为给盘古大模型的定位。正如张平安在发布会上就说,“由于行业数据获取难,技术与行业结合难,大模型在行业的落地进展较慢。”而盘古则巧妙地运用“5+N+X”三层架构,将这个行业大难题拆分成了 3 个小问题来解决。
其中,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。
L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。
L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
将一个人的学习生涯来打比方,简单来说,L0层主要让大模型建立起基本的认知,这就像我们大学前的素质教育阶段;L1层则需要让L0中的某一个基础大模型学习 N 个相关行业的数据,这就像大学的本科阶段,需要我们去选择不同的专业去深入学习;而 L2层会在具体行业的基础上再细化到某个场景。比如在政务行业,公共管理、社会保障等细分领域都可能用不一样的部署模型,这就类似研究生阶段,在新闻学专业里再细分新闻学、传播学、媒介管理学等去研究。
盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。张平安表示:“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。”
百“模”大战升级
业内预期,盘古3.0强势登场将进一步搅动大模型市场。
当前,除了华为的盘古大模型已在金融、制造、医药研发、煤矿、铁路等诸多行业发挥价值外,今年,阿里云相继发布了AI大模型通义千问、面向AI音视频赛道的“通义听悟”,AI绘画创作大模型“通义万相”也已开启定向邀测。此外,阿里云正与大批头部企业联合打造专属大模型。百度也先后发布了知识增强文心系列模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域。
此外,各大科技巨头也在积极推进各自的大模型生态建设。腾讯总裁刘炽平在财报电话会上说,腾讯正在加速推进大模型“混元”。阿里也在积极向大模型创业公司提供全方位的服务,包括智能算力和开发工具,并在资金和商业化探索方面提供充分支持。
作为人工智能的重要方向,大模型风起云涌,为人工智能的发展按下“快进键”。IDC预测,2026年中国人工智能软件及应用市场规模将达到211亿美元,人工智能将进入大规模落地应用关键期。