【引燃新一轮AI革命】上一轮2016年人工智能程序击败职业围棋世界冠军引发人工智能热议,人们似乎还可以作壁上观;本轮热炒的聊天机器人,则从写学术论文到医疗咨询几乎席卷各个行业,自生式智能新范式已经让人们近距离感受到人工智能带来惊喜与危机,引燃新一轮AI革命。
即便多家上市公司提示交易风险,暂无相关业务,近期A股市场还是掀起了概念股涨停旋风。资本层面已经开始关注所代表的大模型AI公司以及相关AIGC(人工智能创造内容)概念。
业内人士介绍,国内也有AI大模型公司,但从参数训练到工程调优还有差距,相比而言,在大模型的探索上,通过已经实现从可供到可用实现的跨越,预计随着未来成本下降,相关应用将会在更多行业领域紧密结合。目前搜索引擎公司已经开始竞相布局类似应用,所属的AIGC技术也将赋能内容创作等诸多领域,并且随着算力提升,高性能计算、数据中心芯片等环节将迎来发展机遇。
探索大数据模型路径
像开辟了一片新大陆,无论是编写代码、撰写文案,甚至还可以用于高度专业的辅助医学诊断,各行各业试用的热情被点燃。对于的表现,记者采访到多位业内专家表示已经相当“惊艳”。
“如果把人工智能级别与人类智能对比,划分拟人、同人以及超人水平,那么相当于同人水位,并且在很多领域的水平已经近似一般的本科生。”清华大学新闻学院元宇宙文化实验室主任沈阳向记者表示,“目前AI正在处于从弱人工智能向强人工智能过渡阶段,预计5到10年时间,将在很多领域达到硕士水平。”
从技术路径来看,的成功意味着大模型的发展成熟。
“堪称人工智能里程碑式代表,证明了以海量大数据和超大参数为基础的大模型方案在发展通用型人工智能方案上是可行的,而之前工业、学术界对这个路径一直比较质疑。”云从科技战略技术总监温浩向记者表示,“可以说是融合学术界成果和工业界经验的集大成者,实现了指令学习的效果,通过不断强化反馈,形成有逻辑性的回复,并且能够摒弃有害信息,比较高质量提炼出有用信息。”
申万宏源提供的资料显示,国内大部分视觉类AI公司此前都以小模型路线为主,大模型底层创新在美国开始。
以GPT-3为例,其调用的参数量达到了1750亿个,是传统深度学习小模型参数量的至少1万倍以上;另外,GPT-3通过海量数据预训练大模型,提炼出模型参数后再度初始化和训练,大幅降低后续对数据量的需求,减少后期成本投入,比小模型能够更广泛适应不同任务类型。另外,通过引入的Self-自注意力机制,可以让每个单元都可以捕捉到完整句义,帮助实现“对答如流”的效果。
除了提升智能性,还在信息立场安全方面下功夫。温浩指出,使用了高学历的人工智能数据标准团队,加强人工反馈学习,优化算法结构,“一般的AI团队很少会启用这么庞大的数据标注团队”。
A股概念股中,AI训练数据标准商海天瑞声涨幅居前,今年来累计涨幅已经超过2倍。公司多次发布股价异动公告,提示公司暂未与开展合作,其的产品和服务未给公司带来业务收入,该领域对数据需求的发展趋势有待观察。
资本已经开始高度关注具备大模型能力与服务场景能力结合的标的。
云岫资本方面也向记者表示,中国最成功的AI公司需要同时具备底层大模型能力和服务具体场景的应用层能力。据介绍,中国AIGC领域预计不会像美国一样出现非常清晰的基础层和应用层的解耦。相比,过去中国成功的AI公司来自绑定口袋深的垂直行业,比如安防、金融、制造业,通过一体化的AI产品和服务来提升客单价。未来中国新一代的AI公司可能也会采取此模式,AI能力的商业化会绑定在具体的场景中。
引领搜索与
创作生态变革
“在语言效果、逻辑方面等方面呈现得很优秀,但是在跨场景、专业领域的智能还比较欠缺,全面商业化还有一定距离,但至少可以在To C端开始替代Siri类应用。”温浩表示,在To B端应用上需要搭建模型,数据训练成本还是比较高的。目前已经推出了付费订阅版 Plus。
不过,在万兴科技战略发展部负责人唐芳鑫看来,已经开启向To B端商业化应用。
“版本经过了从1.0到3.5的逐步迭代,去年营销行业已经开始使用3.0版本,推出了相应SaaS产品。”唐芳鑫表示,目前已经放开了API接口(不含中国),能够许多垂直细分场景上进一步开发落地。
站在当前时点,搜索引擎市场成为商业化的首个燃爆点。
2月8日,微软宣布新的Edge浏览器和必应搜索引擎将集成 3.5升级版,可随意切换聊天模式,并且显示出回复内容引用的链接出处。据Data.ai数据分析显示,必应程序的全球下载量在一夜之间猛增10倍。另一方面,谷歌火速展示了“同款”搜索引擎Bard,却被吐槽缺乏创新。
国内互联网巨头也在火速跟进“搜索大战”,竞相推出类似应用。最新阿里巴巴已确认其产品在研发中,可能将AI大模型技术与钉钉生产力工具深度结合;百度已经表示其类应用文心一言”将于今年3月完成内测并向公众开放;腾讯混元AI大模型团队推出了万亿级别中文NLP预训练模型-NLP-1T,已落地于腾讯广告、搜索、对话等内部产品。
另外,A股上市公司,三六零在互动平台上回答投资者提问时表示,公司计划尽快推出类技术的Demo版产品。昆仑万维也表示旗下的Opera浏览器计划接入功能,并计划年内推出类似的代码,并将其开源,避免大公司的技术垄断。
在所属的AIGC(人工智能创造内容)技术范畴,还将与元宇宙等诸多技术产生交互,上市公司也已经着手布局。据了解,AIGC除了效率提升、创作供给,还可以创作内容,激活虚拟人,虚拟人和虚拟人产生连接、产生对话,构建元宇宙。
“意味着新一轮AI革命,从以前以生物识别基础上的相对简单响应、决策型人工智能,演变成自生成式人工智能,改变创作者生态,实现真正的提质增效。”唐芳鑫向记者介绍。万兴科技已经致力于用AIGC推动创作者经济向元宇宙方向迈进,公司旗下多个产品已应用虚拟人、文生图、AI智能抠像、AI智能降噪、AI音乐重组、AI换脸等功能,并逐步从泛娱乐、泛知识向泛营销领域等多场景渗透。
公开信息显示,天娱数科的元境科技虚拟数字人已接入等模型,飞利信的智能会议板块涉及技术,当虹科技也回应积极推进AI技术赋能各个行业,包括AIGC、NLP等与相关的技术和产品已逐步完善并在部分业务中落地应用。
云岫资本方面向记者介绍,公司从2022年年中开始便在积极寻找AIGC领域的优秀公司,预计AIGC应用层在游戏、社交、电商等垂直领域在未来有巨大的潜力,但短期的不确定性较大,毕竟基础层大模型还在快速迭代过程中。不过,只做应用层的公司不具备核心护城河,也很难具备确定性的先发优势。
算力底座将迎来扩容
对于未来互联网竞争格局,沈阳向记者预测,AIGC将呈现指数级增加,牵引元宇宙线性增长,而移动互联网继续内卷型增长。“今年内AI产业格局迎来巨变,业内正在紧密观察用户增长的各个节点。”据介绍,目前全球最大的应用还是,月活用户约30亿,而应用可以在2个月达到1亿用户量,增长迅猛。
另一方面,AI创业的门槛也被拔高。
“国内也有AI大模型公司,但从参数训练到工程调优还具有差距,相比而言,在大模型的探索上,已经从可供到可用实现了跨越。”沈阳表示,高端GPU供给受限,芯片算力上存在差距,国内在模型上从0到1的原创提出能力比较弱,基础有待夯实,整个开源生态和开放探索的文化还待进一步发展。相对而言,沈阳表示,看好拥有大模型能力、能够进行海量数据调试,具备软件开发经验的公司,并且投入能达到10亿级别的公司。
“如果达到万亿级别参数训练,单次投入就需要上亿元人民币投入。”沈阳说。
云岫资本方面也向记者表示,大模型训练需要极大的人才密度和极高的经济成本,因此很难成为创业公司的机会。
随着技术的突破,模型规模的不断增长,将消化更大规模的数据,也意味着更高的算力需求,对底层的高算力芯片和数据中心建设将带来机遇。据统计,从2012年到2020年,人工智能模型训练消耗的算力增长了30万倍,平均每3.4个月翻一番,超过了摩尔定律的每18个月翻番的增速。
中信建投指出,从投资维度看,超大平台型科技公司、具备图文内容生产场景、基础算力与算法公司有望持续受益,而AI产业将继续保持“芯片+算力基础设施+AI框架/算法库+应用场景”的稳定产业价值链结构。
芯流智库首席分析师杨健向记者表示,高端算力芯片上英伟达处于垄断地位,中国企业差距很大;如果未来算力扩容,数据中心以及相关GPU、CPU芯片方案商有望迎来机遇。