每经记者 李沛沛 姚亚楠 每经编辑 彭水萍
2023年开年,迅速火遍全球,短短两个月时间月活突破一亿,成为被载入史册的应用之一。
的大火引发了全球科技巨头的一场“军备竞赛”,国内的“中国版”争夺战也是一触即发。
在国内众多大厂中,百度是最早做出明确表态的公司之一,2月初就正式宣布将在3月上线百度版“文心一言”,打响第一枪。
接下来,华为、腾讯、阿里、京东云也都公布了自身在相关领域的布局情况,还有消息传出称字节跳动的人工智能实验室(AI Lab)有开展类似和AIGC的相关研发。
图片来源:视觉中国-
作为长期关注AI赛道、走在第一线的VC/PE,对于AI大模型和“中国版”也保持着高度关注。我国什么时候才能拥有自己的“超级大脑”AI大模型?需要在哪些方面实现突破?目前面临的挑战又有哪些?
针对这些行业高度关注的热门话题,《每日经济新闻》记者采访了多位一级市场知名投资人。
VC/PE看好“中国版”:一定会有自己的AI大模型
“未来国内一定会有自己的AI大模型,并且也一定会诞生自己的。”在谈到打造AI大模型和“中国版”是否现实时,多位投资人都对《每日经济新闻》记者做出了这样的判断。
创世伙伴资本合伙人聂冬辰进一步解释称,中国拥有庞大的数据,较强的模型开发和算法优化能力,大量优秀的AI工程师,具备打造中国版的条件,“当然,这是一件长期的事,涉及数据的收集清洗、算法的设计优化等多个环节,我们看到已经有几家公司在努力去做,但目前都处于比较早期的阶段。”
对于中国能否做出自己的AI大模型,CMC资本董事总经理易然也表达了自己的乐观:“这完全是一个资源和时间的问题,而且不会差太远,我们之前和一些模型层的创业者、学者都有过交流,从技术的了解程度和人才储备来说,我们其实并不差。此外,现在关于模型构建方面的学术交流也很开放和活跃,我们可以做一些参考。”
而在线性资本投资总监白则人看来,大模型这块已经不是什么秘密,因为虽然的代码没有开源,但是整个的构建思路已经通过论文的形式发出来了,大方向上已经明确,只是在模型构建和效果优化方面的探索需要花费大量时间,有大量工程化问题要解决,并且训练成本也非常高。
“我觉得市场还需要多一些耐心。至少在AI大模型这一块,做出来这个事大概率是没有问题的,我们判断达到类似的效果差不多需要2~3年左右的时间”,白则人表示。
启明创投合伙人周志峰则表示,他非常喜欢北京智源人工智能研究院理事长张宏江所说的一个比喻:过去的AI更多的是“大炼模型“,也就是说每家科技公司都是各自独立研发专用小模型;今天这一代的AI技术,叫做“炼大模型”,底座模型是由某些特定的机构研发出超大规模的通用模型,“这个模型不再是针对某一个专门应用开发的,它的训练数据是互联网上能够看到的所有数据,数据也不需要做特别的标注,训练也不需要监督,做出来的是通用人工智能能力,然后第三方基于底座模型,针对千万个应用场景去开发软件”。
他指出,从“大炼模型”到“炼大模型”的范式转变,对AI未来十年、二十年的发展有重大意义。
挑战:需要足够的算力、模型工程化的人才和完整生态
国内巨头已经纷纷入局,那么要做出这样的现象级产品,目前还有哪些现实的挑战摆在眼前呢?
易然坦言,国内的公司此前在这个领域已经有一些探索了,如果要达到类似的效果,还需要更多资源和时间的投入。“当然像芯片等方面可能会面临一些阻碍,但是应该也会有一些其他的解决方法。”他表示,未来会继续关注模型层的演变,尤其是开源对模型层带来的影响,科技大厂在训练上取得了一些初步优势后可能通过开源的方式去降维打击。创业公司如何更好地利用开源的模型,能否构建出属于自己垂直领域、更精细化的小模型也值得期待。
在白则人看来,要做出国内自己的AI大模型,最关键的要素是要有足够的算力和模型工程化的人才。
“算力这块可能会面临卡脖子的问题,而且除了硬件方面,可能还有一些比如说计算框架层面这些软件层面的问题需要去解决。当然我们也看到,中国的GPU近年来也在快速发展中,所以我觉得国内的企业还是有实力可以去做的。”
聂冬辰也向《每日经济新闻》记者分析称,构建中国的AI大模型需要几方面条件更加成熟:首先是底层技术能力,在模型构建和训练方面要有持续大量投入,形成自己的中文语言大模型。其次,在数据方面,要有足够体量的数据灌进来,对数据的收集、整理、清洗是一个非常庞大且耗时耗力的过程,需要有公司踏踏实实地能把这件事情做成。此外,整个市场,无论是科技大厂、创业公司还是投资人,都需要有足够的耐心,不投机、不跟风。“如果我们真的能沉下心来,十年如一日地朝着自己的AI大模型方向去训练演进,肯定能做出来”。
而在谈到关于中国在生成式AI和底座大模型的挑战时,周志峰指出,首先要面临的就是算力问题。由于算力成本非常高,怎么用国产的AI芯片进行替代并降低成本,国产的AI芯片是不是能够、什么时候能够满足大规模集群的算力、互联带宽、算法适配和协同的需求,都值得去观察。
其次,过去一周很多人说国内的科技大厂和创业公司推出的大模型与是有代际差别的,我们落后了至少一代。在看Open AI的发展时会发现,也好、GPT-3也好,是需要很长时间研发积累的。
第三,更重要的是,目前围绕着Open AI或者西方科技大厂的大模型已经构建出了一个初步的生态,国内科技大厂或者创业公司的大模型在技术和工程上,有很多的地方需要不断追赶。“如果只是训练出大模型,没有人去用,缺少完整生态,也是没有任何意义的。”
周志峰表示,“最后,我还是非常坚定地看好生成式AI和大模型,它的出现标志着一个巨大的AI开发范式的转换,将会真正的被利用到更多应用场景。”
每日经济新闻