凤凰网财经讯 9月27-28日,“新空间·新动能——凤凰湾区财经论坛2023”于香港、深圳两地同步举行。本次论坛由凤凰卫视、凤凰网联合主办,围绕“新空间、新动能”主题,深入探讨“多重考验下的全球经济:复苏还是衰退”、“全球经济风险与中国应对之策”、“香港经济新动力”、“全球危机与地方政府债务”、“大湾区资本市场建设”等关键议题,为全球经济及湾区发展贡献新智慧。
在27日下午深圳会场“人工智能:四十年大变革”环节,百川智能创始人、CEO王小川发表《展望AI大模型时代》的主题演讲。
关于大模型会取代什么职业和工作?王小川首先引用了创始人山姆·阿尔特曼的观点:“人工智能将导致在电脑前进行的工作的价格下降速度远远快于现实世界中发生的工作的价格”。
王小川进一步解释道,电脑面前的工作的效率将大幅度提升,但这不是人的能力提升,而是人与机器结合带来的提升,而人在电脑面前的价值会下降。他提到,大模型已经开始取代一些平面设计等工作,“离电脑越近,有更大的被取代的可能性”。
王小川同时表示,在孩子教育方面,不要一直在电脑面前,而是更多到真实的世界中去,与人去互动,从读万卷书到行万里路,去获得更多经验,因为这是大模型目前还不能承载的事情。
以下为王小川演讲全文:
各位嘉宾大家下午好!特别感谢凤凰卫视和凤凰网的邀请,有这么一个机缘,能跟大家做一个分享。同时也感谢蔡毅教授刚才的铺垫,对前四十年的人工智能的发展做了系统性阐述。而且已经引出了我们拥抱今天大模型的时代,也提到了百川智能。我今天分享的题目是《展望AI大模型时代》,这个时代背后的一些思考和问题。
第一个问题,在今年年初时候已经争论的吵翻天了,AIGC时代是否已经到来。现在已经基本有一个统一的想法。第一一定是了不起的新的技术上的大突破,同时今年4月份的时候,微软的一个大概400页的报告也提到今天-4已经具有初级通用的人工智能,因此认为这个新的时代已经到来了。在行业当中马化腾也用到了这个话,讲到以前他认为这是一个十年不遇的机会,现在是百年不遇的新的起点。什么叫百年?几百年,那就甚至快到工业革命之前,所以今天这个时代的变迁是能够超越工业革命、电器革命、包括信息革命的总合,我个人是抱有这样一种信仰,我们已经走出了信息文明的时代,开始面向通用人工智能时代,今天,大家每天都惊呼它很了不起,但离它终极,我们这个时代所带来的AGI技术,能够最终呈现的创造力还有很大的想象和突破的空间。
第二个问题,今年年初大家多多少少听到两个行业顶尖人,对大模型有不同的理解。我从这里引申一下,大模型是什么?可能很多朋友也参与其中,已经用到了创造大模型,也有一些人还没接触到。今年两个很有意思的说法,一个是比尔盖茨讲到大模型像移动电话互联网一样,具有革命性影响,把它比作互联网是移动电话。但黄仁勋提到一个新的观点时刻。我们可以看到很大区别,比尔盖茨讲的是基础设施这种建设,把它当成互联网,而在黄仁勋讲的是,讲的是什么意思呢?我理解的时候,翻了一下他们详细的更多阐述,比尔盖茨说法来讲,机器今天变成一个可以读、可以写、可以理解语言的机器人,读Read、写White、理解,所以它其实从能力层面来剖析大模型。而黄仁勋,英伟达的创始人讲到它是和人类的关系,大模型带来一种人机交互,人和整个科技交互新的范式,使得我们接触这样的信息变得足够简单,而大模型时代,我们用语言能够开始和机器打交道,并且机器背后带有我们思考的能力。
所以这个图我想能够更简化一下,我们今天做大模型能够对比新时代,两个典型,同时扮演两个角色,我们在新时代时候看到两个重要的技术发明,叫底层系统芯片,从CPU到GPU,今天所有的电器设备里面,都装有芯片,能驱动这样一个信息文明的发展。而上者的初期,其实第一个大的突破,是搜索引擎,今天是每个人都在用的这样一个软件。到后来推荐引擎,等等有新的发明,他初期搜索时代,我们叫人人都接触信息,更加平等化,都变得更可达,这是之前的新时代结构。我们现在打个比方过来,现在大模型同时存在两个事情,底层模型叫语言模型,称为Large Model,又称 Model,这个Model可以类比成有芯片,有闭源的,有开源的,有几十亿参数,上百亿参数,上千亿参数。在这样一种体系里面,更多像芯片一样,有大的、小的通用的垂直的这是很相似的一个结构。同时依托大模型,这个破天荒的,首先发了一个产品,叫,它是直接能给消费者去使用的人机交互界面,像搜索一样。
今天我们提到大模型,大家可以想芯片,提到,大家想到搜索,这是我们认为既是底层生产力,又是同时上层人机交互的一个界面。还有大家问的一个问题,相对深奥一点,是我特别愿意跟大家分享的。为什么AGI的起点是语言模型?我们在上个时代的时候,大家用图像很多,人脸识别图做得很多,这个时代图片也有很多发展,大家最关心的是在语言。所以这块我想引用维特根斯坦的一句话,叫语言的边界就是视觉的边际,不管是马克思也好,图灵测试也好,其实都对语言情有独钟,语言的对话表示是否是一个智能。甚至用马克思一句话,会使用语言是人和动物的一个根本区别。我们知道一个猫狗图象识别能力很强,甚至能够自动驾驶,不像今天开个车还开不动,但是如果一个猫狗能够说话一定会吓死你的,当它有了语言以后,就带来了对这个世界认知的一种范式变化,不只找后面一种含义。
如果我们再假想一个在原始部落,这部落如果只懂800个单词,一定文明挺落后的。我们每对世界多一份认知,多一份词汇的构造,甚至多一份表达我们对语言的理解,语言代表认知,因此我们有提到,语言是知识、思考、沟通和文化的载体。当今天机器掌握语言之后,就同时掌握了思考、沟通、知识和文化,这是特别大的一种突破,语言和原来的图像语音来讲,它带有一个人类传承文明的最重要的认知和理解。
下面再讲,我们在科学发展AI For Sense里面,有哪些已经突破,有哪些技术还没突破到的。打比方讲,我们今天把语言变成了数学模型,掌握了语言,现在通过大模型本身,是把数T的优质语料,把它压缩成小模型,能够在中间掌握语言,语法词汇的规则,是用一个模型掌握语言。在几百年前的进展,实际上是用数学模型表达了这个物理世界,像牛顿做的工作,是把物理变成数学,这是康德讲的,像牛顿三大定律、万有引力公式等等。我们看到纷繁复杂的世界变化,星球是怎么运动的,苹果怎么落地的,最后变成数学公式,能把一个表象变成一个数学模型,这是人类认识世界的一个重大突破。因此,我把今天语言能够做大模型,类比在牛顿当年开创了,把物理变成数学这么重大的一个变化,那它这就做到头了吗?其实也没有,我们对生命怎么变成数学模型现在还没有做到。刚才蔡毅教授提到,在2021年的开源发布,代表从基因到蛋白质这这三段结构,这么一段东西变成了数学模型,但是这还远远不能理解生命。因为我们知道,人其实不只一个基因,人有两万三千个基因,它们之间只是构成我们DNA的5%,下面这个生命还有巨复杂的底层逻辑,是没弄明白的。从基因到蛋白,拼成人体的组织,成为一个功能的时候,也很复杂,因此今天即便我们弄明白物理的数学模型,弄明白语言所带来的数学模型,我们理解这个世界还是有蛮远的距离。
第四个问题,AGI的世界会变得怎样。这是很多人在问的问题,跟我们什么样关系,我后面有两张特别简单来讲,行业和我个人的思考。在行业中已经有一定有共识,有两个词,一个是生产力提升。大家都会看,每一次技术革命都是生产力的一次爆发。这次和以前相对区别而言,会诞生一个新的物种,我们称为智能助理,从的源头开始,它形成一个和人能够沟通、有常识,能开始帮你解决问题的一种机器,甚至它自己还会调用工具。一个会语言,会调用工具的,它已经不是简单的自己是个工具了,其实类似于我们叫智能体,在向外发展的时候,它是类人的一种方式,以后会有你的私人老师、私人医生,私人伴侣都可能。因此在助理这方面,会像人一样会诞生。
还有在ToB行业生产领域,开始叫做你的数字员工。跟老板讲,提供大模型能干吗,很多人不太理解,提到可以做数字员工,它对降本增效,对创造力就更多的理解。再预测一下,在未来除了这两个领域之外,既然大模型不只是能够像人一样跟你对话。更多它是对世界有认知之后,能够创造开始有新的虚拟世界,我们借用游戏里面有一个词,叫开放世界,有点类似原来元宇宙一样的,通过今天的大模型开始能够创造一个他所定义的接近现实规则,又能在虚幻空间存在的一种新的虚拟世界,在娱乐、游戏里面会有很大的意义。
第五个问题,会取代什么样的职业和工作?这是很多朋友问到我的一个重要的问题,尤其是今年年初大家很恐慌。回答这个问题,我可以延用山姆·阿尔特曼讲的一句话,他是的创始人,他讲了,意思是人工智能将导致人在电脑面前的工作的价格下降的速度,远快于现实中发生工作的价格。什么意思呢?电脑面前的这种工作效率会成百倍提升,但不是人本身提升的,而是人和机器结合会提升很多。倒过来,人在电脑面前的价值相对会下降。我们今天看到,大模型做的很多工作,取代了很多,像平面设计,做一些简单的美术工作,写诗、画画、写作,都是电脑面前的工作被它升级甚至取代了。这里会跟大家提到一个比较有信心的想法,就是离电脑越近,你工作如果天天在电脑面前,就有更大被取代的可能性。也有朋友提到,那小朋友怎么教育,我同样提到,不要天天泡在电脑面前,更多到真实世界当中去,跟他的小朋友去互动,从读万卷书走向行万里路,去获得更多的经验,这是今天大模型所不能承载的一个事情。
后面还有更多的思考和实践,是我们行业在推动的。今年在6月份百川发布了第一款模型,6月15日之后,我去了一趟美国,走访了大模型所有主流公司,从到微软、谷歌等等,非常大的感叹。我去之前理念上我们是比他们慢半步的,我们要抓我们的落地,从走访了十多个公司,30多个人之后,我提了一个新的理念,叫在理想上慢一步,在落地上快三步,确实我们知道这个公司代表了一种不惜成本的耕耘计划,在构建一个更加超前的AGI模型。在今天中国现在而言,我觉得我们需要有一种不同的竞争策略,今天我们在芯片有受到限制,我们投入的资金也不能像这么大,它在美国融了100万美金,往下继续在中东融1000亿美金,因此我们在追赶的同时要认清现实,我跟他们同事在聊的时候,他们说他们正在尝试设计把1000万个GPU连在一起做一台超级的面向AGI的计算机。怎么叫1000万颗呢?英伟达一年生产GPU是一百万颗,它要设计1000万颗的集群。在国内从百川能够拿到1万颗GPU就已经是很了不起的事情,因此我们和他们的距离可以看到是非常大的。幸运的地方是我们并没有掉队,年初大家很恐慌,美国的技术已经发展到无穷远了,我们根本不知道怎么做。现在想在国内大家至少做到3.5水平的AGI的初步能力,在今年年底大概是能到来的,包括百川好几个公司能够做到。到它4.0往下到5.0的东西,我们可能有巨大的距离。所以我们相对他们而言,确实在登月上我们是落后了,但是我们至少没有被完全甩开,更多把精力我们除了追赶以外,需要在落地要更快,在技术层面能够把搜索增强,强化学习,垂域这方面,包括把应用做好,而不是一味恐慌或者惊叹怎么追赶美国,我们有机会在应用上是能跑在他们前面去的。
最后一点时间,简单介绍一下百川的工作,我们在4月10日成立了公司,在二季度,当时百川预计三季度发布500亿参数的模型,需要自己训练和提升,在四季度发布千亿模型,在明年一季度发布超级应用,现在看来我们进展很顺利,甚至有很多附加的答卷也提供过来了。我们在二季度最后一个月发布了开源70亿参数的模型,这个模型之后七月份发布130亿参数模型,在哈根菲斯上得到了很大的下载量,总下载量超过500万次。这是给开源世界做出一定的贡献,在美国闭源是,同时在开源上是 Llama得到美国生态环境的改变。我们闭源开源都做,优先先把开源发出来,能对中国的生态里面做出自己的贡献,也赢得了很好的企业反馈。同时我们在上个月做了-2新的升级版,从之前下载做的很快,到现在我们在整个开源水平已经达到世界先进水平,这不是我们自己评的,而是国际上权威的评测指标,相对Llama而言,我们整个做的是更好的,这是一个特别骄傲的事情。原先Llama在做的时候,它的整个机制上讲,还是一种开源的数据,而百川用了大量人工清洗的宝贵的闭源数据,能够对开源系统做出它的贡献。
在前几天我们在25号升级了全面新的引擎,可以给大家使用,同时发布端,从做模型,同时启动了商业化的进程。在这里简单介绍到这里,我们希望百川能够帮助大家轻松的获得普惠信息和专业服务,在AGI时代里面,为中国的AGI发展做出自己的贡献,谢谢!