前言:文章内容来源于2023年02月20日,鲍捷博士在 INfoQ【极客圆桌派:狂飙的】的访谈。访谈内容分为上、下两个部分发布,本文为下篇。已发布的上篇:
| Agree To .不求共识,尊重不同视角。
主持人:
我们今天可以讨论一下中国人工智能领域的发展。您认为中国的 的有效性如何?或者抛开 ,看中国的大型模型是否具有相应的技术实力,有可能在国内出现 的应用?
鲍捷:在回答这个问题之前,我想先谈一下国内人工智能落地的问题。中美两国在人工智能落地的方式是不同的。在美国,更多还是大型互联网公司,来做一些增量产品,比如说谷歌、 。但在中国,自 2013 年以来,人工智能的落地基本是围绕社会治理展开的。
如果 真的能够成功,那么它代表的并不只是 本身,而是代表着自然语言处理技术的突破,这项技术走通了。未来的十年中,在中国可能的商业化落地路线还是围绕着社会治理,即 展开的。我们需要思考的是,围绕 需要建立一种什么样的技术架构。
主持人:是不是视觉的那一波要换种方式重新来一次?
鲍捷:是有可能的,这可能会带来一个全新的更大的市场,但是未来会很难。
主持人:但它会产生另外一种结果是吧?
鲍捷:结果肯定是一种能提升各领域 (治理)能力的应用。像是我们从事金融领域,本身在金融领域中能力较强,在 (监控合规)已有极大的投资。并且在 2022 年之前绝大部分的增长都是来自于这种需求。未来这种需求只会增加而不会减少,这也将会成为行业主要的增长点。
除此之外,企业内部的治理需求也会逐渐增加。这些数字化转型带来的变化将会带来更多新的应用和解决方案。
这也是为什么 MLOps 是数字化转型中一个热门话题的原因。随着语言处理能力的提升,一方面,机器学习将不仅局限于传统的结构化数据,而是会在更广泛的数据范围内应用,如在数据湖,湖仓一体化的基础上实现实时的知识生成和构造。这种知识的管理将从 MLOps 进步到 KBOps。
另一方面,还将带来全新的办公工具。未来的十年中,我们今天所熟知的办公三件套可能全面升级,进行小机器人化,会有大量的机器人在整个工作流程的每一个环节上提升工作效率。
围绕着这种数字化转型的大前提,商业化也变得清晰明了。帮助人们理解文档、实现商业智能和数据分析,以及自动化生成各种报告、公告和文件等内容,都将成为未来的趋势。这一领域有可能成为未来十年新增市场达到1万亿规模的领域,属于在 (社会治理)和 (企业治理) 机制领域中带来的全新、更大的市场。
主持人:是由技术人员去开发 (领域),还是由领域专家使用技术?还是两者都需要?
鲍捷:应该将两者结合起来。本质上,这是领域的问题,而不是技术问题。
我还有另外一个观点,就是这个世界上压根就不应该有太多人工智能公司,就好像世界上绝大多数公司都不是操作系统公司,也都不是所谓的浏览器公司,更多的是扎根场景服务的公司。
主持人:您认为这会影响公司的发展路线吗?从某种程度上讲,需要招募哪些人?需要放弃哪些业务?需要关注哪些业务?
鲍捷:一些我们原本认为需要三到五年才会发生的事情,已经出现了,所以我调整了优先级。比如,AIGC 一直是我们长期战略的一部分,我们之前认为未来的竞争对手是微软,准确来说是 。
主持人:为什么竞争对手会是微软?
鲍捷:本质上说,我们在做三件事:帮人抄作业,帮人查作业,帮人写作业。其中,抄作业是 Word,查作业是 Excel,写作业是 。
过去这 6 年向金融机构提供的所有服务、开发的支持金融机构各项业务的各种机器人都是这三者,如写报告的核心是 Word ,风控的核心是 Excel,私募投资的最终调研报告是 。
我们最初花费大量精力在开发人工智能 Word 上,最近两年已经着手开发人工智能 Excel,而原计划要3到5年才能实现的写作业部分,现在就要开始了。
主持人:对于文因互联而言,您觉得它是一个专业领域的三件套,还是通用领域的三件套?
鲍捷:目前还无法断言,但我非常确信,在中国的金融领域中,我们是最好的,而这种能力正在扩展到其他领域。比如,最近开始涉足医疗领域,帮助医生撰写文献,还有航空领域进行文档撰写。当然,这只是初步尝试。
我相信,当我们成为一个相对成熟的公司时,这种通用能力本身是有可能被孵化出来的,但由于创业者的困境,肯定不是以“文因互联”为主体。
主持人:前段时间也有人说现在是“网景时刻”,如果我们从创投角度上面来看现在遇到的事情,您认为“网景时刻”到了吗?
鲍捷:不是网景时刻,是谷歌时刻。
1998年,谷歌成立之前,有很多搜索引擎公司,现在大家基本不记得它们的名字。
而在这些公司中,谷歌做对了一件事情,就是将人类反馈加入搜索算法中。这与以往所有搜索引擎公司基于更传统的信息检索方法不同。以往的方法基本上都是围绕如何让数据发现更好的 ,如基于 TF-IDF 或 BM25 等算法。但是谷歌的做法是使用 算法,将人类的 注入,直接对齐人类思维,导致三年后所有竞争对手都倒闭了。
我认为现在所有这一批做认知智能的公司,如果三年内不能够跟进转变,基本上也会倒闭。当然,这一点现在的人们比当初看得更清楚了。我们回到1998年,像 Lycos 和 这些搜索引擎公司,它们的老板或技术人员就不知道这些吗?当然不是。
实际上, 算法的等价算法就是 IBM 的工程师所创造的。因此,在那个时刻,并不是只有一个人掌握了这些技术,今天也是一样的,聪明的人都看到了,没有人不知道。
主持人:但是谷歌时刻听上去不是一个对创业者友好的时刻,因为它会形成一个巨无霸,而如果我们说是网景时刻,会有很多建各种网站的可能性,这些寓意不同可能会有不同结果。
鲍捷:使用“谷歌时刻”并不意味着我们的目标是创建像谷歌一样的应用。实际上,从盈利的角度来看,人工智能的应用无论是在中国还是在美国,ToC 可能只占20%,而 ToB 则占80%,也就是说,ToB 仍然是主流,而不是 ToC。在 ToB 领域中,很难出现像谷歌这样的巨头,因为这些技术都是基于相同的底层技术和模型构建的。而且,在 ToB 应用实现过程中,技术占比很低,其他因素更加重要,所以很难有一家公司能够吃遍整个市场。
ToB 公司的商业组成,由许多组件拼凑而成,每个几十亿或者上百亿的组件都需要经过一番拼搏才能成功,这种商业格局与 ToC完全不同。因此,不可能出现一个巨头企业吞噬整个市场的情况。相反地,会有许多公司在不同的领域里崛起,这也是 ToB 的落地模式。
主持人:鲍老师,您会投资怎样的公司?
鲍捷:我可能会在中国或美国寻找不同的投资机会。在中国,我可能会投资一种 as a (咨询作为一种服务)类型的公司。经过多年艰辛的创业过程,我们终于明白了一个事实:中国的 ToB 服务的 SaaS 中,第一个“S”和第二个“S”和美国是倒过来的。在美国,是 as a (软件即服务),而在中国是 as a (服务即软件) 。
因此,从某种程度上说,在中国的 ToB 领域中,美国的 SaaS 服务可预见将来是不可行的。这是因为两个社会或两种经济形态的底层运行规律是不同的。
因为所谓的软件本质上只是治理的 IT 化。如果治理本身就不一样,软件怎么可能是一样的呢?所以,在那种环境下成长起来的 SaaS 在中国并不适用。在中国,要想落地并被客户认可的关键因素一定是服务,而不是软件。
主持人:但这个点是一个市场因素,就不是一个 的因素。
鲍捷:我所说的不是政府() ,而是治理()。这包括了企业之间的商业交易方式以及资源整合方式,也决定了商业模式的形态。
在中国,要想扩大 ToB 业务,只有一个途径,那就是必须具备非常强的交付和服务能力。在其中,人工智能的作用是什么呢?以前人们总认为人工智能公司颠覆的是软件公司,其实这是错误的。人工智能颠覆的不是软件公司,而是服务型公司。或者我们不必使用“颠覆”这个概念,因为它并不好。我们能否提高传统服务型公司的效率,使其更好地服务,支持这个行业能够创造真正的正面社会价值,从而使业务增长。如果我要进行投资,那么应该像文因互联一样的提供数字化转型能力的底层公司。
本质上,我们生产各种各样服务不同场景的机器人。现在在金融领域中有许多细分场景,比如银行场景、券商场景、财富管理场景等。但是我们无法全部自己去做。因此,最终我们必须形成一种提供每个领域内进行知识建模和知识落地,就像银行合规就是一个典型的场景。
可能有一小团队,由10人、20人、30人等组成,使用比较传统的方式来工作,效率较低。但是他们的优点是在这个行业工作了10年、20年、30年,非常了解这个行业,但是他们的执行方式传统而痛苦。我的目标是加速这个过程,将效率提高10倍,我愿意投资这样的公司。
主持人:我最后问几个比较定性的问题,像现在微软 Word 现在已经开始嵌入 ,您认不认同这种生成的内容直接拿来用?
鲍捷:在 ToB 领域里是不行。
主持人:您觉得对于本身做工具再增加 AIGC 能力的公司和一个 AIGC 的公司做工具,哪一种赢面更大?
鲍捷:自身有业务模式,再增强该方面能力的公司更容易。
主持人:如果我们没能够有效地建立起来大模型,长远会造成怎样的影响?
鲍捷:关于这个问题,我想讲一个故事。1860年,英法联军攻入圆明园,搜刮了大量财物,其中包括一批马戛尔尼仪器,这批仪器是70年前乾隆皇帝所接受的礼物。然而,英法联军发现这批科学仪器从未被打开过。
如果这些仪器当时被打开,结果会是怎样的呢?这是个开放性的问题。
主持人:对你而言, AGI 是不是必须要先有智能,然后才是 AGI ?
鲍捷:每当人工智能进入寒冬期之前,总会有一些人谈论 AGI,所以当有人谈起 AGI 时,我都会感到不安。因为 AGI,就像问意识何时在生物体中开始一样,这个问题我认为是无法回答的,也可能是不必要回答的。
就像真正的爱情是什么一样,无法被定义,也无法被划分。如果你说它是一只鸭子,那么它就是一只鸭子。目前,我并不关心这个问题的答案,对于可预见的未来,它没有太大意义,这只是一个定义问题,任何人都可以去解答。
主持人:最后,请鲍老师评价一下今天的交流内容,作为此次访谈的收场。
鲍捷: 今天的交流,很多都非常的认同,在去年的时候已经感觉到人工智能的秋天已经来了。我们之前统计过,人工智能的冬天一共持续了17年,每一次的高潮平均只有9年,从2012年算起,现在时间已经到了。
从1998年开始做人工智能,我经历过一次冬天,我的整个研究生和博士后阶段都是在冬天度过的。那时候的人工智能非常困难,我们毕业后必须转行。如果你坚持做人工智能,可能找不到工作,这与今天完全不同。
在这种情况下,我们必须非常谨慎。但冬天也带来了一些优势,我们发现太阳底下无新事。让你感到美妙的东西其实并不是新的,只是在某个时刻,以你意想不到的方式重新组合在一起,突然变得很美。
大家总是觉得瓦特发明蒸汽机是发明了独特的技术,但瓦特没有发明,他所有使用的技术以前都有,只是发明十几种更好地使这些机器传动的方式而已,如曲轴和更好的密封方法。而就是这份突破,就把蒸汽机的效率提高了10倍,也同理。
不是全新的东西,它里面所有的元素都源于之前的积累。比如我们 98 年刚刚开始学研究生课程时,就已经学过强化学习等,基于受控自然语言的输入交互当时也存在,它虽然跟现在不一样,不过也只是将成分组合在一起。
目前我还没有看到 的核心代码,但我坚信如果有机会去学习,其中一定不是纯粹的语言模型,会有非常多的工程,就像现代版本的曲轴2。这种计算机体系架构和大规模数据的操作能力,才是真正的奥秘。它不会出现在任何一篇论文中,即使我们想要拥有,也无法抄袭,一方面我们抄袭不到,另一方面抄袭一个产品是缺乏灵魂的。
我的信念一直是,要自己演化一个产品,但演化出的产品,是以更简单的方式在早期使用 MVP 不断迭代和循环产生出来。
这类大规模语言模型的重要性和操作系统、浏览器内核相当,所需要的技术复杂性也相当。一旦它成熟,至少需要 1000 个人长期维护,因此最终可能只有每个国家只有一家公司拥有这样的模型。
然而,这种操作系统会衍生出一个庞大的生态系统,甚至可能引发软件领域的全新革命。我们在本科时学过一句话:“程序等于算法加数据结构。” 但在未来,这是否会被改写?数据将变成什么?
数据将不再仅仅是传统意义上的数据,而是更丰富的结构化数据,就像大型语言模型本身就是一种数据一样。但到那时,我们不能再把它仅仅称为数据,应该称它为知识,因为其中包含了丰富的结构和信息。此外,算法也将不再只是以前编写底层代码的方式,而是由大量机器生成的源代码或模块。
我们需要更多的人来引导和提示,因此未来从事”提示学习( )”的工程师将比软件工程师更多。因此,未来的程序将由知识加提示组成,这可能是一种全新的范式。
在未来,像是今天所有人都必须要用 Word、Excel、 一样,我们每一个人都在每天的日常工作中做提示学习。
注:1.此为鲍捷先生2月20日讲座内容,微软举办生成式人工智能发布会时间为3月16日
2.3月15日,发布GPT4,其论文附录揭示了工程结构复杂性