文|Alter
走红的速度,显然超过了许多人的预期。
即使是在中文互联网上,和有关的报道、讨论,早已超过了其他科技概念,甚至萌生出了”概念股”的说法,不少与AI、大模型、NLP相关的中概股,短期内的涨幅”意外”达到了50%以上。
每一次有”科技大事件”上演时,都有人蠢蠢欲动,有人借势起风,掀起的浪潮似乎也是如此。
可当我们在讨论的时候,到底在讨论什么?颠覆式创新的技术洗礼,抑或是对人工智能前景的乐观,还是在潜移默化中被有心人带了风向。厘清这些问题的答案,远比讨论本身更有价值。
01 一场自上而下的”出圈”
和2016年的一样,的”火”也呈现出了自上而下的轨迹。
答案就隐藏在一篇篇10W+的爆款文章中。和相关的文章可谓盈千累万,除了大批科技和财经类自媒体的分析与报道,就连旅游博主们都开始以为主题,而且内容特别贴地气:
大多是博主与的对话截图,其中问题本身就相当有话题性,截取的问答同样吸引眼球,再稍微关联下AI取代人的宏大话题,以及可能存在的应用场景,短时间即可炮制出一篇大众喜闻乐见的文章。
追热点向来是自媒体们的”天职”,以爆红的为题也无可厚非,问题恰恰出现在信息的不对称上。
从2022年11月底上线运营,到2023年1月末的上亿月活,用两个月的时间就刷新了用户增长的历史记录。只是在注册体验尝鲜过程中,对中文互联网的用户相当不友好。
想要打开的网址,前提是有”科学上网”的工具,而且并未对中国开放注册,必须要用海外的手机用来接收验证码……可以说人为增加了重重壁垒。在这样的注册机制下,和”畅聊”的国内网民注定是”少数派”,大多数网民对的理解,是从别人口中”听”来的。
正是在这样的语境下,的”神奇能力”被不断放大。个中原因离不开人们对对话式机器人的特殊情愫。
无论是诞生于2014年的微软小冰,以”智能助手”自居的Siri,还是主打语音交互的智能音箱,都曾吸引无数人的好奇心,在特定时间内引发了现象级的讨论。毕竟早在上个世纪初,图灵就提出”对话”是测试机器是否有人类智慧的有效场景。
沿循类似的逻辑,的”出圈”是注定的结果。背靠千亿级大模型GPT-3,的自然语言理解能力远超早期的微软小冰和Siri,和用户对话时不会根据一两个关键词机械地输出结果,而是理解用户的”语义”,输出的准确性和关联性不可同日而语,并在很大程度上刷新了人们的认知。
然而目前的还是大规模离线语料进行训练的版本:无法将即时信息纳入自己的回答中;经常给出一些看似合理但不正确的答案;对话中涵盖的因果关系,仍缺乏很好的理解能力;缺少人类举一反三的能力……并不能像朋友一样自由对话。
阴谋论一些的话,在走红的这些日子里,并不缺少一些”炒作”的痕迹。比如让人摸不着头脑的”概念股”,至今还没看到哪家中概股与开展合作,所谓的概念股,多半是在蹭文本生成、信息抽取、知识抽取、机器问答等技术的热度,属于典型的”借事说事”。
而就当前的态势来看,的热度还将持续一段时间,但被刻意营造的期待值,就像是鼓吹起来的气泡,再美丽也有被刺破的一天。与其去讨论的短期效应,不如将视角放在对行业的长期影响上。
02 的偶然与必然
或许的”蹿红”有些偶然因素,可类似产品的出现却是必然的结果。
可以佐证的是,在热度空前的局面下,竞品们正在加速追赶:谷歌CEO 桑达尔·皮查伊在2月7日凌晨宣布将推出一款名为 Bard 的实验性对话 AI 服务,并将在几周内向部分开发者开放。
几乎和谷歌同一时间,百度官宣将推出类似的人工智能聊天机器人,项目名字被命名为”文心一言”,英文名”ERNIE Bot”,预计在3月份完成公测,或将直接接入百度搜索向公众开放。
人工智能初创公司元语智能连忙推出了功能型对话产品 ;阿里达摩院牵头的类对话机器人被曝正处于内测阶段;昆仑万维宣布将与奇点智源合作年内发布中国版类 代码开源……还有更多产品在官宣的路上,不排除会出现画虎不成反类犬的尴尬场面。
一种流行的解释是:将取代搜索引擎。其中被引用最多的Gmail创建者之一Paul 的观点:”像这种AI聊天机器人将摧毁谷歌,就像当年搜索引擎彻底干掉黄页电话簿一样,时间上就是这一两年。”内在的商业逻辑在于,一旦搜索引擎确定的信息检索方式被颠覆,整个互联网商业都将重新洗牌,没有哪家互联网巨头想要错过在新格局中占有一席之地的可能。
或许还有另外一种解释,即的诞生是一种方向性的探索。率先验证了对话AI的可行性,然后谷歌、百度等快速跟进。之所以能够在短时间内推出类似的产品,原因还要从大模型说起。
时间拨回到2017年,当时还在谷歌任职的 等人提出了架构,让深度学习的参数达到了上亿的规模;2018年谷歌推出了基于的双向深层预训练模型Bert,参数首次超过了3亿规模;同年提出了生成式预训练模型GPT,进一步推动了大模型的发展。
但直到2020年,大模型才真正进入到大众视野,诱因正是著名的GPT-3,拥有1750亿个参数量,是传统深度学习小模型的一万倍以上,同时让外界看到了”大力出奇迹”的一幕:常见小模型需要对不同的任务使用不同模型分别训练解决,而GPT-3先使用海量数据预训练大模型,然后将模型参数初始化后再进行训练,实现了作诗、聊天、答题、翻译、写代码等一系列能力。
一场千亿级大模型的军备竞赛由此拉开帷幕。
仅在2021年,国内的华为、智源、浪潮、阿里云、百度等企业先后发布了自家的大模型产品,而后不断从NLP延伸出了双语、CV、跨模态等大模型。据开源社区的统计,目前全球超千亿参数的大模型中,中国贡献了1/3,美国贡献了1/2,世界其他国家或组织贡献了剩下的1/6。和历史上的许多次”军备竞赛”一样,耗费了大量真金白银的大模型,最终也需要找到一个商业化出口。
有趣的地方在于,不管是GPT-3,还是,两次站在了新旧交替的临界点上,第一次掀起了大模型热,让全球科技大厂们冒险一试,这一次能为大模型的商业化带来生机吗?
03 大模型商业化的”火炬”
大模型的性能表现不可谓不性感,代价则是训练大模型非常烧钱。
根据公开数据显示,GPT-3训练的硬件和电力成本高达1200万美元;谷歌在训练包含5400 亿参数的 PaLM 时用了6144块TPU……坊间由此出现了对盲目”炼大模型”的质疑,资本市场因为大模型的应用问题迟迟不肯下注,”多才多艺,身兼多职”的大模型们距离”生存危机”越来越近。
并非是大模型缺少商业化故事。按照大规模预训练的思路,大模型+细分场景微调在某种程度上给出了人工智能在长尾场景落地的最优解,而且在小样本训练的情况下,大模型也有着比较好的提升。
大模型也不缺少落地的场景。AIGC在2022年就已经走红,投资机构红杉在2022年发布的一篇分析文章中特意提到,生成式AI有潜力产生数万亿美元的经济价值,进一步增强了相关创业者的信心。
可在2023年以前,很少看到资本市场对大模型的关注,仅有智谱AI等为数不多的企业拿到了融资,与之形成鲜明对比的是,AIGC赛道里初创企业早已是资本宠儿。资本宁愿在应用层的AIGC赛道试错,也不愿烧钱给大模型。
诚如熊彼特在《经济发展理论》中的观点:资本是创新的杠杆。倘若只是企业和研究院在花大价钱”炼”大模型,缺少资本产生的杠杆作用,大模型的价值和应用场景恐怕很难脱离”学术”二字。
的出圈就像是一把火炬,不但彻底吸引了外界的注意力,也可能为大模型的商业化照亮方向。
直接的例子就是微软”反常行为”。先是100亿美元投资,而后宣布将融入旗下全线产品,比尔・盖茨和纳德拉频频为站台,再到版的必应和Edge浏览器,甚至裁撤工业元宇宙部门为让路,俨然摆出了一副All in AI的新姿态。微软的真实动机还不得而知,映射到外界眼中的却是:微软正在开启AI的商用之战,大模型迎来了商业化元年。
也在不断释放好消息:2月1日宣布推出付费订阅版 Plus,每个月向用户收取20美元的费用;同时预计2023年的收入将达到2亿美元,2024年收入有望超过10亿美元。
其实早在2020年的时候,就已经开始为商业化谋局,GPT-3不再完全开源代码,但提供了商用API,允许开发者调用大模型的部分能力,并逐步为Dall·E2、等大模型开放了API接口。客户调用的API,以获取图像、语言、代码生成等能力,进而赶上AIGC的顺风车,从中收取接口费,初步形成了模型研发、应用开发到消费的完整产业链。
故事讲到这里,似乎让人看到了大模型的可观前景:当国内大大小小的互联网企业争相推出各种版本的时,势必会将注意力盯向提供底层能力的大模型,为国内的大模型市场注入一股活水。
再乐观一些的话,即便的潮水会褪去,只要在不断地试错中摸索出大模型的商业化路径,资本的注意力终将会聚集到底层技术上,并将注意力转变为源源不断的投资,赋予大模型可持续的驱动力量。
04 写在最后
现实的残酷在于,新物种崛起的时候,会习惯性吹起一层层泡沫,特别是在过去几年中,泡沫被戳破的时间周期越来越短。
2021年初爆火的,故事在一个多季度后就宣告”破产”;2022年初的元宇宙,下半年就被AIGC抢去了风头;引起的新风口,会是一个例外吗?就情感上而言,我们希望带来的是一场熊熊烈火,引燃人工智能的产业革命。
可惜当前的所有设想,都还建立在理想的假设上,现实中仍存在太多的不确定性,还需要跨越一座又一座山丘。