AI界迎来“疯狂星期四”。
3月16日下午两点,百度正式召开新闻发布会,宣布基于百度新一代大语言模型的生成式AI产品文心一言正式发布。
于百度而言,这是一场至关重要的战役,决定了公司是否能在当下最热的赛道上分得一杯羹。AI赛道的重要性,从发布会的规格可以看出。百度创始人、董事长兼首席执行官李彦宏亲自站台,为品牌曝光带来流量保证。
会上,李彦宏主动将话题引导至上。发布会刚刚开场,就应景地笑着说:“大家的期望值,是我们对标,对标GPT-4,这个门槛有点高。”
就在前一日凌晨,赶在文心一言正式发布之前,就推出的新版本——GPT-4多模态预训练大模型,惊艳众人。
相比之下,后来者文心一言的初舞台表现常规。发布会举行期间,百度股价应声下跌,最大跌幅近10%。截至3月16日收盘,百度股价为125.100港元/股,较前一日下跌6.36%。
图源:图虫创意
“中国版”正式登场
蓄势一个多月,文心一言终于解开神秘面纱,“中国版”正式登场。
2月7日下午,在刚刚面世并迅速爆火之时,百度在其微信公众号宣布,将推出大模型新项目文心一言。据当时媒体报道,文心一言与类似,计划3月份完成内测向公众开放。
跟随李彦宏的讲解,文心一言从不同角度展示了它的身手。据李彦宏介绍,文心一言有着文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
“《三体》的作者是哪里人?”、“《三体》如何从哲学角度续写?”在文学创作场景中,文心一言根据对话问题回答了《三体》的作者信息、总结了作品核心内容并给出建议续写角度。此外,文心一言还按照指令快速写了一篇公司成立的新闻稿,创作藏头诗,演算“鸡兔同笼”。
百度首席技术官王海峰指出,文心一言的研发基于百度的ERNIE及PLATO系列模型进行。训练技术,还包括监督精调、人类反馈的强化学习、提示技术。
李彦宏在演示中提到,目前,文心一言的中文语言能力优于任何其他大型聊天机器人。可以处理英文,但对英文的理解能力还没有中文那么好,部分原因是训练数据样本还不够大。
文心一言成色几何?
恰恰就在发布会前一日,再次刷屏。在3月15日凌晨突然发布GPT-4语言模型,引发全网关注讨论。
2月初(以下称“GPT-3.5”)的横空出世掀起的风浪还历历在目。区别于以往传统的检索模式,GPT-3.5能够分析用户的文本意义,以对话的形式快速回应用户需求,聊天、写诗、回邮件、写代码都不在话下。2月7日到8日两天,GPT-3.5甚至因为访问量激增而出现宕机的情况。
相比于GPT-3.5,GPT-4则表现出了更加出色的综合能力。在30多项美国常见理论考试中,GPT-4几乎通过了所有考试,并且几乎都是满分通过。
除文本以外,GPT-4还新增了令人惊艳的读图技能。它支持图像识别输入,以文本形式输出。在发布会上,GPT-4识别了工作人员的手绘网页草图,在短短10秒内根据草图写出了相应的网站代码。
在GPT-4已经练就“看图说话”的本领时,文心一言还停留在图片和视频的生成层面。在发布会上,文心一言根据要求以“2023世界智能交通大会”为主题创作了一张海报,并就“智能交通最适合在哪个城市发展”以四川方言的形式进行了讲解,同时生成一则讲解视频。
值得一提的是,为了保证演示效果,文心一言的问答测试为提前录好的现场视频。发布会上,王海峰宣布,3月16日起首批用户可通过邀请测试码在文心一言官网体验产品。文心一言在实际应用场景中的反应能力,还有待进一步考验。
事实上,文心一言已成为百度手中最重要的筹码之一,投资者对其寄予厚望。文心一言的业务模式,亦成为关注焦点。
天风证券发布研报,在智能云业务增长中,更为重要的则是文心一言的推出(百度类GPT产品)。今年上半年,市场或能看到文心在ToB业务的发展前景:正如同微软公司将由其Azure云推向客户,百度有潜力将文心一言推向其深度合作云服务的客户,成为新的商业化增长点。同时,随着文心一言ToC的业务或从搜索端逐步推进,模型和数据集上或仍需时间积累和迭代,届时或能看到类似于微软一样的聊天机器人出现在百度搜索页面中。