昨天(3月16日)下午,百度正式发布生成式对话产品——文心一言。
这是火爆全球后,国内亮相的首个生成式对话机器人。
把人工智能重新推回到全球科技领域风口上,深耕AI多年的百度希望借由文心一言的推出,重塑公司形象并重回国内科技公司第一梯队。
作为国内在自然语言处理NLP研究领域优势较大的百度,文心一言的能力与应用场景实现备受瞩目,不过在下午发布会刚刚开始时,百度集团港股股价就下跌9%,股价蒸发超300亿港币。
回想此前谷歌发布生成式对话机器人Bard时,由于回答错误导致的尴尬事件,使谷歌母公司股价蒸发7000亿美元。
面对微软和来势汹汹且高调的,任何同类型产品的推出都势必将面临与的比较,尤其在GPT-4刚刚发布的当下,容错成本很高。
李彦宏在发布会上宣布 文心一言将通过邀请测试码上线,给百度的一次大考也将由此开始。
01
中国版?
在下午的发布会上,李彦宏从“文学创作、商业文案创作、数理推算、中文理解、多模态生成”五个使用场景分别展示了文心一言的能力。
关于《三体》作者、内容、演员的描述,给公司起,写新闻稿这些任务文心一言都能准确完成,尽管李彦宏自己在现场也说生成式对话AI出错的概率还是挺大的,但文心一言初次亮相的表现还算令人满意。
关于“鸡兔同笼”和“洛阳纸贵”系列问题的回答和展现,文心一言则展示了其逻辑性和理解力,有预训练文心大模型的支撑,文心一言在演示中的实力还是不错的,但具体使用效果,还需要等开放给用户后,再进行评判。
百度首席技术官王海峰称,文心一言是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。
前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨,后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。
王海峰对文心大模型的描述点明了百度在人工智能领域的优势——从2019年文心大模型首次亮相以来,百度在自然语言处理领域始终进行着技术储备和探索,文心大模型已经从单一自然语言理解升级迭代为知识增强的.0系列、跨模态系列等底座模型,目前文心大模型在应用层面已经累计发布11个行业大模型,包括金融、航天、影视、传媒、社科、燃气、电力、制造等。
并且百度还有自研的昆仑芯片与飞桨深度学习框架,这足以支撑起文心大模型的开发、高性能训练、模型压缩、服务部署等各种能力,可以贯通整个AI产业链,这也让百度成为全球为数不多布局人工智能全栈自研技术架构的科技公司。
从文心一言首次亮相的表现,以及百度深耕人工智能全链路发展的成果来看, 文心一言成为中国版的可能性还是存在的。
02
场景化落地的考验
“我们计划首先将文心一言嵌入百度搜索。我们相信这将重塑信息的生成和呈现方式,有机会形成新的流量入口,帮助我们吸引更多的用户,并获得市场份额”。
与微软宣布将嵌入搜索引擎Bing一样,李彦宏将文心一言率先接入百度用户基数最大的搜索上,一是可以通过用户群和人工智能风口效应带来巨大的流量,二是对于自然语言处理场景化落地时,搜索是目前最直接且效果比较好的方式。
底层算力、数据支撑、应用场景落地可以看做是自然语言处理对话AI成功的关键因素,算力与数据对于百度而言,尽管与微软和还有差距,但拥有昆仑芯、飞桨架构、以及全球最大中文语料库,文心一言需要面对的依旧是应用场景落地的难题。
在GPT-4发布之前,对于以GPT-3.5模型支撑的而言,应用场景同样是亟待解决的问题,因此会开放API,以收费的形式希望带来更多的应用产品开发。
李彦宏在发布会上称,国内已经有650家企业宣布接入文心一言生态,要比上个月刚刚宣布“文心一言”时的400家多出不少。
和文心一言代表的生成式AI带来的全新技术范式和对企业经营与产业发展颠覆性变革,让更多企业愿意加入到生成式AI生态中,这是开放API时在考虑的,也是文心一言希望国内企业去做的。
GPT-4的发布,让场景落地似乎不再是限制生成式AI的因素,其对图片、视频、音频的理解和处理能力已经比GPT-3.5强大许多,GPT-4对人类生活和工作的革新作用,会随着应用场景的增多越来越明显,而这是将是百度技术团队接下来需要追赶的。
03
AI2.0的革命
创新工场董事长李开复在近期的一次媒体见面会上直言“AI2.0是绝对不能错过的一次革命”。
李开复将生成式AI的出现定义为AI1.0和AI2.0的分界点,过去人们熟知的AI应用,比如文字拼读、智能家居、自动驾驶等场景被他纳入AI1.0的范畴,而AI2.0与之的区别是:第一,不用人工标注,可以阅读海量文本;第二,规模非常大,做这个模型需要几千张GPU来训练,现在只有大厂还有拿到巨额融资的企业才能做;第三,它通过微调等方式适配和执行五花八门的任务,真正有望实现平台化的效应,进而探索商业化的应用创新机会。
从GPT-4发布时,对其的能力与可预见应用场景的描述中,可以预测和文心一言所代表的生成式AI作为进入AI2.0时代的应用,将彻底改变一些应用生态和产业模式。
在开放API后,美国有非常多科技创业公司在接入,以此来打造未来生活中垂直应用场景,从电商、广告、影视、游戏、金融、医疗等领域纷纷有涉及,量身定制的专属感、亲身参与的沉浸感、交互增强的乐趣等,都是未来通过生成式AI打造的垂直应用所带给人们生活最直接的改变。
云计算、进行行业模型精调、基于大模型底座进行应用开发,是李彦宏预期中文心一言将带来巨大改变的产业,其对文心一言的定义是“将复杂的生活简单化”,等待接入文心一言生态的650家企业纷纷开发出各自的产品时,也许才可以给文心一言准确的定义。
来源| 青投创新(ID:)