文心一言和chatgpt思考能力比较顶着压力，百度发布文心一言，邀请测试开启

默认分类5个月前发布 admin

5,007 0 0

在业内人们的认知中，能造出国产的公司里，百度排名前列，然而文心一言发布前夕，率先发布了功能更为强大的多模态大模型 GPT-4，巨大的压力给到了百度这一边。这一次，文心能否回应人们的期待？

距离 GPT-4 发布仅 37 个小时后，答案就被揭晓了：

‍

3 月 16 日下午，百度正式发布了知识增强大语言模型「文心一言」。

「这段时间不断有人问我：你们为什么现在发布，你们是不是真的 ready 了？」百度创始人、董事长兼首席执行官李彦宏说道。「其实自 2019 年起，每年文心大模型都要发布一个新的版本。文心一言的发布是我们过去多年努力的自然延续。」

文心一言当然是要对标，甚至 GPT-4。李彦宏表示，在全球大厂中，这样的产品百度是第一个发布的。

既然文心一言正式登场了，那肯定要上手试试。在现场，百度展示了文心一言在文学创作、商业文案、数理逻辑、中文理解和多模态生成方面的能力。

续写《三体》，文字生成视频

今天下午，李彦宏总共展示了五个案例，介绍文心一言的能力：

首先来体验一下文学创作。关于知名科幻小说《三体》，李彦宏和文心一言进行了一番对话：

‍

具体来说，「总结三体的核心内容」体现了文心一言的总结与分析能力，而续写《三体》体现了内容创作生成能力，再到「于和伟和张鲁一有哪些共同点」、「于和伟和张鲁一谁更高」这类问题背后，体现的则是文心一言的推理能力 —— 它需要先知道两人的准确身高，才能得出正确答案。

接下来，李彦宏还展示了文心一言的商业文案创作水平，包括给一家科技公司起名字、写、写新闻稿。

AI 要写好一篇稿子，除了需要准确理解我们的意图，还要有清晰的表达能力。

「对于语言大模型来说，这背后需要庞大的数据规模作为基础。人类常说『读万卷书』，而 AI 是『读书破千亿卷』。文心一言大模型的训练数据就包括万亿级网页数据，数十亿的搜索数据和图片数据，百亿级的语音日均调用数据，以及 5500 亿事实的知识图谱等，这让百度在中文语言的处理上，能够处于独一无二的位置，」李彦宏说道。

越来越多的研究和实践表明，大模型在参数体量达到某个量级时，就可能发生「智能涌现」，即使在没有专门训练过的领域，也能涌现出知识理解和逻辑推理能力。

我们无法将所有能力一一教给 AI，但通过大量数据的训练、数十亿的搜索请求，大量图片和知识图谱中的事实，在不断的训练过程中，文心一言拥有了通用化的能力。不知道文心一言目前的参数达到了多少。

第三个案例，是大家喜闻乐见的「数理逻辑推断」—— 李彦宏向文心一言发起了一个鸡兔同笼的挑战。

文心一言和chatgpt思考能力比较顶着压力，百度发布文心一言，邀请测试开启

文心一言可以告诉你题出错了。

对于第一道题目，文心一言经过演算，认为可能是题出错了。

对于第二道题目，文心一言不但给出了正确结果，还详细给出解题步骤。

也就是说，文心一言能理解题意，并产生正确的解题思路，进而像学生做题一样，按正确的步骤一步步演算出正确答案。同时，它也具备敢于质疑的品质：不是我错了，也许是题目错了呢？

可以看出文心一言已具备了一定的思维能力，能够学会数学推演及逻辑推理这类相对复杂任务。

「文心一言的数学能力在过去一个月的内部测试中不断进步。当然，现阶段准确率还不是 100%，我们还需要给它更多的时间来学习和成长。」李彦宏说道。

作为国产大模型，李彦宏展示的第四个案例，就是「中文理解」。

这是一些其他大模型应该无法准确回答的问题：

解释「洛阳纸贵」、写「藏头诗」，还要「答出其中蕴涵的经济学原理」，嗯，这很考验 AI 对中文和中国文化的理解。百度文心一言的中文水平优势也体现得淋漓尽致了。

李彦宏强调，作为扎根于中国市场的大语言模型，文心一言具备中文领域最先进的自然语言处理能力。同时他坦承，文心一言目前对英文语种、代码场景的训练还不够多，表现还不够好，接下来还要加紧训练，不断完善这些能力。

多模态是未来的方向，最后一个案例展示了文心一言的多模态生成能力：

先是文生图和语音生成能力，然后有意思的来了，李彦宏说：「请将以上内容生成视频。」

‍

文心一言接连生成了文本、图片、音频和视频，展示了多模态生成能力。「视频的生成功能还没有完全开放，这是因为计算成本比较高。目前，每天已经有几万篇百家号文章的视频是通过这样的技术实现分发的。」李彦宏表示。

但需要注意的是，这和 GPT-4 上的多模态理解并不是同一个方向。

大模型是革新生产力的工具

文心一言和chatgpt思考能力比较顶着压力，百度发布文心一言，邀请测试开启

无论是、GPT-4 还是文心一言，大型语言模型还远未到发展完善的阶段，自然语言表达能力、逻辑推理能力在不断的发展过程当中。有时候会有很惊艳的表现，但不少场景下细究起来还有明显的 bug。

「但有一点是肯定的，它的技术会快速发展，未来一定会实现很强大的能力，」李彦宏做出判断。「文心一言会成为每个人必不可少的生产力工具。」

李彦宏认为，在人工智能时代，IT 技术栈发生了根本性变化，从「三层」变成「四层」：芯片层、框架层、模型层和应用层。

文心一言处在模型层。AI 时代的应用，将基于预训练的基础大模型进行开发。而纵观全球，在芯片层、框架层、模型层和应用层四层都有产品积累的公司为数不多，百度是其中一家。

「未来在文心一言的迭代速度上，你们会有感受，」李彦宏说道。

目前，已有 650 家企业宣布接入文心一言的生态。「生成式 AI 代表了新的技术栈，创造市场需求的爆发式增长。超强的自然语言理解、表达和推理能力。大模型能让任何公司距离自己的客户更近，人们能创造更好的客户体验，建立更强的竞争优势。」

百度认为，未来脑力劳动者的工作效率可以提升四倍，人们的工作方式会发生不可逆转的改变。

李彦宏也展望了生成式大模型带来的新机会：

第一，新型的云计算，未来的服务提供方式将成为 MaaS（模型即服务）。主流商业模式从 IaaS 变为 MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务，未来更多会看框架好不好、模型好不好以及模型、框架、芯片、应用这四层之间的协同。

第二，行业模型精调。通用大模型和企业之间的中间层，具有行业，调用通用大模型能力，为行业客户提供解决方案。文心大模型，已经在电力、金融、媒体等领域，发布了 10 多个行业大模型。在各行各业都有机会。

第三，基于大模型底座进行应用开发，即应用服务提供商。当前，基于文本生成、图像生成、音频生成、视频生成、数字人、3D 等场景，已经涌现出很多创业明星公司，这些公司很可能就是未来的新巨头。每一家企业在这个阶段都有机会。

在李彦宏展示完文心一言的 Demo 之后，百度 CTO 王海峰上台分享了背后的技术与百度多年的技术积累。

王海峰表示，文心一言是新一代知识增强大语言模型，是在 ERNIE 及 PLATO 系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术，ERNIE 和 PLATO 中也已经有应用和积累，在文心一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是文心一言未来越来越强大的基础。

在演讲的最后，王海峰说文心一言目前已经开放测试。即日起，首批用户可通过邀请测试码在官网体验产品。百度智能云即将面向企业客户开放文心一言 API 接口调用服务，在官网可申请加入文心一言云服务测试。

以上就是百度今天发布会的内容了。看完发布会，相信每个人都有自己的感受。有人也许对百度没做现场 Demo 不满，也有人愿意宽容看待。

我们不得不承认，百度至少迈出了一步。接下来，就是看国内在这方面能不能越走越快。

最后，机器之心也获得了文心一言的测试资格，我们会尽快带来体验报道。

©THE END

323AI导航网发布