文心一言是chatgpt的同类竞品吗 百度文心一言发来测试邀请 发方言语音、秒画大熊猫 生成式AI时代启幕

默认分类1年前 (2023)发布 admin
1,542 0
ChatGPT国内版

一阙《青玉案·元夕》,辛弃疾用时间制造了顺理成章的浪漫。八百多年后,由词化名的科技公司百度,用大语言模型开启了“生成式AI”时代。通过文心一言,“众里寻他”只需要几秒钟的时间。

3月16日,百度召开新闻发布会。从百度创始人、董事长兼首席执行官李彦宏现场演示的demo效果上看,文心一言具备文学创作、商业文案创作、数理推算等大语言模型较常见的优势和能力,还在中文理解、多模态生成能力上更具特色。

不过,文心一言、背后的技术逻辑,与通过海量无标注数据训练的大模型之间差异鲜明,即需要人的参与。整体而言,这类大语言模型还未到发展完善的阶段,部分场景足够惊艳,但一些场景下也有bug出现,存在很大进步空间。

人类向往科技,是期待它更好地理解人类意图,生成符合人类价值观、表达习惯的回复。这一点上,唯有真实的体验才能带给用户惊喜。从技术发展趋势上,大语言模型和生成式AI成为新的技术范式已毋庸置疑,百度方面透露,已有超650家合作伙伴宣布加入生态,如李彦宏所说,AI的长期价值,对千行百业的颠覆性改变,才刚刚开始。

“十年分娩,一朝怀胎”

今起开放首批测试

出现后,一向走在创新路上的百度立刻官宣了对标产品文心一言。看似突然,但李彦宏介绍,百度在过去十几年间一直在AI研发上持续投入,文心大模型的第一个版本在2019年就发布了,此后每一年都要发布一个新的版本。

最新的版本在新闻发布会现场亮相,李彦宏与文心一言在5个场景展开了问答互动。

在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。面对《三体》电视剧演员于和伟和张鲁一“有哪些共同点”“谁更高”这类问题,文心一言也基于推理能力得出了准确答案。

文心一言是chatgpt的同类竞品吗 百度文心一言发来测试邀请 发方言语音、秒画大熊猫 生成式AI时代启幕

除了文学创作,商业文案也是用户使用较为广泛的场景。在这一创作场景中,李彦宏对文心一言下达了“如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名”“数智云图这个名称不错,给我起一个公司的服务,表达共赢的概念”“帮我生成一篇公司成立的新闻稿,数智云图以共赢的服务理念用大模型服务中小企业数字化升级,字数600字”等指令。

搜索业务的基因是文心一言的基石。

李彦宏介绍,文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,及5500亿事实的知识图谱,是数据规模发生的“智能涌现”。而在百度搜索中,问答和生成类的搜索请求占比极高,因此文心一言在自然语言问答和创意内容的生成上有相对突出的表现。

值得关注的是,过去的几个月,让AI自行展开创作,“一本正经地胡说八道”是用户最头疼的问题。在这方面,文心一言表现如何?根据李彦宏的介绍,为减少错误率,百度对文心一言做了知识增强和检索增强,大幅度提升了事实性问题的准确率。

此外,李彦宏介绍,文心一言具备一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。

不过,李彦宏也直言,现阶段文心一言的准确率还不是100%,需要更多的时间学习和成长。

发布产品细则的同时,百度也公布了文心一言的邀请测试方案:3月16日起首批用户即可通过邀请测试码,在文心一言官网尝鲜。企业方面,百度智能云企业客户也可开始预约申请加入文心一言云服务测试。

根植本土文化

文心一言是chatgpt的同类竞品吗 百度文心一言发来测试邀请 发方言语音、秒画大熊猫 生成式AI时代启幕

支持多模态拓展

文学创作、商业文案写作、数理逻辑推算是大语言模型相对常见的优势和能力。被李彦宏称为“十年分娩,一朝怀胎”的文心一言,还有哪些特殊之处?

首先,作为扎根于中国市场的大语言模型,文心一言具备中文领域极先进的自然语言处理能力,在中文语言和中国文化上有较好的表现。

为展示文心一言的中文表达能力,李彦宏现场就“洛阳纸贵”的典故输入了以下问题:洛阳纸贵是什么意思?当时洛阳的纸到底有多贵?这个成语在现在的经济学原理里,对应的理论是什么?用洛阳纸贵四个字写一首藏头诗。

文心一言所作藏头诗如下:“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央。”秀了一波中文优势后,李彦宏也直截了当地表示,目前文心一言对英文语种、代码场景的训练还不够多,表现还不够好,未来会加紧训练,完善上述能力。

值得一提的是,对于生成式AI,用户还有一个期待,即多模态生成。李彦宏也强调,多模态是生成式AI一个明确的发展趋势。

从现场展示来看,文心一言具备生成文本、图片、音频和视频的能力。

有趣的是,文心一言还能生成四川话等方言语音。据李彦宏透露,每日有几万篇文章正通过该能力转成视频内容并在百度分发。不过,受成本限制,现阶段视频生成功能还未对全部用户开放。在李彦宏的设想里,通过定向微调,文心一言将在百度内外部各类产品上逐步展示出亲和力,拉近产品和用户的距离。

回应市场需求

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...