文心一言和chatgpt比较图 我们体验了文心一言内测,问了它与ChatGPT十个同样的问题

默认分类1年前 (2023)发布 admin
2,034 0
ChatGPT国内版

以防失联,动动发财小手点个星标吧

通过十个同样的问题,直观对比文心一言与的差异。

作者 |江勇 东涯

顶着重压与期待,文心一言的新闻发布会终于召开了。

发布会上,百度创始人、董事长兼首席执行官李彦宏展现了文心一言的文学创作、商业文案的创作、数理逻辑的推算、中文的理解、多模态生成5个使用场景。

其中,“鸡兔同笼”解题,图像、视频和语音(方言)生成方面的能力,确实让人眼前一亮,不过提前录制好演示内容的这一做法,让人感觉稍显底气不足,发布会过程中,百度集团港股一度跌超10%。

面对可能出现的状况,李彦宏有打预防针:“从我的体验来说,文心一言不能说是完美。它的能力还在不断完善过程中,会有惊喜也会有错误。”

但也放豪言:“文心一言对标,百度在大厂中第一个做出来。”

虽然发布会已经结束,但文心一言并未向公众开放,只是百度智能云将面向企业客户开放API接口调用服务,并计划邀请首批用户进行体验。

由于发布会没有现场体验环节,找不到产品入口的用户难免好奇,宣传了这么久的文心一言能力究竟怎么样?与对标的有何差异?

我们想办法体验到了文心一言内测,下面我们将用十个同样的影视向问题,带大家来直观对比一下文心一言与的水平。

首先,我们来看看文心一言与对各自的评价。

眼里的文心一言是:

回答

文心一言对前辈的看法是:

文心一言的回答

文心一言官网的功能介绍为:能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。只把文心一言定义为一种“有趣而又有意义的文学工具”,多少有点以(kan)偏(bu)概(qi)全了,对比来看,文心一言的回答比较客观与全面。

接着我们问了杨紫琼获得奥斯卡影后、《瞬息全宇宙》获得奥斯卡最佳影片、韩剧《黑暗荣耀》三个热点问题,各自回答如下:

的回答

文心一言和chatgpt比较图 我们体验了文心一言内测,问了它与ChatGPT十个同样的问题

文心一言的回答

回答说:“杨紫琼获得奥斯卡影后这件事实际上不存在的”,说明了其训练库还有待更新。文心一言的回答虽有弄错杨紫琼国籍嫌疑,但除此之外整体话术周正,很有中国特色。

的回答

文心一言的回答

由于信息没更新,再问下去,开始一本正经胡说八道。文心一言的回答不出彩,但也没出错。

当我们提高难度,继续问比奥斯卡这个话题热度稍低、信息更新的相关影视问题时,文心一言和则出现了双双“宕机”的情况。把《黑暗荣耀》这个复仇剧,一个说成了黑帮剧,一个说成了反腐剧。

的回答

文心一言的回答

就目前这四个回合来看,因为的训练集滞后,文心一言似乎更胜一筹。

我们接着往下看,测测各自的语言生成能力。

的回答

文心一言的回答

对比两篇小作文,的有环境描写、有细节刻画、有情节反转,文心一言的更多是车轱辘话来回转,高下立判。

继续测试“业务”能力:

的回答

文心一言的回答

文心一言和chatgpt比较图 我们体验了文心一言内测,问了它与ChatGPT十个同样的问题

的回答显然有着一定参考价值,文心一言则扔给了一个群访主持人的串场稿。

接着我们问了几个相较主观的问题:

的回答

文心一言的回答

的回答

文心一言的回答

不管是电影还是电视剧,和文心一言的“品味”都有不小重合度。

当我们有意刁难它们时,它俩都显示出了十足的诚恳。

的回答

文心一言的回答

最后一个问题,我们向它俩发出了来自内心深处的灵魂拷问:

的回答

文心一言的回答

在它俩谦虚的回答里,我们得到了暂时的安慰。

上图是发布会之前盛传的梗图,通过对比测试,我们认为确实很优秀,但文心一言也没有这么不堪,甚至某些问题的表现上比更佳,应该给予文心一言更多鼓励与信心。

迈向人工智能时代道阻且长,我们无法预测未来,所有今天的进步都是历史的台阶,而台阶也终会落上岁月的尘埃,正如《银翼杀手》中那句经典台词:“过去种种终将遗失在时光里,就像滴落在雨中的泪水。”

(部分图片来源网络)

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...