在的“继任者”GPT-4发布一天之后,3月16日,百度在北京公开展示了新一代知识增强大语言模型、生成式AI产品“文心一言”。
作为后来者,文心一言无法逃脱与对比的命运。此前,不少人认为百度是“全村的希望”,但也有网友用一张梗图表达了对文心一言的担忧。
/strip//95/-error/1|”/>
之所以如此,在于谷歌此前急炫AI搜索肌肉时暴露出了若干个瑕疵,导致了股价暴跌近8%;这次,在发布会进行的同时,百度港股市值也大幅下跌超9%。
/strip//95/-error/1|”/>
和一样,文心一言是一个多模态大模型,包括文学创作、商业文案创作、数理逻辑推算等能力。那么,这个中国版的到底实力如何?能否担得起“全村的希望”?记者对文心一言和进行了实测。
中文检索准确度高
文学创作偏理性
在文学创作上,文心一言一开场就被提问《三体》的文学常识。
/strip//95/-error/1|”/>
看起来已是标准答案。再用同样的问题问呢?
/strip//95/-error/1|”/>
延续了“一本正经”胡说八道的习惯:直接把刘慈欣的籍贯都给改了。
下一个问题是对《三体》进行续写。
/strip//95/-error/1|”/>
看起来中规中矩,比较理性。然后是的答案。
/strip//95/-error/1|”/>
自古“文无第一”,你对谁的续写思路更有兴趣?
能给公司起名字
更懂中文背后的寓意
接下来,文心一言展示了在商业文案创作上的能力。
比如,给新公司起个名字,并且还强调这个名字是有寓意的。
/strip//95/-error/1|”/>
再看看的商业策划能力。
/strip//95/-error/1|”/>
看起来,对中文的理解还是相对肤浅。
解小学奥数题无压力
还知道出错了题
数学计算能力是考验生成式大模型的一大难题。刚上线时,也翻了不少车。现场,文心一言被问到的是小学数学竞赛常见的鸡兔同笼问题。
值得一提的是,现场展示的第一题题目出错了,文心一言也给与了及时反馈。修改了题目后,文心一言给出了详细的解题步骤。
/strip//95/-error/1|”/>
中文理解力更胜一筹
英文能力稍欠缺
作为扎根于中文世界的生成式AI,广大网友对文心一言的中华文化理解力寄予厚望。那么,其对中文的理解能力究竟如何?
用“洛阳纸贵”分别问文心一言和。
文心一言不但解释了成语及其来源,还阐释了背后的经济学原理。
/strip//95/-error/1|”/>
/strip//95/-error/1|”/>
相比较而言,对中华文化的理解就要逊色一些。
/strip//95/-error/1|”/>
只不过在阐释经济学原理上,与文心一言能力相当。
/strip//95/-error/1|”/>
再看看双方写的藏头诗。
文心一言的七绝略显得“打油”。
/strip//95/-error/1|”/>
给出的答案就更加离谱,似乎不理解“藏头诗”是什么含义。
/strip//95/-error/1|”/>
据介绍,在英文上,文心一言虽然也能处理,但能力是显著不如中文的。这或许和目前能用到的训练数据有关。
不过,在发布会后,百度港股股价也有所回升。对此,文心一言还解释了个中缘由,不过话里话外都是“客观原因”。
/strip//95/-error/1|”/>
不服气的记者又问了一个关于“自己”的问题。答案却是……
/strip//95/-error/1|”/>
怪不得不少网友对文心一言展示出的能力不太满意,甚至有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”。
/strip//95/-error/1|”/>
不过也有网友表示,希望能给国产产品多一点时间和耐心。
在此之前,已经有超过650家生态合作伙伴宣布加入文心一言,包括封面新闻、环球时报等媒体,以及企业和机构组织。这款中国造究竟好不好用,能走多远,相信很快就会有答案。