现在全世界有各种各样的大模型,都说自己很强,能免费试用的大模型,国内比较知名的有:阿里的通义千问、百度的文心一言3.5版本、vivo的蓝心大模型等;国外的一般用的就是.5。
日常的查资料来说,阿里的通用千问和百度文心一言3.5版本是差不多的,只是在话术和详细程度上略有差异,例如问:“深圳地铁14号线有哪些站点?”,阿里通用千问和文心一言都能准确回答,通义千问会直接先给出答案,然后再讲背景;文心一言会先讲一堆背景,再讲答案。我个人比较喜欢通义千问的直接,所以,我通常都是用通义千问,也经常将通义千问推荐给身边的朋友。直到我让通义千问帮我做点儿简单的数学计算,一下让我有些迷茫了。
我让通义千问帮我计算: 0.35, 0.25, 0.3, 0.45, 0.43 的平均值,以下是它给我的结果:
姿势还搞的挺好,我差点儿以为就是准确的,本着严谨的态度,我稍微口算了下,发现它的求和是错误的,这就有点儿尴尬了。我让它重新算了一遍,还是一样的结果;我给它说你算错了,它承认自己算错了,但是给我重新算的结果还是一样的,这家伙还蛮固执。
然后,我用文心一言,求和结果是对的,算出来的平均数结果,直接给我四舍五入了,需要再次告诉它,精确到小数点后面4位,它才能显示精确的结果。比较尴尬的是,当换一组数据时,它不仅会重新讲一遍计算逻辑、且还是会自作主张的四舍五入。以下是文心一言的结果:
这个两个国内领先的大模型在计算时都有一些不太智能,只好试一下,它确实比较厉害,回答问题简洁、计算结果也是准确的,换一组数据计算时,只会列出计算公式和结果,不会重复讲一堆计算逻辑,效率高很多。以下是的结果:
由以上几个小点可以看出,国内文心一言的计算能力比通义千问更强,但是和比,还是有不小的差距,希望国内的大模型能加速赶上!
323AI导航网发布