讯飞星火认知大模型和chatgpt 五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

默认分类2年前 (2023)发布 admin

3,041 0 0

ChatGPT国内版

出品 | 搜狐科技、搜狐教育

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。AI大模型数学功底到底如何？比人类“聪明”吗？搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。

在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、进行回答。

测试结果显示，这五款大模型在答数学题的能力上差异显著。

最“聪明”的讯飞星火答对了5题，正确率50％。百度文心一言和“紧跟其后”，答对了4题，正确率为40％。

360智脑和通义千问则“全军覆没”，一道题也没答对，交了白卷。

值得一提的是，昨天搜狐科技也用五款大语言模型产品，对高考作文全国卷（甲）进行了测试，并邀请了5位语文名师打分。

讯飞星火认知大模型和chatgpt 五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

打分结果显示，高考作文得分最高，文心一言、讯飞星火得分稍低，但跟处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题，对大模型能力考察的维度并不尽相同。但巧合的是，不擅长写作文的360智脑和通义千问，似乎也不擅长做数学题。

通过这两次高考题测试，也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果、文心一言、讯飞星火是“学霸”，那么360智脑和通义千问则是妥妥的“学渣”。

附测试中使用的高考数学题题目：

1.不等式|x-2|

2.a=(2,3)，b=(-1,2)，则a·b=__

讯飞星火认知大模型和chatgpt 五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

3.首项为3，公比为2的等比数列的前六项和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域为__

6.复数z=1-i，则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π，则m=__

8.三角形的三边长为a=4，b=5，c=6，则sinA=__

9.某地一年四个季度的GDP(亿元)，第一季度GDP为232，第四季度GDP为241，且四个季度的GDP逐季度增长，中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak

# 默认分类 # 数学 # 讯飞 # 阿里 # 高考 # 高考数学

© 版权声明

文章版权归作者所有，未经允许请勿转载。

广告也精彩

相关文章

阿里版chatgpt项目官宣又一巨头跟进阿里版ChatGPT或11日亮相已推出内测

admin

4,051 0

利用chatgpt优化ppt 知乎精选 | ChatGPT与数学优化

admin

49 0

chatgpt 怎么更有发散思维如何培养学生的发散思维

admin

3,043 0

华为可以用chatgpt软件吗 AI比我懂中文？BAT的新战争进行中

admin

1,052 0

用chatgpt可以证明数学猜想吗数学难题“abc猜想”封印终被开启，望月新一的8年证明真的有效吗？

admin

51 0

讯飞版chatgpt内测开启讯飞版ChatGPT内测：AI技术助力智慧客服升级

admin

1,057 0

暂无评论

暂无评论...

323AI导航网（323ai.com）—— 精选全球实用AIGC工具箱。 AI人工智能爱好者使用学习必备导航网站，收录了国内外5000+优质AI实用工具网址，一个专业、全面、实用的AIGC工具与AI资讯导航网站，我们聚焦于最新的AI文本、AI绘画、AI视频、ChatGPT、Stable-Diffusion、Midjourney等AI项目，帮助用户发现最前沿的AIGC项目，探索人工智能的无限可能。

友链申请免责声明广告合作关于我们

Copyright © 2025 323AI导航网陕ICP备2023007327号-3