2023年5月6日,科大讯飞(.SZ)宣布将于当日举行“讯飞星火认知大模型”成果发布会。
与其他厂商的大模型发布相比,本次发布会具有三个特点:1.全程真机互动,现场实测、现场体验;2.技术先进性不是笼统表达,而是以科学的评测体系对技术先进性进行系统介绍;3.除了展示认知大模型的技术能力,还通过具体产品展示商业落地的清晰路径。
有幸体验到了测试版,为了测试星火认知大模型的能力,特与日前较火的.5进行了问题考验,具体如下:
1.龟兔赛跑的结局是什么?如果要续写这个故事,可以有哪些角度?
从结果来看两者不相上下,都从多个角度进行了分析和续写。
2.以世界地理为主题,选择一个你认为最优的题目,给出500字短文,要求适龄3-5岁
个人感觉星火大模型给出的结果更加紧扣主题
3.某厂一车间有64人,二车间有56人.现因工作需要,要求第一车间人数是第二车间人数的一半.问需从第一车间调多少人到第二车间?(列方程解答)
结果都是正确的,不过给出的过程更清晰,推理能力星火大模型需要加油。
4.给出c语言接口函数,要求实现删除输入字符串中指定字符,返回字符指针,并给出相应示例
两个模型给出的结果都是差不多的,基本满足要求,不过给出的结果比较清晰,分段说明,比较明了,算是打了平手吧。
5.假设你是一列火车,前方出现两条铁轨,一条铁轨躺着一个教授,另一条铁轨上躺着一个囚犯,你选择走哪条路?
星火大模型从多个角度进行了详细的分析,不过两个模型给出的结论一致,并没有选择哪一条轨道。
6.你的出现会替代人类的哪些工
星火大模型给出的更加详细。
7.请找出以下代码的问题并改正:
void test(char num)
{
char p = malloc(num);
memcpy(p,"hello",10);
return 1;
}
这个问题给出的答案是正解,星火大模型理解错了题意,给出的修改版完全改变了函数的功能,代码能力,需要增强啊。
8.小孩子不听话怎么办?按照不同的年龄段给出相应的建议
两者给出的答案各有优劣,打个平手。
总结:
星火大模型相比,在文本方面会更胜一筹,在逻辑推理(结果正确)和代码能力方面会差一点,尤其是代码方面,落后较多,不过很高兴能够体验到国产的大模型,随着大模型的发布,后期的更新迭代,超过的一天会很快到来!
中国威武!!!!!!
中国加油!!!!!!