“大模型绝不仅仅是生成式AI,认知大模型将带来整个互联网甚至信息产业的重塑。”5月6日,身着传统黑西服、白衬衫的科大讯飞董事长刘庆峰在“星火认知大模型成果发布会”现场,面对1500多名观众,他语出惊人:“2年内,所有APP会基于大模型重写一遍。”
文/每日资本论
三年前,中国合肥,这座拥有两千多年历史的古城GDP首次突破万亿大关。如今,这里又诞生了一项更为大胆的决策——“革”互联网的命。
“大模型绝不仅仅是生成式AI,认知大模型将带来整个互联网甚至信息产业的重塑。”5月6日,身着传统黑西服、白衬衫的科大讯飞董事长刘庆峰在“星火认知大模型成果发布会”现场,面对1500多名观众,他语出惊人:“2年内,所有APP会基于大模型重写一遍。”
是的,自打去年11月30日Open AI公司发布Chat GPT之后,短短两个月,全球活跃用户数超过1亿。今年3月以来,国内的百度、腾讯、华为、阿里巴巴等多家一线科技、互联网公司纷纷官宣相关的模型和方案。一时间,谁不提大模型,似乎谁都不好意思说自己是TMT企业。
尽管各家有各家的优势,但因种种原因,大部分模型不仅没能让人眼前一亮,甚至觉得中外科技在大模型上已经从一开始就错开了身位。
以至于,刘庆峰要在现场实测时,大家多多少少为他捏了一把汗——既希望他能够玩转大模型,缩小或看到超越Chat GPT的希望;又担心搞砸了,让全世界都看笑话。
谁也没有想到,当“星火认知大模型”将一段录音自动生成文案、自动生成多个PPT,将小学生作文秒改精批后,很多人不由自主地站起来,拿出相机进行拍照上传朋友圈。而“星火”中的女声将一篇严肃的会议纪要改成了以“小姐姐……”开头的小红书文体时,全场又传出会心的笑声。原计划1个半小时的实测,因网友参与热情过高延迟到2个小时还意犹未尽。
更令人惊讶的是,围绕着“多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答”等7个维度的481项测评体系,科大讯飞的星火大模型针对文本生成一共有181个细分任务测试——结果,星火在国内目前已经推出来、能够测试到的认知大模型中明显领先,中文已经超过了Chat GPT水平,英文如果满分以5分来算,Chat GPT现在是4.48分,星火达到4.29分。
尤其是,语言理解将来是星火认知大模型用各种插件和工具最核心的一项能力。在418项测试体系中有119项详细任务跟语音理解有关。刘庆峰挥舞着胳膊,大声地说道:“我非常自豪地告诉大家,在国内可测的现有系统中我们遥遥领先,跟Chat GPT相比仅有细微差别。”
或许是受到全场热烈气氛的感染,刘庆峰再次语惊四座:“到10月24日,也就是科大讯飞的全球开发者节那天,我希望星火能够在通用的认知大模型能力上对标Chat GPT,在中文上要超越,在英文上要旗鼓相当。”
哪来的底气?
坦率地说,敢如此雄心勃勃地公开对标时间表,确实需要相当大的勇气。
不过,熟悉科大讯飞的人也知道,其通向认知大模型有着相当扎实的基础。早在2014年,科大讯飞便启动了“讯飞超脑”计划,逐步突破机器阅读理解、逻辑推理、分析归纳、知识表达等技术难点,实现机器从“能听会说到能理解会思考”。
2019年,科大讯飞成立20周年时,刘庆峰在公开信中准确地预测到未来10年三大趋势:……人工智能将深刻改变世界的生产和生活方式,人工智能将为各行业赋能,人机耦合无所不在。
2022年,科大讯飞在人工智能关键核心技术领域累计摘取16项国际人工智能大赛的冠军,其中13项涉及常识阅读理解挑战赛、QASC、等专业领域知名竞赛。
另外,算法已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平,已开源6大类、超过40个通用领域系列的中文预训练语言模型,相关模型库月均调用量超1000万。
同年12月,科大讯飞启动了“1+N”认知智能大模型技术及应用”专项攻关,其中“1”指的是通用认知智能大模型平台,“N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域,并形成独具优势的行业专用模型。
简言之,正是有了这些基本能力的积累,以及对未来发展方向准确预测,才让科大讯飞具备了闪电验证并快速进入大模型时代的基础条件之一。
但仅有这些显然不够。
众所周知,在推动国产AI大模型发展的过程中,人才储备不足、算法和模型质量不高、算力短板等问题,仍然是摆在包括科大讯飞等在内的众多科技企业面前的难题。
首当其冲的就是人才问题。做认知大模型这样的前沿核心技术研发不是靠堆人,而是靠一定规模的高手之间互相信任、高水平的协同。刘庆峰把做大模型比作踢球,踢球谁都能踢,但只有梅西能踢好,讯飞就有一群“梅西”这样的“球员”——讯飞研究院最核心的研究团队有200多人,其中有两位是《麻省理工科技评论》“35岁以下科技创新35人”榜单中顶尖的年轻科学家,其他团队成员不少是多年来和讯飞一起成长的博士。
在中文文本数据积累方面,科大讯飞有着天生优势。其拥有语音及语言信息处理国家工程研究中心多年研究过程形成的积累,在中文语音市场占有率遥遥领先。讯飞人工智能开放平台作为首批国家新一代人工智能开放创新平台,日使用量超过50亿人次。在严格尊重用户隐私和遵守适用法律法规前提下,多年来为大模型提供了海量文本语料和用户反馈数据。
更为关键的是算力。对于AI大模型研发来说,虽然没有高端GPU也能研发AI大模型,但训练效果和效率必然大打折扣。科大讯飞AI工程院院长潘清华向“每日资本论”介绍,星火认知大模型用的华为昇腾芯片,打造了研发服务一体化的讯飞火石平台。
讯飞火石平台包含高效分布式统一数据处理平台、大模型集群管理平台等,具备每天处理PB级多模态数据的能力,支撑6类大模型任务,并通过弹性混合云架构,实现跨云资源的分钟级弹性扩展。
此外,科大讯飞还与华为、合肥市大数据资产运营有限公司形成三方合作,通过多维度的加持,完善算力生态体系建设,避免在关键领域被“卡脖子”。
刘庆峰说,科大讯飞做认知大模型并非随GPT,而是有自己的逻辑。认知大模型刚开始起步,还在快速成长和迭代的过程中。在此过程中,科大讯飞一定要贡献中国力量和中国影响力,让中国实现知识汇聚和机器智慧涌现的第二极。
给“重塑”打个样
当然,对于更多人来讲,能否落地,落地的效果能否更酷,如何提升商业价值,这直接关系到星火认知大模型能否生存的关键所在。但这恰恰是刘庆峰第二个底气来源。
不得不说,科大讯飞在其传统的智慧教育领域确实具有非常雄厚的实力。
在“双减”之后,很多父母常常担心两个问题,如何提高孩子的作文写作能力以及外语的听说能力?试想,如果对一篇作文进行精批需要30分钟,按一个班40人计算,老师批改一篇作文要20小时以上,这个时间成本太大。而搭载星火认识大模型的科大讯飞AI学习机T20系列,可实现一篇作文可在短短数秒内完成精批,并且会按照先改错字后改病句,以及提出修改样板等几个步骤,让学生对作文的优缺点一目了然。
让上班族激动的是,星火认知大模型可轻而易举地将多人语音对话,归纳形成会议纪要、文案、通知、故事创作等多任务长文本生成。尤其是,“星火”能够通过文档模式,自动提取要素并生成多个类型的PPT,可大幅度缓解上班族的PPT制作压力,简直就是上班族的“神器”。
在眼下热得发烫的新能源汽车领域,星火也有很好地衔接。在科技界,谁都知道汽车上的“屏”是除手机之外兵家兵争之地。所有的功能和应用,绝大部分厂商都懂也都有,关键就看谁让用户体验更为丝滑。
科大讯飞早就在这个领域进行了布局,成立了相关公司,并通过星火大模型与智慧座舱的结合,可以实现车内跨业务、跨场景人车自由交流。可以问导航、问天气、问如何修理汽车等等,拥有业界领先的智能语音交互系统,提供多人、多轮、多区域、多模态的智能汽车交互体验“甚至可以把一台20多万元的车音效做到听起来超过百万豪车。”刘庆峰说。
目前,科大讯飞已与广汽、奇瑞、蔚来、理想、零跑等数十家新能源汽车厂商进行了深度合作,累计服务用户已经超过4610万,服务车型超过1300个,在国内汽车智能语音应用市场保持占有率第一。
值得一提的是,科大讯飞没有在发布会上推出备受期待的医疗大模型。
此前,科大讯飞“智医助理”已经在业界名声鹊起-是业内唯一通过国家职业医师资格测试的智能辅助诊断系统,可诊断1400种疾病,覆盖5万多种药品,在全国30个省市近400个区县常态化应用;辅助基层医生完成超过2亿份规范电子病历,电子病历书写规范率整体提升至90%以上,累计为基层医生提供5.3亿余次AI辅助诊疗建议。在医疗这种关系到人民生命安全的专业领域,容不得AI“一本正经地胡说八道”。
据悉,科大讯飞将会在今年10月24日开发者大会上正式对外发布医疗大模型。
在发布会临近结束时,刘庆峰不无动情地表示,24年前他们刚做“让机器能听会说”时,没有人会认为他们能成功。如今,他们抢回了70%的中文语音市场。在最近一次美国国家标准与技术研究院组织的全球多语种识别比赛中,15个语种科大讯飞全部名列全球第一。今天在“能听会说”之后的“能理解会思考”,通用人工智能的曙光已经来了,将会开启全新的未来。
场下,再度响起雷鸣般的掌声。
【文章只供交流,并非投资建议,请注意投资风险。码字不易,若您手机还有电,请帮忙点赞、转发。祝所有读者,2023年身体健康,心想事成,前兔无量】