学习或挑战的“正确姿势”,或许还是在更基础、更底层的原始创新中寻找力量。一些中国企业在芯片、操作系统、AI大模型等方面持续投入,并且有所产出,的出现,也是中国AI企业加速奔跑,迎来新一轮发展的契机。
——————————
最近,AI(人工智能)圈一股以“”为核心的热潮从美国“硅谷”涌入中国。
2022年11月底,初创公司发布了名为的对话式聊天机器人模型,一经推出,便在网络上迅速走红。美国科技公司微软的联合创始人比尔·盖茨高度评价这项技术,认为它的出现不亚于互联网和个人电脑(PC)的诞生。
进入2023年,微软推新,谷歌入局,“”热潮迅速升温,国内的科技巨头也陆续涌入潮中。发布后,包括百度、科大讯飞、京东等在内的多家企业纷纷公布自己在AI领域的布局。
近日,360创始人周鸿祎在一场直播中表示,如果企业搭不上这班车,很可能会被淘汰。确实,作为一个现象级的应用(模型),的出现为AI领域的技术发展和产业布局带来新的变化。
回溯的诞生过程,可以发现这是一个创业团队先“活下来”,再实现“服务所有人”目标的故事,这也是一个从某个企业闭环研发到整个行业开源共创的AI大模型,更是一个利用超大数据、超强算力、超强算法“喂养”出来的跨越式AI产品,是量变引起质变的产物。
梳理人工智能产业的历史和现实,可以看到数据背后是广泛的应用场景,算力背后靠的是完善的信息基础设施,算法背后需要深厚的人才储备。这些方面中国已经有所准备,甚至可以说已经积累了庞大的数据、算力和人才优势。而在浪潮汹涌而至时,盲目跟风、“”早已落伍,甚至只是在应用层面“搭车”也显得不合时宜。
学习或挑战的“正确姿势”,或许还是在更基础、更底层的原始创新中寻找力量。一些中国企业在芯片、操作系统、AI大模型等方面持续投入,并且有所产出,的出现,也是中国AI企业加速奔跑,迎来新一轮发展的契机。
潮涌
“今天我们推出了,尝试在这里与它交谈”。
2022年11月30日,热潮来袭。首席执行官山姆·阿尔特曼当天发布了一则推特,推特中除了上述文字,还包括一个链接,任何人都可以点击链接、注册账户,免费与交谈。
与Siri、小爱同学等语音助手类似,也是人机交互应用的一种。但在与“对话”的过程中,人们发现它的“智慧程度”远超其他的人工智能机器人。除了聊天,被网友们用来写文案、翻译文本、为代码纠错,甚至用来编写代码。
据官网介绍,能够连续回答问题、承认错误、质疑不正确的前提和拒绝不适当的请求。“第一次,它(指)答错了,我告诉它正确信息后,再问同样的问题,它的答案就被改正了过来了。”一位曾尝试与对话的程序员对记者说,“它甚至为此对我说‘抱歉’”。
凭借出色的表现,仅用两个月便吸引了超过1亿用户的关注,一跃成为20年来互联网领域增长最快的消费类应用。
北京时间2月7日凌晨,美国科技巨头谷歌紧急入局,宣布基于LaMDA大模型的人工智能对话式机器人“Bard”正在进行内测。次日,微软宣布推出由支持的最新版本Bing搜索引擎和Edge浏览器,热潮升温并迅速触及中国。
就在谷歌官宣Bard内测的当天下午,百度官宣了大模型新项目“文心一言”(),并表示预计在3月完成内测。随后一段时间,阿里巴巴、360、科大讯飞、腾讯等多家国内企业纷纷表示对AI技术发展的关注。2月10日,京东云宣布旗下言犀人工智能应用平台将推出产业版–。
从科技巨头,到行业龙头,中国企业竞逐AI赛道,AIGC(利用人工智能技术来生成内容)等人工智能概念在股市一路狂飙,虽然在监管出手后很快平息躁动,但涨势依然存在。中信证券研究报告认为,在全球的流行正在推动AIGC产业化全面提速,将引领创成式AI新变革。
“”热潮涌动,正处于冷静期的人工智能投资和产业布局迎来小阳春。
用大数据、大算力、强算法“喂养”
商企入局,资本关注。“”热潮涌动的背后,是AI大模型的一次场景化落地。“的成功,意味着AI大模型之路的发展成熟。”中国信通院云计算与大数据研究所所长何宝宏日前在一篇评论文章中写道。
AI大模型是人工智能迈向通用智能的里程碑技术,模型可以自动从数据中学习知识,提升性能。GPT是推出的AI大模型系列。从2018年到2022年,先后迭代并推出了GPT-1、GPT-2、GPT-3和,此次发布的就是在GPT-3的基础上通过指令微调后得到的。
2022年初,团队开始用GPT-3构建。据《财富》杂志报道,通过GPT-3训练的过程并不顺利,对话的效果并不理想,因此决定将放到“野外”供大众使用。
结果,2022年年底实现了现象级的传播,这出乎制作团队所料。“这绝对令人惊讶。”首席技术官米拉·穆拉蒂在接受媒体采访时说。用了5年时间在GPT大模型迭代上完成了一场自我革命,在对话的场景中实现爆发。
“通过一种非常简单的对话方式,构造了非常好的应用场景。”360创始人周鸿祎认为,提供的这些应用场景非常贴近大多数人日常的刚需和痛点,所以它才会火起来,能出圈。
出圈是偶然的,但的成功却并非偶然,“在GPT系列模型的基础上,对算法、算力、数据等人工智能关键要素都进行了一定的升级和优化。”中国信通院云计算与大数据研究所人工智能部副主任董晓飞说。
在算法层面,的基础是世界上最强大的LLM(大语言模型)之一——GPT-3,同时引入了基于人类反馈的强化学习方法,提高了对话的质量。“从的表现上来看,它的精确性和整个性能效果确实提高了。”董晓飞说。
同时,AI的训练和使用也需要强大的算力支持。的训练是在微软云上进行的,在全球云计算市场,微软云的市场份额排名第二。高水平、高市场份额,再加上芯片技术的高速发展,这都为的横空出世奠定了坚实的算力基础。
除了算法和算力,AI大模型的进步迭代,需要大量的数据进行训练。2020年发布的GPT-3,其训练参数量已经达到了惊人的1750亿个,“大量的数据被反复‘喂’给。”一位目前在北京大学从事人工智能研究的博士生对记者说。
而且,的训练成本支出巨大。据首席科学官介绍,拥有1750亿个参数的GPT-3单次训练成本达到460万美元。在知乎上,网友在讨论时,也都认为它很“烧钱”。因此,可以说是一个靠大算力、高成本,用大规模的数据“喂”出来的AI模型。
董晓飞指出,虽然国内外企业在算法研发上基本保持同等水平,但国内更注重大模型技术与行业场景的融合,对于数据标注和模型训练等高成本的人力投入更为谨慎。
“我们真正缺乏的是技术积累,包括数据怎么清洗、标注以及模型的结构设计,怎么训练、推理,这个地方很多都需要经验和积累。”网上一篇爆火的《专家深度解读》这样解释。
搜狐创始人张朝阳在一场直播中说:“的产生是量变到质变的过程,积累了很多年,涉及到算力要有多少服务器,知识库、标注等很多问题,若没有这些能力的公司跟风入局,会消耗掉许多资源。”
把握优势,竞逐“生成式AI”浪潮
热潮已经袭来,有技术基础的企业在强势突围,没有技术基础的企业准备发力,尚待进场。而等热潮退去,能否留在场上,还需看清自己的优势和短板。
是AIGC的一种实现。董晓飞认为,在AIGC的大模型建设和应用层面,国内企业在技术基础和创新环境上都存在着相对优势。
首先,国内持续投入大模型研发、技术基础扎实。目前,阿里达摩院的多模态大模型M6参数量已达10万亿,是全球最大的AI预训练模型;华为盘古、百度文心等大模型的参数量都超过了千亿,其中百度文心模型参数量已经达到2600亿,不逊于GPT-3。“国内有关企业、研究机构近几年在大模型方面已经有了技术积淀。”董晓飞说。
其次,国内加快“产业数字化转型”、实现人工智能与实体经济融合等政策为人工智能提供了创新发展环境。近日,国务院国资委印发《关于做好2023年中央企业投资管理进一步扩大有效投资有关事项的通知》,指出要加大对5G、人工智能、数据中心等新基建投入。近年来,我国发布了一系列政策文件,为人工智能核心技术攻关、产品落地应用以及探索发展新模式新路径提供支持。
把握优势的同时,也要看到目前面临的一些挑战。如AI领军人才相对短缺,AI与实体经济的融合程度仍需进一步加深等等。对此,董晓飞建议,要特别关注一些底层技术的发展,如大模型框架、算法等,还要进一步拓展AI的应用场景。同时他也表示,要进一步提升大众对AI的认知,“这对于AI的发展是有好处的。”
但董晓飞也指出,基于大模型的聊天机器人成本投入巨大,“企业前期投入需保持一定的谨慎,且需要看清方向。”
中国新一代人工智能发展战略研究院发布的《中国新一代人工智能科技产业发展报告(2022)》数据显示,中国人工智能企业布局侧重在应用层和技术层。其中,应用层人工智能企业数占比最高,达85.18%;技术层和基础层企业数分别占比12.41%和2.41%。由此可以看出,我国人工智能发展在应用层面有较大优势。
在董晓飞看来,的成功出圈模式为企业提供了大模型、生成式AI、智能对话等技术的商业化应用路径,尤其将助力“生成式AI”通过更多形式实现在更多行业的探索和应用。
“目前来看,国内大模型开发厂商一是布局以大模型为基础的通用对话、生成等能力;二是将其能力整合到搜索引擎、智能客服、智能音箱等产品线中;三是通过能力调用为中小企业满足具体场景落地需求。”董晓飞说。
随着的爆火,随之而来的安全、隐私保护、知识产权等问题也值得关注。“目前国外出现有学生使用写论文作弊的情况。模型使用大量的数据进行训练,也存在使用过程中可能提供他人创作的侵权行为风险。”董晓飞认为,如何防止类产品的滥用对社会产生潜在负面影响亟须得到重视,“更希望我们目前的一些主流企业、科研机构,在生成式AI上发力,能引领新时代的AI发展。”
中青报·中青网见习记者 贾骥业 记者 王林