国内外类技术布局及应用场景不完全统计
三方围剿:大厂追赶、大咖下场、政府担忧
谁也没有想到,短短几个月内,AI 就在各行各业掀起了一阵狂风暴雨。
“这两个月GPT大模型风靡全球,远超过去十年 AI 技术与产业的发展热度,也使得过去二十年互联网科技发展被取代。”一位行业人士告诉钛媒体App,她认为这是继2021年“AI 四小龙”(商汤、旷视、云从、依图)集体被美国制裁之后,AI 行业新一轮热潮。
自去年11月发布至今,(Chat Pre- )访问量已飙升至8.89亿次,也是历史上最快达到1亿月活的应用,而且整个热潮已蔓延至微软、谷歌、英伟达等科技大厂,以及学术界、产业界当中。
从独角兽到大厂,从使用者到投资人,从业界到学术界,所有对其感兴趣的人士都在讨论以及 AI 技术带来的影响与未来发展。
不仅如此,还在不断进化。今年3月初,的APl接口开放,允许开发者技术开发;两周后,GPT-4问世,语言交互长足进步,具备针对文宇、图片进行分析、分类创作等功能,使得成为全球使用人数最多的多模态通用大模型产品;十天后,又开放了插件测试,实质上拥有了自己的应用商店。与此同时,Bing必应搜索引擎和套件等微软各类产品均接入GPT-4技术,使微软的 AI 能力领先同行一大步。
最近一场播客节目中,英伟达CEO黄仁勋直言,GPT-4的突破之一是可以同时学习语言和图像内容,就跟人类学东西一样,阅读图文比只看文字更容易理解事物。
如今,GPT大模型的发展速度已经让外界望尘莫及。所以为了防御,谷歌、百度等科技大厂,马斯克等商业大咖,以及各国政府积极开启“围剿”模式。
今年2月7日,谷歌CEO桑达尔·皮查伊( )在官方博客上宣布推出谷歌下一代 AI 对话系统 Bard。随后谷歌展示“多重搜索”功能,并更新多个旗下App,而且砸下超过20亿元投资的竞争对手,后者估值增至近50亿美元。
3月初,Bard对外开启测试,但效果不如外界预期,和的产品体验相比有一定距离。
4月中旬,皮查伊表示,Bard将从基于轻量级LaMDA模型,升级为更大规模的PaLM模型,他表示升级后,Bard在处理常识推理和编程问题等任务时能力更强,升级版Bard很快推出。“随着时间的推移,将出现能力更强大的模型。我在乎的不只是领先,完全掌控AI模型对我们来说非常重要。”
甚至连“黑粉”马斯克也下场参与竞争。
4月14日,华尔街日报援引知情人士称,马斯克计划成立了 AI 初创公司X.AI,与对手竞争。据内华达州备案文件显示,美国X.AI公司于今年3月9日就注册成立,目前马斯克担任董事,马斯克家族办公室主任Jared 担任秘书。
据报道,马斯克还从谷歌的AI部门等开挖LLM专家,目前已成功挖到约六位,其中包括高级工程师Igor 、软件工程师 等。
与此同时,国内互联网科技大厂也集体下场。阿里、华为、腾讯、知乎、商汤、百度、京东、360、昆仑万维等企业纷纷进入大模型竞争中,一把手带队,堪称10年来中国科技圈最卷的一个月。
4月18日,GPT产业联盟正式成立。据悉,该联盟由中国移动通信联合会、中国电信、中国移动、中国联通、中国广电等单位共同发起。
不过从整体水平上,国内类还有很大差距。
王小川却告诉钛媒体App,追上GPT-4或者GPT-5,中国企业不会低于两年,可能需要3年左右的时间。周鸿祎也表示差距在三年左右。
而前(谷歌)科学家、出门问问创始人兼CEO李志飞告诉钛媒体App,中美大模型的差距为16个月。他解释称,2022年1月谷歌发布指令学习大模型FLAN,之后的2022年10月发布,2023年3月GPT-4发布。中国企业目前发布的一批大模型与FLAN水平相近。
如今,大模型已经成为中国 AI 史上的一个重要发展目标。
华西证券研报总结了现有国产大模型两个特征:“一是头部厂商主导,To B为主要模式,赋能原有优势业务;二是均未对公众大面积开放,未有明确的To C入口,实际水平不透明。”
旷视科技联合创始人、CEO印奇对钛媒体App表示,未来12个月将是AI大模型技术发展的关键节点。他指出,未来的一段时间,能不能有一个公司首先把大模型真的做出来,且性能真的是达到GPT-3.5,这是所有事情的起点。国内一方面要用最艰苦朴素、奋斗的状态来攻坚核心 AI 技术,另外中国 AI 公司想活得长,必须要把大模型商业化。
“大模型这波肯定会‘一地鸡毛’,因为技术这件事情还真不是‘大力出奇迹’。我认为五、六个月之后 AI 行业一定会有很多‘泡沫’,”印奇对钛媒体App表示。
同时,AI 正影响着人类工作和生活,风险如何控制似乎成为了重要课题,各国政府开启对GPT的“围剿”。
观韬中茂律师事务所合伙人王渝伟认为,生成式 AI 对于监管行业来说是一个非常新的事物,现在针对算法、技术等立法监管并不能完全覆盖目前出现问题,对于监管来说是很大的考验。难点是如何找到一条既能做好监管,又能不影响行业发展的路径。“在具体执行中,对于 AI,立刻出台一个全面监管显然不现实。”
就目前看,关于生成式AI的法规争议问题主要集中在三个方面:知识产权例如版权、商业秘密保护等问题;涉及数据安全与个人信息保护;涉及数据跨境问题。
微软、亚马逊等国际巨头企业亦对自己的员工发出预警,不要与分享公司的相关敏感信息,因为它们可能会被用于训练未来的语言模型。
4月12日,在解决监管机构的担忧后,意大利当局称将暂停对处理该国用户数据的临时限制令,也将再次在意大利开放。
钛媒体App询问 ,为什么科技大厂、商业大佬、各国政府三方会集体围剿GPT?
它认为主要有三个原因:一是GPT威胁到各大科技公司自身的核心技术和市场份额;二是GPT存在一定的道德和伦理问题,引起公众的关注和质疑;三是企业内部存在利益冲突,导致科技大厂集体围剿GPT。
算力、商业化成挑战
算力资源是这场大模型竞争中的入场券。
“超过千亿级别的大模型,它的训练大概需要1000-2000张A100的卡,没有2000张A100的卡,实验都做不了。硬件成本约5000万美金,加上人力、电力、网络支出,一年需要5000万美金到1亿美金的投入。”昆仑万维集团CEO方汉表示。
工信部最新数据显示,截至2022年6月,中国算力总规模仅次于美国排名全球第二,在全球算力分布中占比26%。近5年,中国算力总规模年均增速超过25%,算力需求不断提升。
事实上,尽管 AI 算力发展不是一个新鲜的话题,但随着的崛起,基于服务器芯片的 AI 算力需求愈加强烈,在外界高需求、高关注、高压力之下,现有的服务器瞬时算力很难支撑高达千亿参数的大模型推理训练,大模型已经遭遇算力瓶颈。
4月初,以“访问需求量过大”为由,暂停了一天付费服务注册,并在亚洲等区域大规模清理批量注册的账号。随后有市场有人猜测,已有GPU(图形处理器)芯片已不够承载目前的用户量,进而质疑的盈利模式是否持久,引发市场关注。
无独有偶。钛媒体App发现,4月17日下午,百度文心一言也出现了访问需求量过大问题,显示“当前使用人数较多,服务可能响应缓慢”。
据央视财经引述一位行业专家称,虽然中国的数据中心已形成较大规模,但智算中心和边缘数据中心的占比仍有待提高。据悉,中国 AI 服务器的市场规模大概400亿至500亿元,今年市场增速将超过30%。
根据英伟达公布的信息,训练一次1750亿参数的GPT-3需要34天、使用1024张A100 GPU芯片,同时,可能至少需要3.24万张A100用于日常推理,显著高于此前训练底层模型时的用量,以此推算,硬件成本达8亿美元以上。
印奇则透露,要做成GPT大模型,至少得要1万张英伟达A100 GPU芯片,硬件投入就需要20亿元,中国目前可用作大模型训练的A100芯片总共只有4万张。
据The 报道,包括亚马逊、微软、 和甲骨文等主要云计算供应商都在限制客户对云服务器的使用,一些客户称租用硬件的等待时间长达数月,核心问题仍是GPU等算力芯片供不应求。尽管像微软这样的厂商已经在其60多个数据中心部署了数十万张GPU芯片,用于 AI 模型的日常推理。
随着GPT-4发布,市场普遍认为需百倍的芯片及其算力支持,英伟达(: NVDA)股价也随即飙升,年初至今大涨86%以上。
不过,受2022年10月美国商务部半导体出口管制新政影响,英伟达A100及H100以上芯片不能出口给中国客户,从而在硬件上对中国大模型发展形成钳制。
钛媒体App了解到,中国目前能采购的A800实测性能比A100低5%-10%,而最新应用GPT-4的英伟达H100新片,比中国特供版H800的性能差距超过60%。但目前国内拥有英伟达A100/A800的厂商只有阿里、腾讯、字节跳动等几家科技巨头,大部分企业对高端GPU并没有直接采购需求,而是用更经济的调用云服务商的云计算能力,或是租用GPU芯片等硬件设备。
印奇认为,中国 AI 大模型发展过程中,“缺芯”将是一大风险。他告诉钛媒体App,AI 芯片制造(Fab)是很大的技术难点。
一位行业人士对钛媒体App表示,由于大模型需要巨大的算力支持,现在百度缺少芯片,其正在为文心一言大量、溢价50%以上采购英伟达A100/A800芯片和服务器卡,“百度现在说有多少就要多少。去年百度采购的英伟达服务器芯片现在才发货,现货溢价很高,因为英伟达也在涨价。”上述人士表示。
据芯片分销平台数据,国内A100芯片现货市场价已经从7万元涨至9万元。另据财新,英伟达A800在国内也已被炒到原价2倍多,且紧俏到脱销。
目前,国内外大模型厂商普遍追加了对英伟达GPU的采购预算,而国内厂商未来一年算力需求主要还是在训练,对GPU的需求更高。
不过,国产 AI 芯片算力是否成为大模型“卡脖子”因素还存疑。王小川告诉钛媒体App,中国可以购买的英伟达A800芯片,性能差距不大,目前不会成为“卡脖子”的瓶颈,尤其他对未来国产芯片技术突破有信心。
但清华大学计算机科学与技术系教授唐杰却指出,随着大模型训练参数不断扩大,国内大模型厂商在底层算力的差距将进一步放大。“英伟达H100也逐渐量产了,它训练千亿参数非常快。如果我们未来的芯片不能快速发展,差距会越来越大,目前也没有任何机会跟他们缩短距离。”
一位行业人士向钛媒体App直言,目前国产GPU类型芯片无法取代英伟达A100/H100,国内 AI 芯片很难跑动大模型。
商汤科技联合创始人杨帆今年2月的一次演讲中提到,国产 AI 芯片在产业落地中会遇到两大挑战:一是 AI 芯片与框架耦合性差,适配工作量巨大;二是链路长,国产芯片对 AI 场景的理解能力不强。他提及,训练大模型常遇到“梯度爆炸”或者硬件故障造成机器过载迭机,整个系统都会跟着受到影响,以前迭机频率是10分钟一次。
今年3月业内消息称,英伟达已经向台积电增加A100/H100和A800 GPU芯片生产订单,但其生产交付周期大约为两到三个月。这意味着,企业当下预定英伟达芯片,预计今年下半年或明年才能到货,但届时国内外大模型产品早已遍地开花。
除了算力之外,商业化变现也是GPT大模型发展的另一挑战。
消费端方面,今年2月2日,公司宣布推出付费试点订阅计划 Plus,定价每月20美元。付费版功能包括高峰时段免排队、快速响应以及优先获得新功能和改进等,同时该公司仍将提供对的免费访问权限。据媒体测算,基于1亿用户、每月20美元计算,年收入将超过200亿美元。
同时,企业端方面,技术与微软业务融合不断加深,微软正借助GPT技术加持,在搜索广告、云服务模式等领域实现商业化落地。不仅如此,消费端可以明显感受到,当前微软Bing已经集成GPT-4, 和电子邮件已经集成了由GPT-4驱动的,可以大幅提升办公效率,吸引更多微软付费用户。
多家券商研报认为,随着GPT-4、文心一言等大模型逐渐优化和完善,搜索引擎、智能客服、内容创作(小说、广告文案等)等相关应用有望率先商业化,尤其在媒体、广告营销、文学、教育、金融、智能汽车等领域均有望迎来变革。目前,、返利科技等多家电商相关企业开始接入,称希望提升运营效率。
创新工场董事长兼CEO李开复表示,以为首的AI 2.0将在电商/广告、影视/娱乐、搜索引擎、元宇宙/游戏、金融、医疗六大领域加速 AI 的商业化潜能,进入提升生产力的应用井喷期,并提高社会生产力。他引述报告称,预计到2032年,AIGC 全球市场规模将超过2000亿美元。
不过,晨星亚洲高级分析师王凯却表示,目前讨论中国企业能否从类产品中获得多少收入或利润还为时过早,大家仍在探索应用场景,仍需要弄清楚国内类产品将如何商业化。
IDC中国研究总监卢言霞则指出,仅仅依靠大语言模型不会为任何公司提供持续的优势,类似 的技术目前对市场的影响也有限,而从长远来看,许多相关的 AI 模型甚至可能变得无关紧要。很多科技巨头花费大量资金最终可能却无法获得成功回报。
“要做出AI大模型,在硬件工程、算法和数据三方面,都需要专业经验的沉淀和积累,拿到资金和硬件等资源,只是拿到了张入场券而已。”杨帆表示,产业对 AI 的理解不足是重要问题之一。
王小川告诉钛媒体App,他认为最终科技大厂会一人推出一个模型,本轮参与的创业公司里面可能最终只有不到5个大模型会拿到“通行船票”。
人人造大模型但 AI 不能取代人类
4月12日,微软宣布开源 Chat,帮助用户轻松训练类等大语言模型,用户通过 Chat提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类大语言模型。
例如,一个130亿参数的类模型,只需1.25小时就能完成训练。
这意味着,这类开源大模型商业化,正使得每个人、每家企业都能拥有自己的。人人造大模型的时代正加速到来。
周鸿祎向钛媒体App进一步解释,现在GPT技术已经开源而且扩散,这个不存在重复开发问题。“就像你可以用公有云的服务,但很多公司也会用私有云、自己的私有数据库,因此每家企业都可以训练一个私有的GPT只给企业自己或客户。从保密和专属需求来说,看企业根据自己的需要设置公用模式或专用模式。”
不过,这种人人造大模型是否存在实际商业化应用需求,技术风险是否存在,目前仍未知。
实际上,不仅让 AI 迎来“ 时刻”,而且还打开了一个 AI 算法的“潘多拉魔盒”。
可以遇见,未来借由通用人工智能(AGI)等新技术,教育、科技、内容生产等几乎全社会各行业都面临着生产力和生产关系的重塑。
高盛公布的一份报告预计,全球未来平均18%的工作岗位或可由生成式AI自动化完成,约有3亿个全职岗位将受影响。由于生成式AI目前还无法进行体力劳动,受影响的主要是白领工作,且对发达国家的影响将比发展中国家更大。
因此,马斯克等千余名业界、学界人士3月29日联署发表公开信质问:是否该让 AI 替换人类的工作?是否应该发展非人类思维,让它们最终在数量和智力上超越、淘汰井取代人类?
“虽然 AI 很多能力不断在发展,甚至它的一些能力已经等同于甚至超过人的能力,但是 AI 也永远不会跟人的智能完全划等号。AI 运行还是在人类设计的这些算法,以及教它学的这些数据的基础上,完成他的一些智能的这种理解生成动作等。它并不具备控制人类的能力。”百度CTO王海峰在4月16日一场演讲中表示,他认为 AI 不会产生像人一样的意识行为。
商汤联合创始人、CEO徐立则表示,“AI是生产‘生产力工具’的工具,它将开启软件开发新范式,把我们带入‘新二八定律’的时代,80%的工作由机器完成,20%的工作由人来做。”
更多 AI 行业人士普遍认为,AI 依然是一个辅助工具。
不过,马斯克却认为,人类文明未来面临的最大风险之一是 AI。他认为AI 发展不受限制会带来危险,“人工智能比核弹头危险得多。”
实际上,过去70多年间,全球 AI 技术发展迅猛,尽管此前数据量不够、算法不强、商业化不如预期,但如今,在催化下,全球 AI 行业迎来新一波狂潮。这一次,AI 算法、算力、数据“三驾马车”同步突破,AI 技术已经蓄能完毕,所有人终于可以大展身手。
在 AI 逐渐平民化的今天,商界大佬、科技巨头以及各国政府都开始围剿,建构自己的“护城河”。
随着市场从火热转回冷静,重新回归商业化本质,这场 AI 大模型战争似乎仍会持续下去。
(本文首发钛媒体App)
热点视频推荐
近日网易就暴雪娱乐有限公司违反系列许可协议在上海提起诉讼,要求退还3亿欠款,款项包括网易已全额支付的《魔兽世界》等停服游戏相关退款等。去年11月17日晚,网易公司CEO丁磊在公司财报电话会议中表示,对于一些涉及到可持续运营、和中国市场及玩家核心利益的关键性合作条款,动视暴雪的要求是不可接受的。