GPT训练的RLHF数据与其他阶 段的简单标注数据不同,需要非常 专业的问题、指令以及符合人类逻 辑与表达的高质量的答案。 据称 内部招了几十名 PhDs 来做该数据的标注以及质量 检测,Scale 作为 标注供应商,也招聘了几十名 PhDs提供此类服务。
4)高质量垂类数据决定壁垒
在大模型架构基本稳定之后, 模型竞争的核心差异点在于训练数据的独特性。在垂直场景、业务的数据质量决定了模型在该领域的表现,如:凭借3630亿 个标签的金融领域数据集 在该领域任务中表现远超其他模型。
4、生态
GPT产品在先发构筑用户心智与使用习惯方面具有竞争优势。网站在2023年2月的用户访问量超过10亿次,独立访客数超过1.5亿。随着产品功能的不断完善,AIGC模型本身有望成为超级流量入口,与用户在各种场景直接交互。此外,数据是大模型关键要素。通过先发构筑生态,GPT获得更多的场景与用户数据训练,使其产品力领先于其他模型。同时,大量互联网与软件应用积极与GPT融合,一旦生态构筑,面临迁移成本,一定程度上类似操作系统的生态。
AIGC国内大厂的应用
由于国内大模型尚未完全成熟,大部分企业产品处于研发或准备应对AIGC模型带来的影响阶段,但随着后续大模型持续落地与完善,预计将给相关产业带来新的机遇与挑战。在海外已嫁接大模型的应用案例中,企业具备原有产品使用场景不会被AI替代、有独特垂直的高质量数据以及用户粘性和深度等禀赋更有利于把握AI机遇。国内头部互联网企业腾讯、阿里巴巴、百度、华为、字节跳动除了在AI与大模型领域有积累与积极布局,本身产品场景生态也有望较大受益于AIGC技术带来的巨大效率提升。此外,在垂直细分领域方面,办公、金融、电商、教育等相关企业拥有核心关注场景壁垒和高质量独占数据优势,也有望受益于AIGC技术的发展。
一、腾讯:流量与场景受益大模型能力,有望优化成本与打开商业化空间
腾讯是国内最核心的社交流量汇聚和内容分发平台。AIGC大模型技术能够带来内容成本优化与体验提升,进一步完善平台内的内容生态;同时,在to B领域也有望提供更多的增值服务并创造更多需求。
1、用户流量
微信月活超13亿,QQ月活5.7亿,用户高粘性且熟人社交场景基本不受AIGC技术冲击,因此未来这两大平台的核心流量池和内容分发平台地位将保持稳固。
2、场景与数据
1)游戏与影视文娱等
腾讯作为国内最大的游戏、影视文娱生产商与分发平台,拥有全维度内容服务,包括腾讯游戏、视频号、长视频、网文、公众号、音乐、直播等。其独占大量内容数据,2022年游戏收入超过1700亿元,视频号MAU超过8亿(截至2022年6月),微信搜一搜MAU也超过8亿。这庞大的内容生态和成本投入有望在AIGC技术带来的效率提升和体验优化方面获得大幅改善。
2)企业服务
除了C端内容,腾讯还提供腾讯云、企业微信、腾讯会议等企业服务。但现阶段整体尚未实现盈利。借鉴微软办公和云产品受益于GPT技术的提升,AIGC技术赋能下有望提高相关产品的效率价值,并提升其商业化水平。
3)广告营销
2022年腾讯广告收入超过800亿元,主要与社交内容相关。AI技术有望持续提升内容效率和产品创新,从而提升广告的效率和体验。
3、AI工程能力
腾讯在技术和人才方面储备充分,截止2022年底研发人员规模约8万人,占比74%。公司积极布局混元大模型,在AI技术研发和应用落地方面同步推进。这些努力有望持续提升运营效率、产品创新以及增值服务。
4、算力基础
随着算力的发展,模型容量持续提升,模型通用性和泛化能力也更强。近两年来,国内外头部科技公司均有布局,发布了若干千亿规模以上的大模型。腾讯作为一家拥有强大底层算力和低成本高速网络基础设施的企业,在混元AI大模型方面取得了重要进展。腾讯推出了-NLP 1T大模型,并在国内最权威的自然语言理解任务榜单CLUE上一度登顶。该模型是业界首个可在工业界海量业务场景直接落地应用的万亿NLP大模型。腾讯混元AI大模型协同了预训练研发力量,旨在打造业界领先的AI预训练大模型和解决方案。现在,腾讯混元AI大模型完整覆盖NLP大模型、CV大模型、多模态大模型、文生图大模型及众多行业/领域任务模型。
二、阿里巴巴:技术积累深厚,AI有望赋能电商内容及打开市场空间
阿里巴巴是国内主要的电商平台,同时在云计算、企业服务相关业务方面具有出色竞争力。该公司长期投入 AI 领域,并已经开展通用大型模型的公测。目前,在应用端方面还处于探索阶段。AIGC 技术有望通过内容成本优化和产品创新来提升电商和 to B 领域商业价值,从而提高业务效率。
1、用户流量
淘宝是一家垂直电商领域的公司,其年活跃用户数接近9亿,GMV约达8万亿元。由于在电商生态、数据处理和复杂场景流程方面具有深厚的积累,因此其业务基本盘不能简单地用大型模型代替。
2、场景与数据
1)电商
淘宝等电商平台需要大量的文本和图片内容来支持其业务需求,这些场景包括电商图片和文案、短视频、直播带货以及智能客服营销。AI 技术有望通过降低电商生态中的内容成本、优化用户体验以及提升电商平台的内容水平,从而为电商行业带来更多的发展机遇。
2)广告营销
AI技术有望提高电商搜索的效率和用户体验,特别是对于以消费者为中心的阿里妈妈等产品,AI技术可以帮助他们进行更有效的营销、更深入的消费者数据洞察,并且生成相关的图文视频内容,从而提高营销转化率。
3)企业服务
阿里巴巴提供了阿里云、钉钉等企业服务,AI技术的应用有望提高这些产品的效率和商业化水平,从而刺激更多的AI云需求。
4)AioT
在AI技术的赋能下,智能终端产品如天猫精灵等有望获得大幅提升的用户体验。
3、AI工程能力
阿里巴巴在技术储备和人才方面充分准备,到2022年底总员工数超过20万人,其中技术人员占比超过一半,总部人员超过10万人。阿里的达摩院在技术领域积累了深厚的实力,通用大型模型即将发布,同时AI技术研发与应用落地同步推进,这些努力有望持续提高运营效率、产品创新以及增值服务的质量。
4、算力基础
阿里巴巴大模型研发的算力基础包括基于GPU的深度学习计算平台和基于云计算的分布式训练平台。
GPU的深度学习计算平台可以有效地加速深度学习算法的训练过程。阿里巴巴在研发中使用了多种GPU计算平台,包括 Tesla P100和V100等。
基于云计算的分布式训练平台可以实现多台计算机协同训练大规模模型,使得训练速度大幅提升。阿里巴巴基于自主研发的分布式计算框架,采用了多种优化策略,包括参数服务器、梯度压缩和通信优化等,以提高分布式训练的效率和可扩展性。同时,阿里巴巴还在云计算平台上提供了云端GPU计算服务,为开发者提供了快速高效的大规模模型训练能力。
三、百度:大模型产品先发,核心搜索业务机遇与挑战并存
百度是中国重要的搜索引擎门户,其拥有大量中文互联网信息数据池和技术积累。百度在AI和云计算领域持续投资,并已经先行发布了文心一言模型,此举有望提升搜索产品体验,同时也为基于大型模型的产品拓展更多客户打下了基础。然而,在搜索和大型模型场景之间存在一定的替代性,因此对于百度应用落地角度来说,既有机遇也存在挑战。
1、用户流量
截至2022年底,百度搜索的月活跃用户超过6亿,近年来用户规模整体稳定,而在线营销收入也超过了700亿元。然而,在中国互联网流量被分割的情况下,淘宝搜索、微信搜一搜、抖音搜索、搜狗、360等在不同场景和市场中共享不同份额,因此搜索引擎的体验和性能仍然是关键的竞争因素。
2、场景与数据
总体来说,百度在深耕国内搜索领域方面表现出色,其中文互联网信息图文数据语料积累领先。然而,从场景角度来看,考虑大型模型回答问题能力与传统搜索存在一定的功能重合,虽然提升了用户效率,但可能会减少用户对网页的浏览,降低广告位曝光。目前,new bing和谷歌已经推出了搜索+大型模型,但百度尚未将大型模型正式融入到搜索产品中,因此其对搜索引擎竞争力的正面影响以及对商业化潜在的负面影响有待跟踪评估。在业务拓展方面,百度文心产品已经提供了API服务,截至3月18日,该公司称申请企业客户超过9万,合作咨询超过6000条。百度智能家居业务也有望受益于大型模型技术。
3、AI工程能力
百度在AI领域拥有长期的技术积累和人才储备,在推荐引擎、深度学习、智能驾驶、全屋智能等领域都有相应的布局。截至2022年底,百度总员工数超过4万人,其中有2.4万名员工从事技术研发工作。通过率先推出文心一言大型模型产品,百度展现了其在AI领域的技术积累和能力。
四、华为盘古大模型研究:盘古开天,AI落地
目前,盘古大型模型在100多个行业场景中完成了验证,包括能源、零售、金融、工业、医疗、环境、物流等领域。该模型涉及千亿参数、40TB训练数据,对算法、算力、海量数据处理和并行优化提出了很大挑战。为了解决这些问题,华为云算法团队和循环智能( AI)的NLP团队合作攻关,突破了大型模型微调的难题。鹏城实验室的鹏城云脑II是国内最大规模的AI训练集群,在盘古大型模型的训练中提供了强大的AI算力和数据吞吐能力,为其打下坚实的基础。此外,华为底层软件、训练框架和平台协同优化,充分释放算力,达到了全栈性能最优状态。
具体来看,盘古大型模型利用华为CANN采用了算子量化、算子融合优化等技术,针对底层算子性能进行了优化,每个单算子的性能都提升了30%以上。华为采用了“流水线并行、模型并行和数据并行”的多维自动混合并行技术,大幅降低了手动编码的工作量,并提升集群线性度20%。华为云平台提供E级算力调度,同时结合物理网络拓扑,提供动态路由规划能力,为大型模型训练提供了最优的网络通信能力。借助平台高效处理海量数据的能力,盘古大型模型仅用7天就完成了40TB文本数据的处理。一站式AI开发平台为盘古大型模型的训练和推理提供计算优化、通信优化、存储优化以及算法优化,是其重要的基础平台资源。
1、泛化能力极强、适用大量复杂行业场景
盘古大型模型具备极强的泛化能力,一个模型适用于大量复杂行业场景。在to B以及to C场景下,盘古大型模型具有良好的泛用性,大规模参数的模型可以更深层挖掘数据背后的逻辑,达到更高的泛化性能,对不同场景的鲁棒性更强。同时,盘古大型模型吸收了海量数据知识,学习了40TB的中文文本数据,包含30亿+参数的CV大型模型通过行业数据的小样本调优,提高了模型在场景中的应用性能和泛化能力,减少对领域数据标注的依赖。
此外,基于产业场景中存在大量的内容理解需求,盘古大型模型采用兼顾架构,在预训练阶段沉淀了大量的通用知识,能够同时完成理解与生成任务,使得大型模型有能力支持行业知识库和数据库的嵌入,对接行业经验。随着盘古大型模型的开放,各行各业的开发者不必再“从零开始”,只需在云上找到所需要的模型,助力各行各业加速智能化转型。大型模型在实际场景中的应用不仅可以帮助用户提高训练进度并且缩短训练时间,随着模型上应用数量不断增多,用户成本亦会有所降低。
2、工业化 AI 开发模式赋能千行百业
盘古大型模型是一种工业化AI开发的新模式,相对于传统的“作坊模式”AI开发过程,可以解决小模型的定制化难题,使一个模型应用到多个场景中。盘古大模型AI开发门槛较低,能够提供自动化工作流,减少对AI开发工程师的专业依赖,同时可以根据更新数据快速进行模型迭代,做到“边用边学”。盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求,融合行业知识的微调,快速适配各种下游任务,在100余项实际任务中得到验证,节约90%以上的研发成本。此外,盘古CV大模型在预训练阶段主要集中在数据处理、架构设计和模型优化三个阶段进行优化,在 1%、10%数据集上的小样本分类精度上均达到目前业界最高水平。
AIGC在游戏行业的应用
是一款功能全面的机器人,不仅限于对话,其本质是通过对话完成各种任务。GPT机器人具有强大的语言处理能力、缜密的逻辑推理、完善的认知体系和丰富的接口生态。由于其在快速信息获取、教人类学习、生成有价值的内容、流畅的对话以及协助人类进行生产操作等方面的优势,已经得到了广泛的应用。已经被应用于各种领域,例如办公、金融、电商、设计、社交、游戏等,成为为人类提供帮助的重要工具之一。本节内容将具体从AIGC在游戏行业的应用为大家展开详细的介绍。
一、全球游戏市场规模不断扩大
根据的数据,全球游戏市场规模在2016年的1011亿美元基础上持续增长,到2021年时已经达到1927亿美元,五年间增长接近一倍,预计2022年将达到1968亿美元,2025年将增长至2257亿美元。随着游戏玩家数量不断增长,预计2022年将达到32亿人,占全球总人口的40%。目前,全球游戏玩家数量约为30.6亿人,占全球总人口的比例为38.25%。预计到2025年,全球游戏玩家数量将增长至35.3亿人,年复合增长率为4.2%。
二、游戏制作
游戏行业的竞争主要集中在制作环节和营销环节,而优秀的游戏制作是游戏营销的基础。然而,传统游戏制作中存在“质量、速度、成本”三个因素之间的矛盾。要在保证游戏质量的前提下,制作一款游戏只有两条路径可选:一是大量开发人员同时制作一款游戏,但大规模团队管理、开发效率较低,开发成本势必提高;二是精简团队成员,制作周期长达数年甚至十数年。
通常情况下,优质的3A大作的开发时间成本和资金成本都非常高。以销量超过4600万份的《荒野大镖客:救赎2》为例,该游戏拥有超过28平方英里大小接近真实景象的地图和1000个NPC。即使拥有专职开发人员超过1200人的团队,也用了8年的时间才完成,成本逼近3亿美元。另外,《星际公民》的专职开发人员数量少于《荒野大镖客:救赎2》,但该游戏已开发了10年,并仍处于Alpha版本测试阶段,预计仍需要较长时间才能完整上线。
游戏制作流程复杂,设计开发环节最为关键。游戏的制作一般包括“产品立项-目标规划-设计开发-发布运营”四 个环节,制作周期一般以年为单位,制作流程的复杂程度和时间成本远超娱乐媒体领域的其他内容。在游戏的制 作流程中,设计开发环节决定了规划的落地程度,极大程度上影响游戏质量以及玩家体验,是最为关键的一环。
游戏是娱乐及媒体行业中最复杂的形式,构成要素包含娱乐媒体领域内容的所有形式。游戏包含文本、图像、 音效、音乐、3D模型、动画、电影、代码等多种类型的资源,涵盖了娱乐及媒体行业所有的内容形式。
三、AIGC对游戏制作的影响
游戏是需要实时交互的最高形式,因此也是最综合复杂的娱乐形式。游戏制作的要素复杂,制作门槛极高,也决定了生成式人工智能对游戏制作的影响是其他娱乐及媒体领域的合力,也是最有可能发挥巨大作用的产业。
AIGC主要通过对已有文本进行续写、语音合成、生成主题音乐、图像生成、三维建模以及代码生成等功能来提高制作效率,做到游戏策划、音频、美术和程序等环节的高效生成,同时降低游戏制作成本。以二维游戏原画为例,传统的原画师需要花费数周时间来根据策划内容完成设计稿,而使用AIGC只需要输入关键词便能得到大量的设计初稿,后续进行筛选和修改即可,时间降低到几个小时。因此,AIGC的应用将打破游戏制作的不可能三角。
游戏开发的专业技术和经验门槛很高,要求资金投入和传统AI算法积累,因为游戏综合复杂程度非常高。比如字节跳动,虽然在推荐算法、用户数据积累、资金和流量渠道等方面优势突出,但是在游戏领域却未能复制其在抖音和今日头条等领域的成功。虽然该公司组建了大中型游戏研发团队并投入了数百亿资金,但仍未能推出自研S级游戏。主要原因在于公司晚入游戏市场,缺乏游戏制作方面的丰富经验和专业技术人才。尽管公司试图以技术优势建立游戏中台来加速游戏研发,但开发人员对游戏了解不够,导致中台偏向于代码思维,在便利性和使用效果方面不如网易的编辑器。
AIGC制作游戏内容价格低廉且不需要大量的专业技术人才,可以大幅降低游戏制作门槛,使微型游戏制作工作室成为现实。AIGC制作游戏内容具有一次开发调试多次长期复用的特点,而专业生成式模型开发公司可以提供B端产品,将设计人员的创意转化为设计初稿,大幅度降低内容制作的时间和金钱成本,同时减少对专业技术人才的需求。例如,由5人组成的工作室开发的《Among Us》在Steam上销售超过2000万份,全球玩家数量约为5亿。随着AIGC的不断发展,微型游戏制作工作室的数量和可开发的游戏规模将不断上升。
游戏的创新表现在多个方面,主要受到创意和产能两个因素的限制。策划是游戏的起点,美术设计是到游戏形 象、画面的关键,游戏创新依赖于策划、美术人员的创意,而从创意到成品要经过漫长的开发过程,产能也是限 制游戏创新的关键一环。
AIGC提高生产力突破产能限制实现游戏创新:
1、AI生成3D模型助力飞行模拟器实现3D高清全球地图:微软的飞行模拟器计划开始于1976年,一直在向着高 清、3D、全球地图努力,最新版本通过与.ai合作,使用AI从2D卫星图像生成3D模型,构建了超 过15亿的3D建筑模型,突破了产能的限制,飞行区域包括整个地球、超过24000个机场,且主要地标和热 门城市的地景越来越丰富。
2、AI赋能NPC打造原神高品质开放世界:开放世界游戏在上世纪80年代便出现,原神开发中使用AI赋予了每 个NPC不同的个性及特殊能力,打造了更为完备的高品质开放世界,获得成功。
AIGC技术通过转型性创作和组合性创作等方式,突破了个人创意的局限性,拓宽了游戏策划设计的边界。其中,继续性创作指学习已完成要素的特征,进行继续性创作。例如,AI可以续写文案、生成同一风格系列的图片等,这种方法适用于那些已经完成部分设计但是想象力枯竭的情况,能够通过大量继续性创作扩展人的想象力。而组合性创作则是将不同领域、不同维度的原本无关的概念元素进行组合,创造出新的概念元素,从而为游戏的关卡设计、地图设计、玩法设计、原画设计等提供全新的思路。目前,图像生成算法能够根据输入的文字要素生成各种风格的图像以及超出想象的超现实动物、植物、人物形象,为游戏原画设计打开了想象空间。例如,2021年, 和Seth 使用变分自编码器( auto-)将不同的游戏关卡进行组合,创造出新的游戏关卡。
四、蓝海大脑PC 集群(PC Farm)解决方案
PC集群是一种由多台计算机组成的系统,这些计算机通过网络连接在一起,共同完成计算任务。PC集群解决方案是指在PC集群上运行的软件和硬件系统,用于管理和优化计算资源,提高计算效率和可靠性。
蓝海大脑PC集群解决方案提供高密度部署的服务器和PC节点,采用4U机架式设计,每个机架可插拔4个PC节点。融合了PC的高主频和高性价比以及服务器的稳定性的设计,实现了远程集中化部署和管理运维。同时,采用模块化可插拔设计,使维护和升级变得更加容易。
同时,还集成了 AI模型,可以轻松地安装和使用,无需进行任何额外的配置或设置。与传统的人工创作方式相比, Al模型可以更快地生成高品质的创作内容。通过集成这个模型,可以使创作者利用人工智能技术来优化创作流程。另外,蓝海大脑PC集群解决方案还具有开箱即用的特点,不仅易于安装和使用,而且能够快速适应各种创作工作流程。这意味着用户可以在短时间内开始创作,并且在整个创作过程中得到更好的体验。