2023年无疑会是AIGC掀起浪潮的一年,自从微软投资的 研究室发布了神仙级别的自然语言生成式AI——之后,人工智能领域也算是被彻底“杀疯了”。
有人说,它诞生的意义不亚于 等AI绘画生成模型的出现,也有人称它相当于AI界的“”。
虽然GPT模型目前是4.0的阶段,但是它通过了迄今为止没有任何AI能够通过的图灵测试,且跟目前市面上的任何一个AI对话机器人相比,都能够完胜。
面对如此火热且实力派的AI,各个企业自然是看到了商机,并且都迫不及待想要将AI大模型、类产品及其应用,投入到实用的场景当中。
从微软的新版Bing&Edge、“ 365 X”,到谷歌的“Bard”和Meta的“LLaMA”,国外市场已是竞况激烈。
转向国内,诸多企业也纷纷想抓住这一风口,跟紧这一技术,做出相应的行动。
一、国内互联网巨头“类GPT模型”布局
01
百度的“文言一心”
“All in AI”是百度近几年的主题和重心。
百度2023年一季度OKR内容显示,其关键任务为“引领搜索体验的代际变革”。
而随着的出现,百度更是国内第一个做出了动作,宣布了项目,名字确定为“文心一言”,英文名ERNIE Bot。
百度讨论过两种方案,一种是推出独立入口;另一种是效仿微软Bing接入后的“New Bing”,即与现有的百度搜索入口打通。
最终3月16日,百度正式发布“文心一言”。其相关功能也陆续在百度搜索上线,包括了在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。首批用户可通过邀请码在文心一言官网体验产品,后续将陆续开放给更多用户。
图源:百度文言一心官网
文心一言是国内关注度极高的首款类产品,一经发布便涌入了大量的用户。在发布会现场,李彦宏宣布已有650家机构宣布加入文心一言生态,百度官方数据显示,截至3月17日10点,申请文心一言API调用服务测试的企业已达7.6万家。
为此有人表示,AIGC的黄金十年可能已经开启。
此外,百度上周推出了企业级大模型服务平台“文心千帆”,不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链。未来,文心千帆还会支持第三方的开源大模型。
02
阿里巴巴的“通义千问”
除了百度的积极表态,大厂阿里当然也不会懈怠。
一爆红,阿里达摩院就已迅速地投入到【类】对话机器人的研发工作中。3月份,阿里就在AI模型社区“魔搭”上线了“文本生成视频大模型”,先是开放给了公司内员工测试。
4月7日,阿里版对外开放企业邀测,名为通义千问。
作为一个大语言模型,通义千问的能力主要集中在文本生成上,即像一样的对话机器人。除了对话外,它还能快速生成各种指定类型的文案。
图源:通义千问官网
随着不断内测和飞速迭代,阿里很快就在4月11日的“2023阿里云峰会”上正式推出了阿里大模型,并已形成了模型即服务(MaaS)的架构。
这一架构包括基础大模型/通义大模型、企业专属大模型、魔搭社区、API 服务等。阿里集团CEO张勇表示,阿里所有产品未来将接入大模型全面升级,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。
图片来源于网络
阿里云智能首席技术官周靖人则介绍到,“通义千问”支持多轮对话,文案创作,逻辑推理,多模态理解,多语言支持。并在现场演示了利用“通义千问”提升工作效率的多种场景,例如调用差旅接口去推荐差旅产品;视频会议中能够自动生成会议摘要;作为智能购物助手,会自动推荐品牌、产品等。
接下来阿里预计在4月18日推出行业应用类模型,非常值得期待一波~
03
腾讯的“混元助手”
对于腾讯来说,本身已在AI大模型、机器学习算法以及NLP等领域,有相关技术储备。因此在这场“AI大模型竞赛”中,自然不怕落后。
针对类对话式产品,腾讯聚集了内部重量级人物,成立了以张正友为首的“混元助手()”项目组,专研NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业与领域模型。
最后,团队成功推出了万亿级别中文NLP预训练模型——-NLP-1T,并将该模型落地于腾讯广告、搜索、对话等内部产品,且通过腾讯云服务外部客户。
图片来源于网络
基于模型,腾讯也已经在研发【类】聊天机器人。而且此聊天机器人一经研发,之后将会被集成到QQ、微信,也会通过腾讯云向B端用户服务。
而在广告领域,腾讯研究院发布的《AIGC发展趋势报告2023》指出,其混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低广告视频制作成本。
虽然与谷歌、等巨头相比,腾讯在大语言模型AI的技术研究和应用上仍存在差距。不过,凭借庞大的用户基数、多元化的业务布局以及强大的技术实力,腾讯在大语言模型AI的发展中仍具有其独特的竞争优势。
04
字节跳动的“My AI”
对AI领域的布局,字节的反应速度一直较快。
字节跳动旗下的飞书最近就将推出一款全新的智能AI助手——“My AI”。
My AI 将包括自动汇总会议纪要、创建报告、优化和续写文字内容,My AI 也可以通过对话形式,帮助用户自动创建日程、搜索公司内部知识库等功能。
图源:飞书官方视频号
而关乎大模型,字节跳动方面也已有所布局,并重点在语言与图像两种模态上发力。
据知情人士透露,语言大模型团队由字节搜索部门领导,目前规模在十数人左右;图片大模型团队由产品研发与工程架构部下属的智能创作团队牵头。
另外,有知情人士表示,字节跳动语言大模型的探索方向主要为与搜索、广告等下游业务的结合,而且也表示语言大模型团队预计在今年年中推出大模型。
不少人认为,在头部互联网公司里,最后能在大模型上与百度一较高下的公司,大概率会是字节跳动。
一方面,AI资深从业者透露,字节并不缺GPU。
*英伟达A100显卡在国内停止供应后,训练大模型所需的高性能GPU成了不少公司稀缺的重要资源。
另一方面,对于研发大模型十分关键的工程团队和云服务团队字节跳动均有一定的优势。
不过字节跳动能交出怎样一份大模型答卷,还需要时间验证。
05
京东的“言犀”
同样身为大厂的京东,于是也开始被追问,是否也在做出相关行动(打造【类】产品)。
其副总裁何晓冬表示——“京东一直在和AIGC赛道上推进,但更聚焦2B行业,近期将有进一步突破,包括在这一赛道上推出下一代产品。”
果然,在人工智能大模型技术高峰论坛上,京东就做出了正式的“宣布”,即针对真实产业需求,京东计划在今年发布新一代千亿级产业大模型——“言犀”,「京东版」。
其预训练参数达到了千亿级,品类更是覆盖3000多种,人工审核通过率超过了95%,而且可生成的文字为30亿+。据说,客户服务系统“言犀”目前每天和用户进行1000万次的交互。
图源:腾讯新闻网站
与此同时,京东还公布了“言犀”这一产业大模型的落地应用路线图——“125”计划。该计划包含一个平台、两个领域(零售和金融)、五个应用(内容生成、人机对话、用户意图理解、信息抽取、情感分类)。
可见作为当下最火的人工智能研发方向,产业大模型已经成为了不少科技公司后续发展规划内容之一。
06
华为的“盘古”
华为对于【类】方向布局的消息,也是做出了肯定的回应。
早在2020年9月,华为就开始了大模型的布局,并在2021年4月的华为开发者大会上发布了鹏城盘古大模型——千亿级生成和理解中文自然语言处理大模型。之后便一直处于紧锣密鼓的开发测试阶段。
2021年9月,华为云发布了盘古药物分析大模型;
2022年6月,华为云发布了盘古矿山大模型;
2022年11月,盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型同期亮相。
直到最近,随着掀起AIGC的狂潮,华为又有了新的进展——
图片来源于网络
华为盘古大模型在4月8日的“人工智能大模型技术高峰论坛”,就其进展及应用进行了展示。“盘古系列 AI 大模型”分别为NLP(自然语言处理)大模型、CV 大模型、科学计算大模型(气象大模型)、多模态大模型、语音大模型等多个模型。
但在整个叙述中,可以看出盘古大模型不同于“文心一言”等语言大模型,它在消费端的应用并不特别突出,反倒是B端应用更惹人注目。而且华为对NLP语言大模型的着墨并不很多,倒是更加聚焦于工业端方方面面的应用。
07
360式GPT——“红孩儿”
作为中国搜索引擎的Top2的实力企业,360搜索从2020年开始就一直在包括【类】技术在内的AIGC技术上有持续性的投入,只是相关成果仅作为内部业务自用的生产力工具使用。
从投资规模和技术水平上来说,自然无法企及 4,各项技术指标也只能做到略强于。
但为了追上时代的步伐,360搜索也是在努力跟上最新技术。
不久360搜索就研发出了,基于大模型开发的人工智能产品矩阵,并宣布将面向企业用户开放内测。
3月29日,在数字安全与发展高峰论坛上,周鸿祎便正式发布了360版“”。
图片来源于网络
从现场演示来看,确实有一定的推理能力,但在回答问题时,仍需要多次提问、提醒,才能回答出令人较为满意的答案。因此在直播现场被网友调侃为“红孩儿”。
另外,创始人还表示360搜索很快便会推出智能办公产品,并加上类 的能力,不禁让人联想到了那个“365天,天天”微软公司的做法。
不过,在国内市场浏览器领域,360搜索也算是成功地完成了搜索场景的率先落地。
08
网易的“子曰”
为了跟上国产化浪潮,近期网易有道也声称,将率先在国内推出自研教育场景的【类】模型,模型名字已确定为“子曰”。
据悉,基于“子曰”研发的AI口语老师和中文作文批改DEMO已完成,这也将是国内企业推出的首个教育场景下“类”模型。
此前,网易有道已通过建立“内容+硬件+AI”生态闭环,打通了产业链条,便于其较快实现商业化落地。
一方面,有道覆盖了从少儿到成人全学段的终身学习课程,沉淀了海量的教学内容和用户数据,为模型研发提供了必不可少的基础设施。
图源:网易有道官网
另一方面,有道具备有道词典笔、AI学习机等爆款硬件产品,目前其智能硬件业务已成为公司的强势增长点,为AI技术在端侧落地提供了重要的依托。
此外,网易旗下网易伏羲也是值得期待一波。
网易伏羲成立于2017年,是网易公司内专门从事游戏和娱乐人工智能研究和应用的部门,研究方向包括强化学习、图像动画、自然语言、虚拟人、用户画像、大数据平台、云计算平台、云游戏等领域。
随着技术的不断成熟和应用,网易伏羲也开始重视这项技术的潜力。在内部,设计师们对技术进行了深入的研究和探索,并尝试将这项技术应用到了伏羲部门的多个业务的设计工作中。
在学习和掌握好利用这项应用技术后,设计师们可以更加高效地进行用户需求分析和交互设计,更能够提高工作效率和质量。
二、其他AI技术布局的“佼佼者”
01
科大讯飞的“1+N认知智能大模型”
作为AI龙头企业的科大讯飞,在这次角逐中也没有缺席,并宣布将在5月6日发布科大讯飞“1+N认知智能大模型”以及生成式预训练大模型的产品级应用。
其中,“1”代表着通用认知智能大模型算法研发及高效训练底座平台,“N”则是应用于多个行业领域的专用大模型版本,同时“N”个场景的示范性应用产品也将随之呈现。
而科大讯飞AI学习机、讯飞听见等产品将搭载技术,成为率先落地的产品。
图源:科大讯飞官网
科大讯飞之所以有十足的底气说出确切的产品线、明确的时间点,也是和其多年在算法、数据和计算资源三大方面的积累分不开的。
算法领域,科大讯飞拥有成绩显著的NLP技术和预训练语言模型的研发经验;
数据方面,科大讯飞更是在教育、医疗等领域有规模化的专业数据积累,并且有在讯飞输入法、讯飞开放平台、消费办公类产品带来的大量数据;
计算资源上,作为数十年的AI玩家,科大讯飞自然也积累了不少算力和资金。
虽然最后科大讯飞新产品的效果和功能还无从得知,但可以预见一条智能教育硬件新路线终将被打开。
02
商汤科技的“商量”
4月10日,有“AI 行业的领头羊”之称的商汤科技,推出了国内首个大模型体系——“日日新”大模型体系,并发布首个自研中文语言大模型应用平台——“商量”。
“商量”的特色在于,其参数量达到了千亿级别,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。
商汤的发布还不同于此前国产类玩家,它一口气还发布了其余的生成式AI模型及应用:
图片来源于网络
商汤版的GPT大模型产品将在医疗、短视频、教育、营销以及开发等产业领域应用落地。
此外,商汤“日日新”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,而且商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。
相对于其他大模型产品,商汤科技联合创始人王晓刚表示,商汤版的GPT主要面向企业端(B2B)业务。在国内来说,商汤成功站在了致力于To B(企业端)业务的第一梯队。
03
昆仑万维的“天工”
昆仑万维也一直对AGI保持着热情和信仰,其研发团队也早在2020年起从一亿级模型做到十亿级模型,再到百亿级模型……至今已耕耘了三年时光。
最近,昆仑万维终于宣布,由昆仑万维和奇点智源合作自研的国产大语言模型——“天工”3.5即将发布,并于4月17日启动邀请测试。
图源:昆仑万维官网
据说,这将是第一个真正实现智能涌现的GPT类大模型。
而且昆仑万维表示,“天工”大模型已经非常接近的的智能水平。由于是基于GPT3.5大模型,所以昆仑万维把这个版本命名为“天工”3.5。未来,“天工”4和“天工”5也将陆续诞生。
04
脉脉上线“万能的脉友”
脉脉作为一款求职、职业社区软件,在大火以后,它的第一动作就是迅速准备接入AI强大的问答能力,并且上线了类功能的问答机器人——“万能的脉友”。
图片来源于网络
该机器人能够在社区提问中做出实时的答复,但该功能是否能够真的帮助人们求职以及获取职场知识仍然有待验证。
脉脉创始人兼CEO林凡称,的功能一定会替代现有的某些工作内容,人类慢慢地会在整个机器和人工智能发展过程中,往最擅长的领域发展和优化,把体力的、生活质量比较差一点的工作内容交给电脑和机器来做,这是我们看到的一个大的方向和趋势。
05
天娱数科的虚拟数字人
天娱数科推出的“-元享智能云平台”纳入AIGC功能模块。其旗下的虚拟数字人“天妤”和“颜之初”更是接入了等模型。
图片来源于网络
目前天娱科技正在申请GPT-4的正式接入,主要用于持续优化内容生产效率与创意,加速数实融合与产业升级。
据悉,虚拟人“天妤”和“颜之初”将携手百度旗下集度汽车开启探月之旅,同时,公司也是百度文心一言首批先行体验官。
06
跨境通:公司已接入
据3月30日消息,跨境通在互动平台表示,公司已经接入。
同时,该公司还表示,在商品详情撰写,关键词提取,智能客服,小语种翻译等领域有大量应用场景。
同时公司还积极探索用 等图像生成模型,在AI模特图生成和服装图案生成等领域的应用。
07
搜狗的“百川智能”
搜狗创始人王小川也已入局大模型创业,和前搜狗COO茹立云联合创立人工智能公司,名为“百川智能”,旨在打造中国版的基础大模型及颠覆性上层应用。
王小川在公开信中表示,新公司目前已初步组建了50人的团队,获5000万美元启动资金,争取年内发布国内最好的大模型和颠覆性的产品。
而在最近的访谈当中也可得知,搜狗将于年底做出对标GPT 3.5的大模型。
据不完全统计,除了上述公司,新东方、抖音、快手、小米、水滴、万兴科技、等皆已宣布,已经或者即将涉足 相关业务。
写在最后
AI技术的出场显然是高调的,不少人纷纷都夸大它的惊人表现,更有甚者,不停地在给外界输出带给人焦虑和压力的信号。
但是事实上,算不上什么领先技术,大公司差不多都是同时期开始研究的语言大模型。它只是抓准了时机,“先发制人”。
加之对比以前市面上一些被调侃为“人工智障”的机器人,明显要智慧和人性化得多,因此它的出圈也就是顺理成章的事。
而对于国内这波群雄逐鹿的技术布局战役,虽然抢人眼球,但是最终考验的还是各个企业的实力问题。
要知道,达到GPT4的水平,国内的硬件资源、对AI的训练以及数据语料库显然是不够的,更别说产业技术壁垒等问题了。
但是IT熊局还是想拭目以待,希望国内企业能实现真正的技术革命。