该人士同时指出,“国内有大量 和GPT3.5 代理,获得了大量 的真实用户问答数据,是优质的训练素材。但,这是违反 协议的行为,虽然 管不了,但这个有点丢人。”
甚至有网友评价道,如果说这种程度的大模型也称得上自主研发的话,那科研的创造性,仿佛是个笑话一般。
对于所有的创业公司而言,不愿错过这波AI领域的机会是一回事,但是否有真的有技术实力承接,则是另一回事。
小冰公司CEO李笛曾在接受《中国企业家》采访时表示,“产出的 Model(大模型)在今天这个时代,还不是创业公司可以玩转的。很多人去计算 Model,主要计算它的GPU。但实际上,GPU这些东西这都是看得见的,看不见的是,如果你这个模型训练出来了,但模型不收敛,你就白训练了,就得推倒重来,这是工程问题,你需要推倒重来很多次。”
如果按李笛的说法,以如今国内这些创业公司的资金水平和技术积累,至少还很难搞得出原创版的大模型。
02 一场资金与技术的持久战
以人工智能训练为例,它不仅需要消耗大量的算力,还需要投入顶级研究人员薪资等人力成本。
毕竟,AI技术研发需要真正有实力的专家。
科技情报分析机构和智谱研究发布的《团队背景研究报告》显示, 在的研发团队中,有27人为本科学历,25人为硕士学历,28人为博士研学历(注:5人信息缺失),其占比分别为33%、30%、37%。
相比之下,的团队似乎有些配置不足,虽然其创始团队也来自海内外AI公司和科技大厂,但核心技术骨干只有几名,既要做大模型和数据训练,又要做商业化布局,这样的团队还远远不够。
按照接受媒体采访时的说法,这家成立于2021年12月的创业公司,仅仅用了一年半的时间,便“自研”出了三个模态的基础大模型,涉及语音、图像、文本不同内容的生成。
而反观,这家成立于2015年12月的公司,其推出也要等到2022年12月,从研发到产品推出,其间整整花了7年时间。
最初,的定位为非营利公司,但创立之初就吸引到10亿美元的种子投资。随后几年,以每年数百万美元的速度消耗着融资。
然而,研发的进展缓慢与资本的逐利相冲突。在董事会发生变动后,公司从非盈利组织转为可公开融资的追求资本回报的科技企业,迅速获得了微软10亿美元的投资计划。
据《纽约时报》报道,自2019年以来,微软对至少投资了30亿美元。今年1月,宣布获得微软“多年期数十亿美元的投资”。据报道称,投资高达100亿美元,包括其他风投公司。
至此,的估值则将达到290亿美元。
可以看到,在强有力的资金支持下,的GPT产品才得以迅速迭代,前两代的开源GPT模型和GPT-3积累了大量数据,在2022年更是进化出了。
从研发到产品面世,的商业化之路需要大量资金投入。据 估算,目前一个月的维护成本在300万美元(一天将近10万美元),考虑到人力成本,费用估计还要加倍。的产品用的是微软的Azure企业云服务器,有投行分析员估算,一年的成本可能从2500万美元到10亿美元。
的研发之路尚且如此艰难,何况一家小小的创业公司呢!
因此,关于的资金来源以及商业化过程,也难免会引发外界质疑。而且,目前也并未对外公开其资金情况以及投资团队。
如此看来,需要对外公开回答的问题还不少。
03技术的厚积薄发
自2022年至今,生成式AI是一个很热门的话题。与之而来的是,今年 瞬间爆火。
对新事物的出现,我们国家的监管上也并非“一棒子打死”,政策上给予了积极的支持。
2月13日,北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》提出,2023年要全面夯实人工智能产业发展底座,支持头部企业打造对标 的大模型,着力构建开源框架和通用大模型的应用生型。
自2月起,百度、阿里、腾讯、京东、字节跳动等大企业纷纷发声,表示自己在大模型领域已经开展了深入研究,且获得了很多成果。
在这波大模型的追赶赛中,百度是最早开始研发预训练模型的企业。从2019 年开始,百度就深耕预训练模型研发,先后发布知识增强文心(ERNIE)系列模型。
文心大模型研发的带头人,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士,是自然语言处理领域权威国际学术组织ACL( for )的首位华人主席、ACL亚太分会创始主席、ACL ,还是IEEE 、CAAI 及国际欧亚科学院院士。
此外,王海峰还兼任中国电子学会、中国中文信息学会、中国工程师联合体副理事长等。目前,王海峰在国内外期刊会议上发表的学术论文有200余篇,获得已授权专利170余项。
在业内看来,推出,需要扎实的AI技术基础,尤其是AI深度学习领域的积累。而百度十多年来,已经累计投入超过1000亿来研究AI技术。
有分析师表示,相关技术,百度在中国乃至全球范围均具有综合优势。处在技术架构的模型层,而百度在芯片、框架、模型、应用四层技术栈均有布局,其文心系列大模型在行业已普遍应用,而能支撑该训练模型的框架,除百度飞桨外,在中国难出其右。
所有的技术型产品,尤其是人工智能领域,其底层技术的研发都需要经历漫长的时间周期。而一些创业公司跟风入局,利用时间差赚一些快钱,或许能有一时风光,但长远来看,终会被市场淘汰。
通用人工智能的研发需要持续的资金与顶级人才投入,就通用人工智能领域而言,受限于算力、数据规格、历史投入、顶尖人才、资金实力等方面的要求。显然,大公司比创业公司更具备优势,比如百度之所以能尽快推出类产品“文心一言”,也是因为百度十年多来累计投入超过1000亿来技术研发。
而创业公司显然更难一些,一方面,它们的前期技术研发沉淀甚少;另一方面,它们也还面临着在应用端根据行业需求调整和优化耗费的高昂成本,且难度颇高。
但创业公司因此就完全没有机会了吗?有,对创业公司而言,他们只要脚踏实地做好相关的一个细分板块,也依然有机会跑出来。
@新媒体制作与运营:林晓
@图文校对与视频后期:李浩珉
@文章开白、投稿合作请联系: