最近一段时间,从AI领域破圈,成了互联网领域的新风口。创业者和投资人也兴奋起来了。
创业的方向已经很明了。做中国版对标的大模型,是显而易见的一条路。目前百度的“文心一言”已经呼之欲出,原美团联合创始人王慧文也宣布携5000万美元进军AI,要打造中国的(的研发公司)。
同时,将这样的大模型平行扩展,从文字信息知识模型扩展到图片、视频等领域,也有同等机会。另外,顺着的方向再往前走一步,又是另一个思路,如今的理解能力强,但准确性和时效性弱,在后者上下功夫,也是不少创业者在做的事。
大模型之外,在各垂直领域的应用可能是适合更多创业者的路径。可以应用到文案、营销、设计、行业研究等文化传媒领域,还有医疗+AI,教育+AI,企业服务中的智能客服、数字人,以及游戏等各行各业中。有从业者提到,每个领域都可以训练适合自己的。
机会有很多,不过最终作为创业投资项目,其可行性还待验证。现在,欠缺严密的逻辑能力,也缺乏一些常识,在很多领域的应用壁垒不高但模型训练成本高,短期之内商业化也有难度。
投资人最近既兴奋又焦虑,市场很热,但蹭热度的占据大多数,真正靠谱的项目不多,他们目前普遍处于高度关注但下手谨慎的状态。毕竟,会颠覆很多领域,但这个蛋糕最终被大厂还是创业公司吃到还是个未知数。
01
大模型、小场景,盯紧
要找到领域的创业投资机会,有必要先弄清楚的特点。
众所周知,是生成式AI,与之对应的是分析式AI。微软投资的人工智能企业从2015年开始研发这个模型,直到2020年,发布了GPT-3语言模型,才引起国内外科技从业者对生成式AI的关注。
如今的,是在-3.5的基础上,模拟人的自然语言,重点做了聊天对话方面的训练而形成的,同时,这一代的具备了创造、生成内容的能力。
英诺天使基金合伙人王晟告诉深燃,他们一年半之前就把AIGC(利用人工智能技术来生成内容)确定为主要投资方向了,也已经投了专注大模型的项目深言科技和做全新应用场景的公司深空交响。
突然爆了,“好处是我们已经投了的项目非常受人关注,最近每天都有好几个投资机构去和他们约见面。不好之处是本来我们在这一波AIGC方面的认知和布局是领先行业的,相对有时间逐步完善布局,现在这一波热度让市场开始变得混乱。”他说。
在王晟看来,国内相关的创业投资机会有两大方向:第一是研发大模型,直接对标,比如做中国版,同时,在这类语言大模型之外还可以扩展到图片、视频等领域;第二就是将垂直应用到各个细分领域。
目前,涉足大模型的国内大厂已有不少。百度的文心一言、华为的盘古模型,字节跳动和达摩院也有自己的模型。这些大部分是语言模型,也有一些多模态的模型,比如达摩院的M6模型,它可以生成文本,也可以生成图像。但国内的模型可能限于某些比较小众的应用,还没有形成非常大规模的市场影响力。
初创企业在该领域也有相当的发展。其中,比较有代表性的国内人工智能企业“智谱AI”近年来一直在做关于千亿模型和万亿模型的研究。他们主导研发了多语言千亿级预训练模型(是深度学习架构,经过训练以执行大量数据上的特定任务)GLM-130B,并打造了认知大模型平台(认知模型是指描述人类认知结构和认知过程的模型).ai,形成了AIGC产品矩阵,提供智能API(应用程序接口)服务。从应用落地层面,智谱AI于2022年推出的AI数字人,在北京冬奥会及卡塔尔世界杯上受到广泛关注。
“大模型需要高水平团队,得是资深从业者,同时有比较强的AI工程化能力,另外我们倾向于看好曾经花过大钱做过大模型的团队。”王晟说。不过他也指出,中国能做语言类大模型的团队非常有限,加上大厂、一些科研机构和创业公司,总体数量可能不超过十个团队,加上图片、音乐、视频、3D资产等领域的大模型,全国能投的标的也就几十个。所以说大模型是一个重点关注的范围,但投资机构和普通创业者能抓住的机会不多。
如何适用细分领域,是更多创业者关心的事情。在这里,我们先解释一下身上的一些特性。跃盟科技创始人兼CEO王冉对深燃分析,评价一个模型好坏要从处理信息的适用性、准确度、时效性三个维度来看。对标的是搜索,可以从这三个维度对比和搜索的差别。
他进一步解释:搜索目前用的主要是关键词搜索,却能很好地识别自然语言,所以在适应性上,能做到满分10分;在信息的准确度上,现在搜索引擎已经做到了前十条结果点击率95%,前三条的结果点击率80%-85%,在准确度上做了妥协,在知识跟推理里用了更模糊的方式,准确率远远不如搜索,能打6分;在时效性上,是0分,它的模型是以年为单位训练的,不适合处理有时效性的信息。
所以是一个强适应性、弱准确度、弱时效性的产品模型,在这样的特点之下,应用场景也就明确了。
“这些特点就决定了不适合从0到1,更适合从1到N,它不能代替用户寻找正确答案,而适合在搜索之后做二次加工处理,比如总结、分类、做表、纠错、写代码,另一类应用是模糊推理下的创造,比如写小说、创意设计。”王冉说。
理论上说,基于大模型,能做各个行业的解决方案,来提升生产力,比如媒体、设计、营销、行业研究、智能客服、影视特效、教育、医疗、游戏等领域。王晟也提到,现在很多广告公司平面设计师的工作很大程度上已经是AI在做,设计师对成果再做优化,另外,如果运用到游戏中,里面的NPC可以真实互动,游戏也会变得更酷。
02
AI、医疗、教育,
谁能借起飞?
具体怎么应用到细分领域,创业者的现身说法最有说服力。
王冉的跃盟科技从2016年就专注AI赛道,目前在做服务直播、新媒体或新的电商形态的AIGC模型。“我们提供一个模型底层技术,能在搜索之上,把直播间的商品按照用户的需求呈现出来,比如用户搜索情人节买点什么,我就把所有直播间在卖的对应商品信息整理出来,用对话或搜索推荐的方式推给用户。”
在这一业务中,王冉重视的是模型的准确性和时效性,因为电商的平台信息、价格信息都要准确,时效上,要做到小时级乃至分钟级。
“现在我们要做的就是准备好迎接大模型的到来。”医疗AI领域创业公司“左手医生”创始人张超说。最近每天找他咨询的同行很多,大家都在讨论怎么用、效果怎么样、怎么投入,他的感受是,让医疗AI领域原来很多不好解决的问题忽然能解决了,AI医生离商业化、大规模使用又近了。
张超整理了对医疗AI的影响,首先,可以用在文档的处理类任务上,比如,抽取类、结构化类任务、摘要类任务,解决医生的文书工作;同时,可以带动一堆监管类任务应用,比如质控、DRG(疾病诊断相关分组);还有一个重要应用是人机沟通类任务,比如智能自诊、预问诊、分导诊、随访等;最后,对全科医生的打造也更有利,比如AI能更好地辅助诊断、做指标解读、开方、做基础患者教育、完成智能问答等。
“AI医生目前需要解决的核心就是语义问题,以前我让AI系统理解10个指令,如果患者的问题不在这10个指令范围之内,系统就不会回答了,因为患者输入的问题可能用的不是标准表达方式,有了,新指令出现的时候它还能很好地处理。”另外,张超还提到,大家一直吐槽AI电话随访是人工智障,有了,系统可能对患者的提问对答如流,也可能从患者语无伦次的回复中整理出有价值的数据。
“原来我们做的是一个70分的产品,这一版优化完升级之后,应该能达到90分。接下来行业里面如果有人发布了大模型,我们会考虑采购,在大模型基础上用我们的数据去升级优化模型。”张超预计再过两三个月就能用起来,就看或国内大厂谁先开放出来,“不过投入也不会少,硬件追加大概得1000-2000万元,预期在这块投入的研发成本一年也得近3000万元。”
教育和契合的场景也很多。
在新东方优编程董事长朱宇看来,在学前阶段,可以做成一个能够帮助孩子探索世界,解答小孩各类问题的陪伴机器人,上升到小学、中学,经过训练的可以像老师一样答疑,比如学生的水平比较低,就调取最低级的概念解释,一步步告诉答案,如果提问者是个水平很高的学生,直接说几个关键步骤就行。再往上一层级,能做到个性化推送学习素材,甚至能编写针对每一个学生的教材。
“现在已经会写小说、写报告了,实际上学生用的教材涉及到的知识点是固定的,比小说和报告的素材更简单,只需要用不同层次的学生听得懂、有兴趣听的方式输出就可以了,比如可以选择更活泼幽默的方式。”朱宇说,这可能是跨时代的意义,几乎能颠覆过去三四千年以来的知识传递方式。
悉之智能创始人兼CEO孙一乔目前看好做语言学习方面的结合,“我最近正好在学英语,以前都是跟外教一对一练习,但外教不太懂中文,有一些词汇我表达不出来,外教也不知道我想说什么,我的合伙人利用现在的加上语音识别与合成功能,结合一个虚拟AI形象,做出了可以与我进行流畅的英语对话的AI老师,大大的提高了我的英语学习效率,降低了学习成本。未来一些以真人为主的英语教学,可能会被替代。”
诸如此类在细分领域的应用机会有很多,需要的是一线从业者敏锐的洞察力。
03
成本高、壁垒低,
应用尚待时机
虽然国内大模型技术的发展呈现百花齐放的态势,但不得不承认我们与国外在基层技术上的差距。
背后是GPT-3.5模型,有从业者提到,国内目前大约在GPT-3甚至比GPT-3还差一些的水平,在这点上,国内处于追赶国外的状态,而且追赶难度还不小。
“新技术的研发道阻且长,其中包含着巨大的挑战,但大模型的中国创新是必经之路。接下来从GPT-3到GPT-3.5到这条路径中的必要工作,我们会持续去做。”智谱AI方面表示。
即便是王慧文这样的互联网大佬要入局,也有很多质疑的声音。有从业者说,“5000万美元够干什么?大模型训练一次就要花500万美元。”
另外,前文提到的很多创业投资机会,还停留在理论层面,要真的实现起来,创业者还将面临不小的阻力。
近年来王晟接触了很多生成式AI相关的项目,有设计衣服和服装面料的,有写文本的,有为电商行业提供营销方案的,还有图片、视频内容生成工具。他不看好其中大部分项目的原因是,没有纵深壁垒,王晟希望应用的领域有一定深度,否则只是做产业中的一个点,很容易被大厂颠覆。“比如,有项目要做AI生成式短视频平台,就相当于有AI辅助功能的抖音,这是抖音、快手之类的大厂升级的机会。”
所以在他看来,AI这一波落地的场景非常多,看上去很热,但投资人非常焦虑,大部分都没有创业和投资的机会,很难出手。
朱宇也提到,在教育领域真正实现还需要时间。首先需要一个专业的教育知识语料库,谁能建立语料库,能不能和结合都是需要考虑的问题;其次,还需要提升的准确度,如果只是作为一个聊天工具,它可以信心满满地“胡说八道”,但要是给学生讲解知识,必须要准确;第三,需要等整体的算力成本降下来,否则它在跟学生对话的时候,成本比真人老师都高。
另外,每个技术的诞生都会存在滥用的问题,现在国外有些学校、科研机构、期刊杂志禁止使用写论文。这也是发展应用路上的问题。
在王冉看来,创业要有差异化的角度,直接套用,业务很容易被覆盖。他认为,不应该过度去追适应性的维度,而要去思考一下准确性加时效性角度,每个赛道都应该做自己的模型,而不是用模型直接套赛道。“代表着适应性极强的一种方式,比如互联网相关的一些领域,不能以年为训练单位,时效性如果能到天、小时的维度,自然有机会。”
孙一乔也持有类似的观点,如果创业者只是基于或.5去做一些应用,风险很大。“比如一些估值很高的NLP领域的文本公司,一出,公司市值可能就要作废了。”
所以在他看来,会产生一个新生态,创业机会会出现在的主线不涉及的领域,而且创业公司要有独创的算法和前瞻性,比如以为基础再往前进一步,建立护城河。
悉之智能一直以来做的是AI解题方向的探索,目前有很强的同理心和理解能力,但相对缺乏逻辑能力,无法完成数学题之类更复杂的问题。“让AI获得逻辑能力,稳定完成更加复杂的任务,比如AI解体,或许会成为下一个十年AI领域最重要的课题。这也是我们努力的方向。”孙一乔说。
有人觉得,的能力被夸大了,多位从业者一致认为,不是天才也不是白痴,说是万能的,肯定夸大了,但如果说中国一两年就能追上,显然是低估了难度。
确实,并不是通用人工智能,目前可以理解为是一个读了几千万本书,但没有太多生活经验的人,虽然在文本层级有了能力,但学习人类对知识应用、逻辑推理、转化为行为的能力,是AI下一个阶段的重要命题。
无论如何,已经搅动了整个科技互联网行业这一潭水,全行业都在关注、学习,及时吸收利用其中的精华。至于二者将会碰撞出什么样的火花,还需要交给时间。
*题图来源于,文中配图均来源于视觉中国。