除了写小说写代码,还藏着哪些赚钱的机会?
文|Judy
编辑|石亚琼
来源|数字时氪(ID:)
封面来源|视觉中国
随处可见,AI 对话机器人 正在引爆全球。
然而关于它的应用,AI算法工程师的看法和产业分析师们却并不相通。
作为低门槛、高效的 AIGC 文字内容生产工具,被认为将在智能客服、虚拟人、游戏等领域得到更大落地应用,也对很多算力、数据标注、自然语言处理等底层技术公司利好。
而在产业应用侧,似乎还在观望。作为一项刚刚出现的新技术,企业的AI算法工程师会认为,错误率和高成本仍然是阻挡快速落地的最大阻碍。
行业分析师看到的是技术带来的未来想象力,产业里的AI工程师看到的是具体的困难。而技术的长期进步不应该被低估,技术短期的进展也无需高估,两者相结合或许是看待商业机会更合理的方式。
此刻,想要通过真正赚钱,可能还需要考虑开源、成本、伦理、监管等诸多问题。AI 代表的未来已经迅速到来,它将怎样改变科技进程和商业模式?
有哪些商业化可能性,企业如何上车?
作为 在11月30日刚刚推出的免费机器人对话模型, 是在GPT-3.5系列中的一个模型上进行微调而成,有着多达1750亿个模型参数。模型中首次采用 RLHF(从人类反馈中强化学习)方式,已在今年初完成了训练。目前处于测试阶段,面世一周便已有超过一百万用户使用。
聊天、写代码、写小说、写论文,以 为代表的 AI 聊天机器人似乎已经无所不能,甚至即将会取代很多人的工作。
而我们更关心,哪些场景更有可能真正应用起来?
内容创作、客服机器人、虚拟人、机器翻译、游戏、社交、教育、家庭陪护等领域,或许是 能快速落地的方向。
浙商证券认为, 模型的出现对于文字模态的 AIGC 应用具有重要意义。包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等下游应用,都将受益于 技术的逐渐成熟。
在智能客服领域,因为可用于创建能与用户进行对话的聊天机器人,这将对客户服务很有帮助。同时,由于可以进行微调,以回答特定类型的问题,可以帮助创建虚拟助手或其他类型的信息提供系统。
而实际上,新技术从出现到落地的应用,要有一段很大的鸿沟需要跨越,行业真实的声音或许并不那么热烈。
乐言科技的智能问答技术负责人邱杰博士告诉36氪,对于智能客服行业来说,目前对于的应用还处于观望和保守的阶段。一方面是由于电商客服行业需要依据固定SOP,提供确定性和高准确率的回答,展现的创造性反而不适用于这个场景;另一方面,目前的高成本和不明确的收益点,也使智能客服行业仍然需要等待找到一个更好的落地方向。邱杰也提到,尽管如此仍然会对相关技术保持关注,同时在强化学习、多模态内容等方面不断尝试和应用。
在游戏和社交媒体等偏虚拟的场景,可以用于创建与用户进行对话的虚拟代理或虚拟化身,也可以根据输入数据生成类似人类的文本响应。这对于相关应用程序创建内容很有帮助。
特别是在文娱写作领域,腾讯、百度、中文在线和阅文集团等公司,都在尝试 AI 相关的写作项目——腾讯的写稿机器人,百度集团的文心大模型,中文在线的 AI 文字辅助创作功能,阅文集团携手微软打造 AI 赋能网络文学等。将对文本生成领域带来新的创作模式。
不仅改变创作,还有可能改变获取信息的主要方式。
国盛证券指出,相比于此前的 AI 绘画, 更具有将 AI 能力与工作流程相结合的潜力。
如果将 与 、 等创作工具融合,把它输出的结果作为一个中间变量输入其他模型,有可能直接输出设计图稿等内容。文字生成是基础,而用户要做的尽量调整自己的输入,以促使 AI 输出更质量的内容,这本身也是一种训练和反馈过程。部分用户已在社交媒体上表达了对 的付费订阅意愿,C 端用户的需求也将带来更大的商业化可能性。
编程机器人也是备受关注的一个应用场景。
海通证券的研究提到,作为一种对话式大型语言模型, 最擅长的就是回答用户提出的问题,其中最关键的是 具备与编程相关的基础知识。这就让 成为类似于 Stack 的编程问答工具,只不过回答问题的主体是AI。如官网展示,面对用户对于debug的请求,会先和用户交互确认debug过程中需要关注具体问题,从而给出正确的代码。
值得注意的是,因为自动生成的答案质量太低,错误太多,Stack 宣布临时性禁止 生成的内容发布在其社区。
同时,算力、数据标注、自然语言处理(NLP)等上游需求,也将推动相关技术公司的发展。
专业机构预计到2025年,AIGC将占所有生成数据的10%,甚至有潜力产生数万亿美元的经济价值。
随着 AIGC 技术在全球的兴起,算力需求将越来越显著。目前 等巨头已着手自建计算集群来满足 AIGC 的要求,这种集中式的训练对 GPU、 存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练, 随着需求的增加,也有望转向自建集群。
一流科技的创始人兼CEO袁进辉告诉36氪,背后一整套的技术也意味着很多重塑的机会。算力、算法、系统、芯片可以通过购买得到,但数据还不是有钱就能买到的。
他认为,在预训练模型上又近了一步,通过技术使用了人类对模型训练进行反馈和指导的强化学习方法,也就是需要数据标注员来调教模型,实现了比无标注数据基础上预训练模型更好的效果。
因此,云厂商、芯片、算力公司等,特别是数据标注公司都将迎来新的机会。
Web3.0 圈子同样非常关注 的出现。
以太坊创始人 发布了使用进行编码试验的文章。根据其试验结果,在编码过程中会出现错误,但也提出一些新的编码模式,并且会加快编码速度,作为编程辅助工具很有帮助。他表示,「AI正在迅速改进,我希望它能继续进一步优化,并随着时间的推移消除此类错误。然而,AI远不能替代人类程序员。」
有分析认为,和Web3之间存在多个可能的结合点。
包括学习 Web3 基础知识,但仅限于2021年之前的资料;自动编写一些基础代码;辅助写作;用作 、电报等 Web3 社区的聊天机器人;使用 生成 AI 作图所需的 提示词,然后用于 AI 画作;接入 Web3 游戏,用于 NPC 对话系统等。
有人也利用进行了从理论到编码的Web3实践测试。
他们改变了提案-投票的DAO治理机制,由提供可以基于自然语言,对智能合约进行需求撰写、自动创建与链上部署的自动化能力。测试者认为,「将帮助原创深度内容的创造者,迈入职业生涯的新台阶,与Web3的结合,是内容创作者与产品开发者的黄金时代。」
每一个颠覆性技术的出现,都是一次洗牌的机会。抓住机会「上车」是几乎所有企业的必选项。
一流科技的创始人兼CEO袁进辉认为,将作为技术基础设施,加上自身行业数据进行训练,会成为某种实践的方向。
应用侧企业也有相似的感受。硅基智能的创始人&CEO司马华鹏告诉36氪,将会成为一个技术生态,但它学习的是互联网上公有域的知识,不能解决具体行业企业的个性问题。因此更多创业公司应该在AI技术基础上,提出更贴近客户具体需求和痛点的解决方案和产品。
例如,作为虚拟人公司,可以针对医疗、银行等某个行业中的企业,单独形成解决方案,再用等AI技术将对应的私有化知识加进去进行模型训练,从而解决实际问题。
距离赚钱,还有多远?
想要真正实现收益,在成本、技术和伦理等方面,还有很多需要关注的问题。
首先,在规模化之前,要面对训练成本持续上升的问题。
根据 ,其单轮对话平均费用在 0.01-0.2 美元。创始人Sam 称,「我们将不得不在某个时候以某种方式将其货币化,计算成本太大。」
很注重商业化应用,但并不急于创收;背靠微软,也并不缺钱。这次是免费不限量向公众开放,而此前GPT-3是根据使用量(token)来收费的,已经拥有大量客户。
在使用过程中,用户可以提供反馈,这些反馈互动是对最有价值的信息,也是推动进步的关键一环。这种免费使用的方式,能够以低成本的方式大量获得真实样本,同时扩大 的影响力。袁进辉同样认为,成本在技术的颠覆突破面前只是时间问题。
除了成本,仍存在一些技术局限性。
尽管相比GPT-3,在模型表现方面形成突破,但目前可能仍需要进一步的调试和训练,从而达到商业使用的标准。
很多使用者反应,偶尔会犯错误,提供的信息有一定误导性;并且会过度揣测人的偏好。
还有一个致命缺点是,它不能通过互联网进行实时检索信息。
出门问问的创始人兼CEO李志飞就在朋友圈提到,「相对于语音助手和搜索引擎,目前还不能干或干不好的:1. 最重要的,不能给你查附近的川菜馆;2. 不能帮你打电话、定日历、播放歌曲等手机本地操作;3. 大概率不能回答训练时它没有看到的最新网页知识,比如说不一定能正确回答一个五年前活跃但今天不再活跃的政治人物今年的年龄;4. 大概率不能做对简单的逻辑题和加减乘除题。总结来说,的『认知』建立在虚拟训练文本上,没有跟实时的数据库或信息连接,没有语义理解需要的,也没有显式的逻辑推理,还是有点空中楼阁的味道,所以特别适合一本正经的胡说八道和插科打诨。当然,上面这些问题可以通过hack的方式解决,但是就丧失了GPT的优雅、简单和通用性了,那跟『传统』的方法也就没太大差别了。再当然,表现出来的能力是惊人的和伟大的,只是跟所有新技术hype一样,也没有想象的那么惊人,路漫漫其修远兮,AI还得不停探索!」
由于其学习的知识仅限于 2021 年之前的互联网离线文本,因此很多最新的问题是无法得到解答。对于中文用户而言,语料的不足也导致它在中文对话能力上要稍逊于英文。
但在MIT 对科学家的采访中,他们提到了后续有可能将和的能力结合起来。+可以对信息进行实时更新,并且对于事实真假的判断将更为准确。具有强大的工程化、迭代反馈的能力,并且作为AI能够跟人类目标统一。
模型训练的数据来源也是一大问题。
这样的大规模预训练模型,需要利用人工智能,对互联网上海量的语言、文本数据进行信息挖掘和内容理解。然而如今复杂的信息场景中,数据质量参差不齐,语言模型的训练和学习更加困难。
当带来种种新的技术需求出现,像一流科技等可以为训练大模型提供软件算法支撑的底层架构公司,也将有新的机遇。
AI 的发展始终伴随着悬而未决的科技伦理问题。
背靠微软, 使用传统的API方式,中心化地管理 AI 伦理道德、版权等安全问题。
Dall-E2的使用协议中规定了其图像版权归属;同时,其训练模型的数据也是封闭的,无法查看。
但由于聊天机器人和文本生成工具等很可能会不分质量好坏和是非观地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出。还要不断摸索,结合用户反馈,模型还需要屏蔽掉这几天大家试验出来的绕过系统限制产生负面信息的方法,避免社会偏见、错误信息和毒害信息等内容。
在袁进辉看来,目前存在这些问题是很正常的,长远来看,随着时间和投入一定可以被解决。在未来将产生的商业应用价值和当下的投入来比,是必然会被解决的。
在开源问题上,业内普遍不认为会将模型开源化,就像GPT-3也并没有开源一样。但袁进辉认为一年时间左右,市场上巨头都会投入竞争,在社区出现开源版本,逐渐成为一种 AI 基础设施。
放眼望去,哪些事情将被改变?
「从上学开始做AI的研究也有20年了,所以无论群众对AI多么热情,自己一直觉得AI没有什么神秘感,也不觉得它能创造奇迹,但最近AIGC 和 还是让人非常吃惊。的确就像有人说的,大模型和BERT虽然都是,但已经不是一个物种了。」这是一流科技的CEO袁进辉对出现的直观感受。
在寻找答案、解决问题的效率上,已经部分超越了如今的搜索引擎。许多人都在担心,我们的下一代搜索引擎或许不再是。
业内人士认为, 替代其实还有点遥远。
尽管模型能够提升搜索的准确性和交互性,但其成本比较高,免费的试用期过后,从性价比角度考虑,在短时间内替代谷歌难度较大。但它可以作为当前搜索引擎服务的一种补充,也会对现有的搜索引擎公司产生一定冲击,促进巨头间竞争。
同时,由于 仍无法很好解决提供虚假信息和过度猜测用户意图的问题,因此仍更偏向 AIGC 内容生产工具,而不是搜索引擎这样的寻找信息集合和答案的工具。
被业界视为 AIGC 的颠覆式里程碑。
最近风靡的 AIGC 应用包括自动生成文章、文字生成图片等,如、 、等平台。AI内容生产工具,正沿着「文字-图片-声音-视频」的数字媒介演进的路径爆发式涌现。
同时,信通院的《人工智能生成内容(AIGC)白皮书(2022年)》也指出,近年来超级深度学习的发展也带来了深度神经网络技术在大模型和多模态两个方向上的不断突破,支撑AIGC不断升级,可以完成更丰富和生动的数字内容生成。
在 的 CEO Sam 看来,我们能够通过 与计算机交谈、并获得我们想要的东西,这使得软件从命令驱动转向了意图驱动。 作为一种语言接口,将是我们实现神经接口之前的最好方案。
更进一步,由于将人对结果的反馈成为其学习过程的一部分,每走一步都观察人类的反馈,朝着人类期望的方向进发。因此代表的AI技术将有可能拓展到更多领域,比如人的情感。
司马华鹏告诉36氪,未来如果AI可以与用户产生情感交互,将在游戏、电商、搜索、社交等商业领域产生非常大的革命。特别是对于硅基智能正在做的数字虚拟人来说,如果可以连接到这样的引擎上,现在的虚拟人短视频、直播等内容将呈现出新的面貌。对于抖音这样的内容平台来说,原有的生产模式会被打破,因为AI生产的内容将是无限的。
除了具体的应用场景,为代表的国际性AIGC平台很有可能成为未来新的 AI 基础设施,同时也向更垂直和专业化的方向发展。
上一次给世界带来如此大震撼的AI还是击败李世石的,转眼新的革命又在眼前。 的 CEO Sam 在推特上写道:「Trust the . Flat , .」
或许正让我们处在某个起飞的点上。
36氪旗下官方公众号