图片来源@视觉中国
文|深燃,作者 | 王敏,编辑 | 向小园
AI要“逆天”?
12月1日,微软投资的AI实验室发布了一款聊天机器人模型,能够模拟人类的语言行为,与用户进行自然的交互。
一经问世,就被用户们疯狂“调戏”,有人用其写小作文,有人拿高考题来考验它,有人让它写代码,随后,越来越多功能被挖掘出来,不仅“文能写文章、武能改Bug”,被马斯克评价为“厉害得吓人”,更因为“未来是否有可能取代搜索引擎”而引发热议。
深燃体验后发现,能够快速走红,火遍全球,是因其能够给出优质的答案、提供高效获取信息的方式,拥有强大的语言组织能力,为用户带来超出预期的交互体验。
不过,弊端很快也暴露了出来,的强项在于组织出一个完整的答案,但给出的内容并不一定完全准确,甚至对于一些有准确答案的常识问题,也会出现漏洞,以至于知名程序员问答网站Stack 紧急发公告宣布暂时封禁。
但这并不影响好奇的用户们跃跃欲试。上线短短5天,Open AI首席执行官Sam 就在社交媒体上披露,用户已经突破了100万。
AI绘画的热度还没降下去,AI对话模型就来了,都为2022年下半年以来火热的AIGC( ,即人工智能生产的内容)添了一把柴,让它加速走入人们视野。经过前几年技术的积累,AIGC走到了爆发的临界点上。
怎么突然火了?
能够快速走红,是因为它操作简单,容易上手,打开之后在对话框里输入问题就能获得答案。而且,它就像一个全能选手,常常能够给人出乎意料的答案。
应对日常对话,不在话下,可以分辨一些提问中的描述错误,面对不合理、不道德的请求时,能直接拒绝。
令人惊喜的一个表现在于,能够进行文学创作。比如,给一个话题,它就可以写小说框架。深燃让以“AI改变世界”为主题写一个小说框架时,清晰地给出了故事背景、主人公、故事情节和结局。
根据命题撰写小说框架 / 深燃截图
一次没有写完,经过提醒后,还能在“调教”之下,继续回答,补充完整,已经具备一定记忆能力,能够进行连续对话。
有用户体验之后评价称,“的语言组织能力、文本水平、逻辑能力,可以说已经令人惊艳了”。甚至已经有用户打算把日报、周报、总结反思这些文字工作,都交给来辅助完成。
普通的文本创作,只是最基本的,还能给程序员的代码找Bug,一些开发者在试用中表示,针对他们的技术问题提供了非常详细的解决方案,比一些搜索软件的回答还要靠谱。美国代码托管平台首席执行官Amjad Masad在推特发文称,是一个优秀的“调试伙伴”,“它不仅解释了错误,而且能够修复错误,并解释修复方法”。
更具备商业逻辑,不仅非常了解自己的优劣势,可以为自己进行竞品分析、撰写营销报告,就连世界经济形势也“了如指掌”,能说出自己的见解。
有人将比喻为“搜索引擎+社交软件”的结合体,能够在实时互动的过程中获得问题的答案。很多用户抱着好玩的心态和互动,但伴随着体验的深入,也会担心,自己会不会有朝一日因为AI而失业。
国盛证券区块链研究院在研报中表示,在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎,或许在未来会改变我们获取信息、输出内容的方式,AIGC有望成为数字经济时代驱动需求爆发的杀手级应用。
能够实现当前的交互,离不开在AI预训练大模型领域的积累。是微软投资的AI实验室,也是全球AI领域最为领先的AI实验室之一,一直因为技术层面的领先,被当作是AI领域的行业“灯塔”。
从2018年起,就开始发布生成式预训练语言模型GPT( Pre- ),可用于生成文章、代码、机器翻译、问答等各类内容。在当时,参数量只有1.17亿。
接下来,每一代GPT模型的参数量都爆炸式增长,2019年2月发布的GPT-2参数量为15亿,而2020年5月的GPT-3,参数量达到了1750亿,直接带动了预训练大模型成为AI领域近两年的发展趋势,掀起一场拼参数、拼算力的军备竞赛。
GPT-4还未到来,这一次发布的,被视为是基于GPT-3的微调版本,即GPT-3.5。
表示,采用的模型使用了“利用人类反馈强化学习(RLHF)”的训练方式,包括了:人类提问机器答、机器提问人类回答,并且不断迭代,让模型逐渐有了对生成答案的评判能力。相比GPT-3,的主要提升点在于记忆能力,可实现连续对话,极大地提升了对话交互模式下的用户体验。
警惕的“随机编造”
也并不是总能给人带来惊喜,不可否认,它还存在许多局限性。
当你要求进行创作时,它可以自由发挥,但是,当你的目的是寻求正确答案时,可能有时无法满足期待。
比如,让背一下《观沧海》这首诗,它却即兴创作了一首。
“即兴创作”《观沧海》/ 深燃截图
而让做一道小学数学题,它看似写出了一长串计算过程,给出的却是错误答案。
对于部分题无法给出正确答案 / 深燃截图
深度体验后会发现,对于一些文化常识问题、数学计算题不是太擅长。而且,的回答往往是大段长段,过于冗长,看似逻辑自洽,但有时是在一本正经地“忽悠人”,仔细思索会发现存在一定漏洞。如果非专业人士无法分辨答案的准确性,极有可能会被严重误导。
Stack 就因此做出了暂时封禁的决策。据悉,面世之后,Stack 上很快便出现了大量由该模型生成的答案。这些答案通常需要具备一些专业知识的人详细阅读才能分辨出是错误的。
这种情况让Stack 的质量管理遭到冲击。也表示:“因为AI生成的答案不总是准确或相关的,可能会导致Stack 上混淆错误答案,误导在寻求帮助的用户。”并且还表态:“Stack 禁止用AI生成答案是合理的。”
也提到,有时会给出看似合理但不正确的答案。对于这一问题,Sam 表示:“正试图阻止随机编造,现阶段让其与当前技术保持平衡是很棘手的。随着时间的推移,会根据用户反馈来改进。”
于是,一部分用户对于的定位是,聊天解闷的好朋友。在自己遇到两难处境或需要寻找意义时,可以像“命运之书”一样给出答案。
有一部分用户,把当成效率工具,在文案写作或是某些专业问题上寻找参考。
一位Web3领域从业者体验后的感触是,更利好创新型内容创作者,基于调查研究和访谈类型的内容,是很难被所取代的。伴随着AIGC汹涌向前,常规性质的内容创作者或将被淘汰。但是,从辅助索引到内容呈现,极大地提高了阅读搜集材料的效率,也刺激着自己的思考与创作体系。
问世后,最火热的讨论,是其能否取代搜索引擎。对于这个问题,给出了“否定”回答:搜索引擎的核心技术是搜索算法,它能够快速索引、排序、过滤网页信息,并根据用户查询词提供相关的搜索结果,而只能生成自然语言文本,无法进行搜索算法的处理。
对于能否颠覆搜索引擎的回答 / 深燃截图
但是,可以与搜索引擎结合,用于提高搜索体验。例如,可以用于构建智能机器人,对用户查询词进行解释、指导,帮助用户快速找到需要的信息。
出圈,AIGC时代还早
好评和质疑齐飞,出圈了,也让其所处的AIGC板块关注度飙升。
所谓AIGC,即利用人工智能技术来生成内容。2022年,Web 3.0时代加速到来,对于内容生产的数量和质量有更高的需求。和此前Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比,代表人工智能生产内容的AIGC,是新一轮内容生产方式的变革,AIGC内容在Web3.0时代也将出现指数级增长。
在今年7月的百度世界大会上,百度创始人李彦宏就曾表示,“AIGC或许将颠覆现有内容生产模式,实现以‘十分之一的成本’,以百倍千倍的生产速度,去生成AI原创内容。”
国盛证券近期的研报也指出,AIGC将是Web3时代的生产力工具。AIGC代表新一轮范式转移的开始。
自今年8月,文本生成图像模型 正式开源后,一下子催生了众多AI绘画的应用,这直接推动AI绘画走入大众视野,在近期被大众所广泛体验、熟知,成为AIGC赛道当红炸子鸡。
不过,AIGC热潮被引爆,也离不开今年9月一篇名为《生成式AI:一个创造性的新世界》文章。文中提到,生成式AI可以处理的领域包括了知识工作和创造性工作,涉及数十亿的人工劳动力。生成式AI可以使这些人工的效率和创造力至少提高10%,有潜力产生数万亿美元的经济价值。
海外已经出现了AIGC投资热潮,甚至跑出了两家独角兽公司。 背后的 AI投后估值已攀升至10亿美元,以文字生成为主的AIGC独角兽当前估值已达15亿美元。
非共识资本创始合伙人周文静对深燃表示,AIGC并不是一个新概念,此前便有AI生成文字、AI生成图片,只是技术尚未成熟以及广泛应用。但随着近两年随着技术的积累,AI生成图片、视频、音乐、文字都已经走向成熟,从量变正迎来质变。
AIGC依然还处于早期阶段,当前在使用体验上有了一定改变,未来将慢慢实现商业化。她指出,当前AIGC面向B端,已经存在一定的商业变现空间。在降本增效大背景下,AIGC可以帮助很多公司在内容生产环节提高效率,与后疫情时代企业的发展诉求相契合。
爆火的AIGC领域也出现了一些亟需解决的问题。以为例,内容不准确,或将给用户带来困扰。而此前爆火的AI绘画,则是因为画作的版权问题,是归属于AI画家,还是归属于平台。一直为外界所诟病。
隐忧虽在,不过,AIGC正处于发展的早期阶段,未来能够带来的颠覆性变革,依然充满着想象力。