知乎版GPT正式发布
刮起的人工智能热潮,愈演愈烈,成为互联网大厂竞逐的香饽饽。
在风暴眼中的知乎,也终于坐不住了。
4月13日下午,知乎创始人、CEO周源宣布,知乎版GPT“知海图AI”正式开启内测,同时,基于人工智能的“热榜摘要”开启内测。
此次知乎正式发布的 “知海图AI”大模型,是由面壁智能与知乎共同训练完成。
具体来说,“知海图AI”的训练基于面壁智能自主研发的 CPM企业级大模型 与 大模型系统。基于“知海图AI”大模型,双方一起尝试探索将大模型能力应用到知乎热榜。
简单介绍一下面壁智能,作为国内最早开展大规模语言模型研究的团队,面壁智能的创始成员主要来自于清华大学计算机系自然语言处理与社会人文计算实验室(),拥有深厚的自然语言处理和预训练模型研究基础。
目前,“知海图AI”实现的主要功能是,针对知乎热榜问题中的所有回答,进行快速的要素抽取、观点梳理和内容聚合,最终生成一个所有回答的梗概。
这项功能可以帮助用户更快、更全面地了解相关问题的讨论热点,以及信息焦点。
与此同时,知乎还将产品的使用效果与最新发布的GPT-4进行了对比。结果显示,两个模型的表现几乎持平。
值得注意的是,在这个结论前面加了一句限定词,“内容聚合场景”,也就说是上述对比,只针对总结归纳相关回答这一特定场景。
由此可见,知乎版GPT的适用范围还有很大提升空间。
实际上,作为一个以智能聊天形式面向市场的AI大模型,其最主要的使用方法,就是“问答”。
这不免令人想起了问答社区知乎。秉持着“有问题就有答案”的知乎,是互联网场域中最直接面对AI冲击的平台。甚至有人认为,的出现,会最终取代知乎。
对于这个问题,我们此前的观点是,会带来冲击,但却动摇不了知乎的核心。
相较于人工智能冲击的危局,我们认为,这波科技革命浪潮中,更有可能给知乎带来更多机遇。
面对AI冲击,如何赶上时代
2019年,知乎完成总额 4.34 亿美元的新一轮融资时,创始人周源在内部信中这样形容,“知乎所处的环境和阶段,丝毫不容许任何懈怠。快则生,慢则死。”
眼下,人工智能风潮带来的行业转变,比当初的形势更加紧迫。
自去年11月31日问世算起, 已经爆火了近四个多月。
今年一月以来, 平均每日在线人数达到 1300 多万,比去年 12 月增长了一番,一举打破产品一亿用户的行业最快纪录。
与此同时,在知乎平台上关于的讨论热度也持续飙升。
目前话题的讨论量达到29.9万,浏览量达到4.9亿,成为近年来知乎平台上讨论热度最高的话题。
让人们兴奋和疯狂的焦点在于,AI大模型技术就像是一台“万能许愿机”一样,每个人都希望借助它帮助自己处理工作、应付日常作业、快速生成所需要的编码,学习特定人物进行交流,甚至是进行文学创作。
无数人在期待带来的美好生活,对于知乎来说也是如此。
相较于技术带来的冲击,如何利用好人工智能技术,追上时代,才是知乎最应该考虑的问题。
目前来看,知乎手里有两张王牌:专业的语料数据、原创问答的社区氛围。
通俗来说,AI大模型所提供的答案,是从各大数据库中进行“提取加工”,大规模、高质量的资料内容,是它变得“聪明”的关键。相对而言,低质量的语料内容,则会造成大模型的污染,使用效果变差。
而经过十二年来的积累,在中文互联网世界中,知乎已经形成了庞大的问答内容积淀,其内容质量依旧是当前互联网世界中最优质的那一批。
知乎2022年Q3财报显示,其核心的问答内容已经超过4.82亿条,加上专栏等的总社区内容超5.79亿条。
这些精品内容就是知乎版大模型的底层燃料,不仅帮助中文大模型语料库变得更加完善,更加成为各大搜索引擎、大模型的资料来源。
除了优质内容积淀之外,目前的AI大模型还缺乏较强的原创能力,更多是按照一定的行文套路,进行内容缝合。
一个简单的例子是,我们承认十分强大,但如何深度使用完成工作,实现脑洞,却更多依靠用户的个性化创造。
那么真人问答社区的另一个价值,就是原创和创新能力了。
依靠知乎问答社区氛围的营造,平台正面向更多大众用户开放,对于一些开放性的问题,总有人能给出新颖的观点,这是做不到的。
显而易见,只要知乎还能在未来的岁月中持续产出高质量内容,那么会有更多的搜索引擎、大语言模型、对话式AI产品优先从中引用信息。这些产品都是为更高效率提供用户知识检索而生。而知乎,也就自然成为这些大模型的“重要食粮”。
值得注意的是,这些利好因素都有一个重要的前提:知乎能够持续产出高质量内容。
聊到这里,我们就明白了问题的关键。
经常使用知乎的朋友可能会发现,相比十年前,现在的知乎内容已经多了很多“水分”,如今热榜上的很多话题,知识性没那么强,很多回答都靠“抖机灵”取巧。
面对AI时代的到来,知乎最需要做的是结合AI技术,寻找机遇。但这一切的前提是,好内容。
知乎需要找到答案
从问世以来,国内互联行业中,几乎所有抱着创新思想的公司都在寻找向上攀爬的入口,目前国内已有数十家企业相继入局。
最近一个月,百度、阿里这两家最具实力的巨头就相继推出自家的大模型产品,文心一言、通义千问,你争我抢,摩肩接踵。
尤其在还未进军中国市场的当下,谁能率先做出同等级的产品,就能在整个行业中拔得头筹。
在这样争分夺秒的竞争格局下,国内AI市场迎来了新一轮的爆发期。
典型的例子是红衣教主周鸿祎,在3月底的360战略发布会上,他亲自测验了360正在研发的AI大模型,戏称这还是“一个未满月的孩子,还很不成熟,名字都没起。”
如此急切的展示,已经告诉我们行业竞争的焦灼。
但是在火热爆发的市场之下,我们却需要浇一盆冷水:
行业需要的不是催生的早产儿,而是真正潜心做事,关注长期价值的实干家。
同样以为例,在全网爆火之前,于2020年5月发表GPT-3的论文。
而当时的GPT-3已经可以实现编写完整的文章或故事,并且生成人类评估人员难以区分的新闻文章样本。
从2020年5月到2022年11月,从GPT-3到GPT-3.5,一共用了两年半的时间。
这样来看,国内的追随者们即使是走在已经验证过的道路上,也需要时间,来进行技术攻关、效果优化。
但是我们看到的现状是,很多互联网公司现在就迫不及待地寻找产品落地的应用场景,探索变现和商业化的可能性,这的确有点过于功利了。
对于知乎来说,也是如此。
知乎近些年持续不断进行商业化尝试,包括但不限于:好物推荐(卖货 ,在线教育(卖课)以及盐选会员(卖小说)。
虽然扩大了用户基数,增强了商业化能力,但是却降低了内容质量,原本极佳的社区氛围和用户体验,开始走下坡路。
经过前文的分析,我们已经看到在内容、生态、商业化和AI之间,知乎的真正差异化价值是什么。
而现在,在AI技术席卷全网的当下,我们发现知乎最重要的资产,却在过去几年中缓缓流失,这不由得让人感到可惜。
总的来说,在掀起的AI浪潮下,知乎终于表明态度,拿出了自家的大模型产品,这一点十分振奋人心。
面对全行业的争分夺秒般的竞争格局,我们希望知乎和诸多互联网公司,都能够专注于长期价值,注重技术、优质内容的积累。
有的时候,慢就是快,即使在AI全面创作的时代,优质的内容也是稀缺资源。
言尽于此,希望知乎能早日寻到属于自己的答案。