过去一周风靡社交网络的人工智能(AI)产品,非莫属。
12月5日,微软投资的美国 AI 实验室 创始人兼CEO Sam 在社交媒体上宣布,其11月30日发布的聊天机器人模型,上线短短五天,用户已经突破了100万。
所谓,就是模仿人类说话风格的同时回答大量的问题,通过 的新模型生成一些语义答案,利用网页应用形式与用户对话互动,实现简单聊天、信息咨询、撰写诗词作文、修改代码等。
由于其较高质量的回答、高效获取信息的方式以及上瘾式的交互体验,引起了国内外社交媒体的广泛传播与关注,而且产生取代谷歌等搜索引擎的讨论与可能性。
连世界首富、特斯拉CEO马斯克也称:“许多人陷入了该死的疯狂循环中。”甚至已经有国内投资人开始寻找背后的 公司,求购其股份。
尽管对其有大量赞扬的声音,但程序员聚集的问答社区Stack 已经宣布禁止使用生成的机器回复,而且存在输出结果不稳定、没有纠错体系、商业落地难、数据安全难保护、对中国境内的实名用户不友好、关键模型不开源、AIGC(人工智能内容生产)赛道引发的创业与投资泡沫等问题,已引发业内广泛讨论。
这是编辑输入“钛媒体”三字,给出的答案,准确度确实令人惊艳。
接受钛媒体App独家采访时,京东集团副总裁、IEEE 何晓冬博士表示,中国应该要发展自己的模型产品。
“坦白讲,(语音机器人)这个方向是对的,以后会有这个市场需求。”何晓冬强调,除了在研究方面继续向前探索外,在文本生成上,有独到的体验和价值,已经快要接近可商用的地步了。
到底是怎么形成的?能否取代搜索引擎?
“AI 快要成精了!”有投资人玩之后在朋友圈这样感慨。
那么,什么是?
你可以理解为,偏任务型的多轮对话或问答系统,定位于“通用型 AI 技术助理”。相比苹果Siri 和小爱同学的“订餐、订票、订宾馆”,更多执行开放域任务,即问答、阅读理解、推理、头脑风暴、写作文、改错等,可以说是“AI 版的知乎”。
今年3月4日, 团队在预印版网站arxiv上提交了一篇题为“训练语言模型以遵循人类反馈的说明”的论文,详细阐述了背后基于拥有13亿个参数的大模型的技术能力。
在论文中指出,核心在于模型输出,更深层次是基于 研发的GPT-3.5基座能力。尽管模型参数,比NLP预训练模型——GPT-3 1750亿个参数少100倍,但前者的数据模型有所甄选、校准和微调,训练出来的结果更精准,能够更简单的优化语言模型。
该团队称,大部分沿用了的训练方式,在数据收集阶段招聘了人类 AI 训练师,同时扮演用户和 AI 助理角色收集数据。在此过程中,这些 AI 训练师可以根据初始模型的结果修改模型生成的回复,从而被用于有监督地精调训练模型。随后,工程师会对模型的多个生成结果进行比较,从中甄选数据中更加符合人类偏好的输出信息,甚至存在持续学习能力。 统计发现,其API用户在超过70%的情况下更喜欢。
目前,仍处于免费测试阶段,不限量向公众开放。而基于其破百万的用户数,平台所花费的成本不算小。马斯克曾询问“每次聊天的平均费用是多少”,回复:“用户平均每次聊天所花费的可能是个位数美分。”
钛媒体App也第一时间尝试使用模型,简单问了三个关于芯片相关的问题。我们发现,有些信息非常精准,有点像知乎或百科的回答,有时候像谷歌、Bing的搜索引擎结果。但它的答案精准度依然有待商榷。
清华大学计算机科学与技术系长聘副教授、博导,聆心智能创始人黄民烈告诉钛媒体App,展示了新一代 AI 技术的能力,或许不远的未来,一定程度的AGI(通用人工智能)可以做到。至少无缝人机交互是乐观的。他指出,的数据很好,胜在数据质量高、多样性、RLHF算法。其中,强化学习带来的增益非常之大。
目前来看,的升级在于更多是算力与语料调教后的技术成果。
何晓冬则对钛媒体App表示,模型在使用体验上确实让人感觉耳目一新。无论是流畅性,还是逻辑感都非常强,逻辑强于内容。但“干货”量偏低,缺少一些知识的准度,“其实某种意义上,我觉得它的实用价值现在还是比不上谷歌(搜索)的。”
前总部科学家、出门问问创始人李志飞接受采访时表示,相对于语音助手和搜索引擎,还有很多不能干或干不好的事情。的“认知”建立在虚拟训练文本上,没有跟实时的数据库或信息连接,仍有些“空中楼阁”的味道,所以特别适合插科打诨。
有用户总结,目前不能回答的话题包括:不能预测可能会但从未发生过的事件及其后果;不能或打破常规建立新规则和新模式;不能深入问题的细节去回答而是停留概要层面;无法区分是否为事实问题,一些非事实问题无法得到回答;很偏门的问题(可能从未有人这么想过的问题)不会回答;不能列出非主流观点;对话语境不能跳跃太大,领域跨度太大等。
但专栏作家Parmy Olson却认为,相比谷歌搜索抓取数十亿个网页内容编制索引,然后按照最相关的答案对其进行排名,包含链接列表来让你点击。却直接基于它自己的搜索和信息综合的单一答案,回复流程更加简便。
针对外界认为能否取代搜索引擎的讨论,自己却给出了“否定”回答:并不是搜索引擎。它的目的不是提供信息搜索。相对于搜索引擎通过索引网页并匹配搜索词来提供信息,则是通过对自然语言问题的回答来帮助用户解决问题。因此,它们之间没有直接的竞争关系,并不能相互颠覆。
早前,还发布了DALL·E 2——可以通过文本描述中生成图像的 AI 程序。国盛证券指出,相比于此前的AI绘画,更具有将AI能力与工作流程相结合的潜力,如果将与等创作工具融合,有可能直接输出设计图稿等内容。而和DALL·E两个产品都是AIGC技术带来的新变革。
“我认为 AI 的潜力还可以进一步放大和挖掘。回看过去这十年,AI 技术的进步确实超出想象。10年前你可以看到图像、语音识别有突破,但肯定不会想到绘画、文章也可以通过 AI 生成逻辑性产品,这两者是不同的。这十年 AI 在不停的超越和突破很多人的预期和想象,这还是挺了不起的。”何晓冬对钛媒体App表示,这次最大的创新点在新的半监督学习算法,使得它对用户的意图理解,可能快达到大规模商用的搜索引擎水平。
何晓冬认为,相较于之前大量使用无监督深度学习算法,模型背后的算法和训练过程更加新颖。如果没有人的数据甄选,这个模型参数即便大十几倍,也很难达到这个效果。尤其把生成的文本模型更加“组织化”,这是非常大的技术创新。
“在某种意义上,这其实是对过去一味追求(参数)大和追求无监督学习的一个路线修正。”何晓冬表示。
于2021年底已经完成了2.5亿美元的A轮融资,投资人包括微软、马斯克、谷歌风投、老虎基金、A16z以及前东家Y-等。据The 报道,成立七年的 公司估值已经接近200亿美元,是其2022年预计收入的500-800倍。
在2020年 发布GPT-3之后,微软于当年9月22日取得独家授权。报道指, 每年在微软云计算上花费约为7000万美元。
中国应该有自己的
事实上,尽管海外爆红、服务器被挤垮,百万网友使用,但不包括中国境内的实名用户。很多拥有国内+86电话用户无法使用。虽然有很多替代的网站或方案,或直接到非官方渠道购买 网站账号,但仍引发很多用户抱怨,国内用户体验大打折扣。
“中国必须要有自己的基座大模型,应用大模型。很简单, 关键模型不开源,只给API,中国还不能随便用,已经是‘卡脖子’了,所以我们为什么不做这样的事情。”黄民烈对钛媒体App表示,包括百度、聆心等国内很多团队正在(对AIGC)做决心与相关资源投入解决相关问题。
告别硅谷崇拜,在中国互联网世界中,国内应该建立有中国创新特色的,甚至是超越能力的中国 AI 公司。这已经成为中国 AI 产业发展的必答题。
事实上,2022年也因此被称为“AIGC元年”,生成式 AI 发展迅速。今年9月一篇文章中提到,生成式 AI 可以处理的领域包括了知识工作和创造性工作,涉及数十亿的人工劳动力。生成式AI 可以使这些人工的效率和创造力至少提高10%,有潜力产生数万亿美元的经济价值。
根据中关村大数据产业联盟发布的《中国 AI 数字商业展望2021-2025》报告预计,至2025年,中国 AI 数字商业核心支柱产业链规模将达到1853亿元,未来五年的复合增长率约为57.7%。国泰君安则预测,未来五年,或将有最多30%的图片内容由 AI 技术参与生成,相应有600亿以上的市场规模。