揭秘ChatGPT为何能“打败”大多数的大模型

AI人工智能2年前 (2023)更新 wangzhan
3,214 0
ChatGPT国内版

ChatGPT已经在互联网上引起了轰动已久的风暴。尽管谷歌Bard和微软必应(Bing)最近接连翻车,市场对ChatGPT的态度已经从“新鲜”转向“理性”。然而,国内外资本对ChatGPT仍然持续热捧。

确实,全世界都目睹了ChatGPT的强大,但实际上,在自然语言处理(NLP)领域,ChatGPT并不是第一个基于大型语言模型的产品。早在2018年,NLP领域就出现了另一个重要的产品BERT,被认为在自然语言理解类任务中表现出色。

那么,是什么让ChatGPT一经问世就获得了前所未有的关注?它的强大之处在哪里?为什么它能在众多大型语言模型中脱颖而出?

为了回答这些问题,《每日经济新闻》记者采访了马萨诸塞大学(又称麻省大学)洛厄尔分校的计算机科学教授Jie Wang。他认为,ChatGPT最主要的突破在于其背后架构GPT-3.5中使用的few-shots(小样本)和用户反馈的技术。此外,ChatGPT拥有其他语言模型所不具备的千亿级参数规模,这使得它能够捕捉更复杂的语言模式和关系。

人类已经经历了多次超级工具的诞生,例如互联网和智能手机,这些工具引发的科技革命极大地改变了人们的思维和生活方式。在Jie Wang看来,如果用ChatGPT来代表基于大型通用语言模型的应用,那么ChatGPT有潜力成为下一个改变世界的超级工具。

技术原理:一场“概率游戏”
ChatGPT之所以能够成为一个现象级的火爆应用,是因为它能够自动生成类似于人类撰写的文本,这一点非常引人注目,也非常出乎意料。那么,为什么ChatGPT能够如此出色地生成有意义的文本呢?

我们先从ChatGPT所属的NLP领域说起。NLP,即自然语言处理,是人工智能的一个领域,专注于让计算机能够理解、解释和生成人类语言。

人类语言非常丰富和微妙,可以根据上下文、语气和其他因素以多种不同的方式表达。如何处理人类语言的复杂性和可变性也成为NLP领域的主要任务之一。NLP技术是ChatGPT能够出色地生成类似于人类撰写的文本的基础。

“最先进的NLP技术是文本到文本的转换,它基于一个超大型的多层编码器-解码器神经网络。这个神经网络能够在超大规模的无监督数据集上对数十亿参数进行训练。”在谈及NLP时,Jie Wang向《每日经济新闻》记者介绍道。

在对NLP的主要任务有一个基本的理解之后,我们再来谈谈ChatGPT的技术原理。众所周知,ChatGPT是一种聊天机器人产品,它基于OpenAI的大型语言模型架构GPT-3.5。

2月15日,计算机科学家Stephen Wolfram在推特上发表了一篇长达万字的文章,解释了ChatGPT的工作原理。在这篇文章中,Wolfram提到,ChatGPT的核心任务是生成一个“合理的延续”,即根据人类在数十亿个网页中撰写的内容的规律,推测接下来可能出现的内容。

Wolfram举了一个例子,比如输入以下文本:“AI最好之处在于它的能力”。为了补充括号中的内容,ChatGPT会在数十亿个网页中查找类似文本,并统计下一个单词出现的概率。最终,ChatGPT会生成一个可能的单词列表,并给出每个单词的概率排名。这就是它的“概率游戏”。

揭秘ChatGPT为何能“打败”大多数的大模型

OpenAI的首席执行官Sam Altman曾在推特上表示,ChatGPT虽然在某些方面表现出色,但仍存在很大的局限性。他指出,现在过度依赖ChatGPT来完成各种任务是错误的,因为它在稳健性和准确性方面仍需改进。

许多人对未来充满幻想,他们期待有一天能够出现一种通用人工智能,它具备与人类同等甚至超越人类的智慧,能够进行思考、判断,拥有思想和伦理。正因为如此,ChatGPT的出现引起了巨大轰动,有人认为它似乎预示着通用人工智能的曙光。

人类已经经历了多次超级工具的诞生,互联网和智能手机的出现引发了科技革命,极大地改变了人们的思维方式和生活方式。Jie Wang认为,如果将ChatGPT视为基于大型通用语言模型的应用代表,那么它有潜力成为下一个改变世界的超级工具。他说:“我认为它有可能改变人们开展业务的方式。”

然而,现实情况是,ChatGPT离达到通用人工智能的终点还有很长的路要走。它仍然存在许多限制和挑战,需要进一步改进和发展。

323AI导航网发布

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...