chatgpt的人工智能聊天系统 ChatGPT:探索人工智能聊天的未来

默认分类1年前 (2023)发布 admin
3,529 0
ChatGPT国内版

– 探索人工智能聊天的未来 –

# 引言

– –

2022年末,美国人工智能实验室 开发的人工智能聊天机器人应用 横空出世,两个月后其活跃用户已超 1 亿,为人类科技史上消费者增长速度最快的应用程序, 已成为 AI 发展历程中的现象级事件。

埃隆·马斯克称 将颠覆世界;微软公司以数百亿美元投资 ,并计划将其整合到微软的 Offce 办公软件和 Bing 搜索引擎之中;部分高校和学术机构开展了关于使用 写论文是否合规的大讨论;还有部分咨询公司担忧是否会被其替代。

俨然已经成为当下互联网环境中的最火热的话题。

# 原理分析

– –

强大的能力主要是源自于其依托的大型语言模型,尽管加入了人工标注,但量级只有数万,这一规模的数据量与训练与GPT-3.5模型使用的几千亿级别的数据量相比,几乎可以忽略不计。因此,的强大功能主要源自于其背后的“巨无霸模型”-LLM(如下图所示)。

LLM就是一种从海量数据中学习各种知识的语言模型。这种模型的规模是巨大的,有能力开发出该模型的机构很少,所需求的资金较多,这也是人工智能发展缓慢的一个重要原因。LLM具备强大的自主学习能力,假设人类向其灌输世界上所有能够获得的文本或图片等不同类型的数据,LLM能自动学习其中蕴含的知识点,学习过程无需人的介入就能灵活应用所学知识解决实际问题。

– –

此外,还向GPT-3.5中注入了几万人工标注,但注入的不是世界知识,而是人类偏好知识。所谓的“人类偏好知识”,包含两种含义,一是人类表达的习惯说法。例如,人类习惯性表达:“把下面的句子翻译成英语”,以此表达机器翻译的需求,但LLM并非人类,就需要人工标注数据的方式注入这类知识,方便LLM理解人的命令。二是对于什么是好的回答,什么是不好的回答,人类有自己的标准。例如详细回答是好的,带有歧视性的回答是不好的,这就需要人工标注来让人工智能有自己的判断标准。

就具体过程而言,首先,创建人类偏好数据。随机挑选部分问题,并由标注人员给出高质量回答,并将此结果反馈至模型,让其学习——这批数值仅有数万。其次,训练一个反馈模型。随机挑选部分问题,由原始模型输出答案,再由标注人员基于“人类偏好标准”对原始答案进行排序。最后利用标注好的“人类偏好”数据,训练一个打分模型,这一打分模型会对原始模型的结果进行打分,告诉他什么答案分数高,什么答案分数低。当原始模型得出的结果获得较低分时,它将受到惩罚,同时,被要求重新学习。通过不断循环,原始模型逐渐迭代升级,直至“脱胎换骨”,彻底掌握人类偏好,变成人类满意的模型,即。

chatgpt的人工智能聊天系统 ChatGPT:探索人工智能聊天的未来

#的未来图景

– –

学界普遍认为, 的未来应用场景充满无限可能。从社交媒体到广告创意,从游戏到影视娱乐,从编程到深度写稿,从平面设计到产品工业设计,从文字翻译到外事同声传译等,每个原本需要人类创作的行业都可能被 颠覆性重塑。 被公认为是继互联网、智能手机之后,带给人类的第三次革命性产品。

现阶段的以高度拟人化的对话回答模式带来更好的交互体验,短期内将促进金融、媒体、医疗等诸多领域的发展。

以教育领域为例,从媒体报道中可以整理出16中教学应用用法(如下图所示),据媒体报道除在高校外占有一席之地外,其适用范围已经蔓延到学龄前儿童及中小学阶段。

基于当前 系统所具备的启发性内容生成、对话情境理解、序列任务执行、程序语言解析四项核心能力,我们从教、学、评、辅四个典型教育环节,梳理了不同核心能力可以支持的潜在教育应用(如下图所示)

由此可见,在各行各业均具有无限的未来应用场景,正在快速走进人类的工作和生活,会成为继互联网、智能手机之后,人人都离不开的工具。

#使用者的机遇与挑战

– –

是一种AI工程化的成功实践。AI工程化专注于开发工具、系统和流程,使得人智能能够应用于现实世界的领域。它使得普通人可以应用最新的自然语言生成与对话技术,完成很多曾经需要技术门槛才能完成的工作。

以创建一个爬虫为例,以前用户必须掌握语言的基础语法,了解环境的使用,才能编写程序进行API调用或利用爬虫搜集数据。而现在有了,用户可以使用自然语言对话形式,给出要求,人工智能会直接给出源代码,并复制到实验环境,从而获取所需的数据。(如下图所示)

但是,的出现也同样为使用者带来挑战和困扰,如果使用不当甚至会带来灾难性的后果。

chatgpt的人工智能聊天系统 ChatGPT:探索人工智能聊天的未来

的基础是一个生成式语言模型,它根据概率分布关系生成最符合要求的语言,但无法保证生成内容的真实性和准确性,一些使用者在使用时没有意识到这一点,他们惊讶于回答问题的精准性,并直接采纳答案。事后才得知所给出的回答是错误的,如何甄别答案的对错,对使用者来说是一个难以回避的挑战。

# 背后的隐患

– –

广泛使用使得很多未经思考或验证的内容大量产生。据报道,被调查的大学生中,至少有三分之一采用来撰写作业的答案。更是被广泛应用于问答网站的答案生产,且大量充斥于社交媒体,这样未经思考的答案充斥于互联网中,使得网络信息的准确性进一步下降。

此外,系统仍然难以充分理解信息和分析信息内在的逻辑关系,因此很容易生成不合理的内容或者犯事实性的错误。例如会经常地回答诸如“诸葛亮是如何打败秦始皇”或“林黛玉初见曹雪芹的情景”,所给出的错误且荒谬的答案体现了该技术并不能像人类一样完整理解知识体系与内在联系。这种事实性的错误也容易误导不具备专业知识或相关常识的学习者,引起学习迷航与认知障碍。

– HOME IS –

被滥用的问题也相当严峻,最常见的是作弊问题。这类人工智能产品虽然能为学生提供快速简洁的答案,但无法帮助学生培养批判思维与解决问题的能力。与此同时, 创作的内容所有权归使用者所有,但如果产生的内容有侵犯他人知识产权的行为,那么,将沦为知识产权纠纷事件。

# 结语

– –

互联网开辟了“空间革命”,智能手机的出现带来“时间革命”, 的横空出世有望形成“思维革命”,通过替代人类进行创作、创意、解答、咨询、翻译和客服 等改变人类思考和处理问题的方式方法,由此重塑各行业生态乃至整个世界。除此之外,同时存在很多难以规避的隐患与弊端,如何正确的将人工智能作为一项成熟去使用,我们还有很长的路要走。

– E N D –

参考资料:

[1]朱光辉,王喜文.的运行模式、关键技术及未来图景[J].新疆师范大学学报(哲学社会科学版).

[2]卢宇,余京蕾,陈鹏鹤,李沐云.生成式人工智能的教育应用与展望——以系统为例[J].中国远程教育.

[3]王树义,张庆薇.给科研工作者带来的机遇与挑战[J].图书馆论坛.

[4]郑世林,姚守宇,王春峰.新一代人工智能技术发展的经济和社会影响[J/OL].产业经济评论.

[5]令小雄,王鼎民,袁健.爆火后关于科技伦理及学术伦理的冷思考[J].新疆师范大学学报(哲学社会科学版).

图文编辑|于光辉

本推送为天津大学《科学技术史》课程作业

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...