从看AI未来趋势和挑战
2022年11月30日,公司发布了一款名为的软件. 该软件在发布后的5天内,用户数量就超过了100万,2个月内活跃用户数更是突破了1亿,成为了迄今为止增长速度最快的应用软件. 该软件几乎可以完成自然语言处理的所有任务. 首席执行官Sam 认为AGI(通用人工智能)是AI that are than ,需要开始为AGI的到来做准备.
AGI会是AI的未来吗?本文将对此进行讨论.
1. 的能:生成
如果说上一次让AI火出圈的所展现出的是在特定领域的“专”,这一次展现出的则是AI在广泛应用场景的“通”:这个“通”以正常人都会、都懂、都能体验的对话形式呈现,让AI特别是自然语言处理技术进入主流用户群,孕育出了这一现象级产品. 具体而言,在对话过程中展现出了自然对话、多轮交互、上下文学习、思维链推理、实时反馈在线纠错、涌现出适应未训练任务以及GPT-4中新出现的理解弦外之音的能力.
能够实现如今顺畅自然的人机对话,不仅源于其对GPT单向语言生成技术路线的持续发展,还依赖于算法、算力和数据等多方面的支持. 图1展示了部分已展现出的能力及其背后主要技术原因的对应关系.
在学术界积极探索能力背后的技术原因的同时,工业界已在欢迎这项新技术,并将其优秀的对话生成能力融入各种应用场景. 根据对话的对象和本身的定位,我们将这些应用分成4个层次(如下表1所示):
从生物学角度,语言和智能的演化过程相互促进. 人类智能在很大程度上依赖于高度复杂的语言系统. 等技术在语言生成能力的持续提升能将人工智能带到什么高度,让人非常期待.
2. 的不能:负责
能力越大,责任越大. 展现出的强大能力让主流用户群欣喜、学术界惊讶、工业界狂热. 回顾人类历史上的几次技术革命,从早期的石器、金属器具、机械设备、电气设备到近几十年的计算机、互联网和智能手机,每一个阶段所发明的工具都对人类生活产生了深远影响. 在使用这些工具时,我们可以清楚地意识到它们作为工具的定位,即辅助人类来完成任务. 然而,在使用的过程中,我们经常会产生一种与另一个人对话的错觉. 这种独特的体验无疑将加速技术融入人类社会的进程.
整个2023年3月被各种生成式AI技术和产品的发布充斥. 当人们开始依赖这些技术代替自己学习、思考、甚至决策时,有两个问题摆在我们面前:技术是否已经做好准备承担责任?人类对技术的信赖是否超出了它的能力?
实际上,在使用过程中已被发现存在诸多问题:如数学计算、未来预测、时空物理现实推理等方面能力的局限,以及事实错误(幻觉)、生成毒害内容等方面的不可控. 下面从可信AI的4个维度对存在的问题展开讨论.
1) 安全性. 和所有机器学习模型一样,存在着被对抗攻击的风险.
2) 公平性. 尽管目前尚无系统性研究分析在性别和种族偏见方面的表现,但已有研究发现它存在明显的语言敏感性.
3) 可解释性. 仍存在很多尚未解释的行为,包括自我在线纠错、理解弦外之音等能力,以及出现事实错误(幻觉)等问题.
4) 数据隐私. 包括训练阶段的数据侵权和推理阶段的隐私泄露.
从生成式AI模型选择的技术路线和当前发展水平看,这些问题既可以归结为大型语言模型固有的结构局限,也可以归结为将符号任务统一建模为对话问题的过度简化.
作为工具,首先应该明确能力边界,即“做自己能做的事”. 我们可以沿“自知”和“能力”两个维度绘制一个坐标系,如图2. 在隐藏区时,模型“不知道自己能”,可能在收到用户反馈后将原本正确的答案改为错误;在未知区时,模型“不知道自己不能”,可能会产生事实错误幻觉,一本正经地胡说八道.
3. 什么是“真”
众所周知,概念的经典表示由三部分组成:符号表示、内涵表示和外延表示. 每个概念具备3种功能:指名、指心和指物.
如果概念的指名、指心与指物功能等价,则可以认为:认知智能、情感智能与行为智能等价. 然而,乌卡谢维茨悖论告诉我们概念三指等价在逻辑上并不永远成立:它内蕴矛盾.
从理论上讲,和GPT4同样无法解决真假问题. 因此,我们必须放弃概念的三指等价假设. 一旦放弃了这个假设,就会发现认知智能、情感智能与行为智能是不可能等价的. 实际上,现实生活中,这三种智能从未等价过.
4. AI的未来
4.1 中短期技术趋势
发明对于人工智能领域的影响,可以类比哥伦布发现了美洲大陆. 的诞生为人工智能领域注入了信心并指明了发展方向,展示了“大力出奇迹”的可能:通过不断扩大神经网络的模型规模和增加数据量,可以在AI的道路上取得实质性的进展.
4.1.1 拓展应用
1) 垂直化. 发布初期,人们尝试在提示词中注入角色信息以增强垂直领域对话质量,但这种做法存在私域数据泄露风险,解决思路之一是利用控制和调用其他领域模型来提高垂直化能力.
2) 个性化. 个性化可视为垂直化的极致,针对个人需求和偏好的个性化微调模型能够提供更精确的服务. 典型的应用场景包括个性化推荐系统、个性化教育辅导、个人AI助理等.
3)工程化. 的诞生某种程度上是工程化的胜利,而它的成功无疑将进一步加速AI技术从实验室研究走向工程化和产业化.
4.1.2 克服局限
1)多模态增强. 由于多模态世界建模更为复杂,以语言模型为主或是现有条件下的折衷. 随着多模态数据量与模型参数继续增加,期望在视觉、语音等空间实现真正的多模态生成能力.
2)人机交互增强. 有人将现在的比作一个博览群书的神童,却从未亲身体验过这个世界. 通过进一步考虑生物学特性、身体感知和行动的影响,有望实现与真实物理世界的双向交互,在自主行为反馈中不断提升自身智能水平.
3)可信增强. 尽快构建新的可信测试基准:包括可信数据集和可信测试框架,研制面向大型语言模型的可信标准,以规范不同可信等级的模型在相应的应用场景中使用.
4.1.3 探索理论
1)预训练模型机理研究. 对于,除了探究在线纠错、理解弦外之音等原因未知的能力外,还需进一步研究任务涌现能力与模型规模以及训练数据量等的关系,为未来模型设计和实际应用提供指导.
2)学科交叉融合研究. 作为催化剂,不仅将推动人工智能学科内部计算机视觉和自然语言处理领域的进一步整合,而且将激发学术界和工业界更加深入地探讨和实践人工智能和其他学科交叉融合以及跨学科应用的可能性.
4.2 长期发展路径
人工智能的发展路径可以预测为:首先成熟的是感知智能,次之为认知智能,再次为情感智能,最后是行为智能. 当前,感知智能的问题已经大部分解决,已经融入人们的日常生活. 得益于等技术,认知智能的问题已经初步解决,即将走入人们的生活. 情感智能的问题部分解决,受限可用,比如在三界同构假设成立时,可以使用类技术. 行为智能的问题尚极具挑战性,在目前的情况下可用性受到严重限制,如在工厂等封闭场景下部分可用,距离人们的日常生活需求尚远.
粗略地说,感知智能是人工智能中的基础智能,可视为人工智能的1. 0阶段. 认知智能是人工智能的2. 0阶段. 情感智能则为人工智能的3. 0阶段. 行为智能可以看作是人工智能的4. 0阶段. 目前的人工智能发展已经进入了AI2. 0时代,未来的AI3. 0和4. 0还有待努力.
5. 的影响
人工智能发展至今,迈入认知智能时代,确实取得了重大进步. 虽然离AI3.0和4.0距离尚远,但依然将对我们的生活产生重要影响:
1)生成式AI的成功提醒我们,符号世界、心理世界、物理世界三界同构假设不是恒真. 今后,各种符号的证据力量需要检测,不能预设为真. 这不仅大幅提升认知成本,还考验认知能力. 随着类似工具的普及,它可能代表认知的最低水准.
2)每次技术进步,都对教育提出了更高的要求,这次也不例外. 展现出的认知水平要求人们更注重提出问题和独立判断的能力. 鉴于符号世界的人类普适性,教育尤其是高等教育需要提前布局.
3)表明认知智能已可用,但依然不可能通过原始的图灵测试. 这表明图灵测试是有启发性的思想实验,但不是衡量智能的实践标准.
4)的成功为国内人工智能学术界同时带来机遇与挑战. 机遇包括提高学界对相关问题的理解,例如任务的主观性,以往的多任务可能在新视角下视为单任务;同时,全社会对人工智能潜在能力的直观体验和认可得到提升,将极大推动相关产业的发展. 然而,挑战也不容忽视:应用研究方面,社会对技术的期待值提高,实效性和实用性至关重要;理论研究方面,技术已领先于理论,亟需加强理论研究.
5)类技术的大规模应用可能导致意识形态等方面的信息茧房效应. 特别是类是中心化的AI平台,容易使人们在获取信息时只接触到特定内容和片面观点,这一方面会加剧社会分化,另一方面会降低观点多样性,阻碍创新思维的产生, 为社会带来潜在危害.
6)大模型对计算量的巨大需求可能会加剧全球能源危机,并对环境产生不良影响. 我们期望AI for 通过加速科学发现,更迅速地找到可持续能源解决方案和新的节能技术,从而尽量降低这些负面影响.
7)在提高生产力方面潜力巨大. 通过自动化处理一些繁琐的、重复性的任务,它可以解放人们的时间和精力,让人们关注于更有价值、更具创造力的工作,进一步推动社会创新和发展.
扫码可获取全文:
桑基韬, 于剑. 从看AI未来趋势和挑战[J]. 计算机研究与发展. 2023,60(6).doi: 10.7544/-1239.
Sang Jitao, Yu Jian. : A into AI’s [J]. of and . 2023,60(6).doi: 10.7544/-1239.