chatgpt依据什么建立神经元网络 神经符号对话chatgpt

默认分类7个月前发布 admin
5,012 0
ChatGPT国内版

1) 神经符号主义是什么

在上一篇我写到的的文章(I)里, 我分析了虽然是伟大的,但是它不是你唯一应该关注的AI,因而还有其它的小而聪明的智能 , 其中一点就提到了神经符号系统, 也是像Guy Marks 等传统人工智能专家之前所极力推崇扽。

何为神经符号主义( )?我们知道人工智能的经历过古典时期的以符号为依托的专家系统阶段(用符号表达的各种规则,比如if apple is red, then eat), 中期的统计机器学习, 和近期连接主义深度学习, 深度学习和基于符号的专业系统分别是最新和最古的两个流派, 然而这最老和最新的东西却不是对立的关系, 它们的统一就是神经符号主义-结合了符号表达的专家知识的神经网络系统。

神经符号AI的核心思想是,将人类的认知智能充分的吸收到当下的神经网络模型里, 而不是靠单纯的堆数据和增加参数。具体如何来吸收人类的认知,一个是学习人类的符号化概念, 二是学习类似人脑的模块化系统,充分继承人类认知先验

2)神经符号主义三要素

神经符号主义的核心思想是,每个符号均是可被语言理解的,而且具有一个可以被配置的神经网络提供这个概念的灵活表征(我们可以看作一个api),而最终整个系统又是可以被人类编辑和控制的 ,我们可以看作一个微型操作系统。设计这样一个系统, 一般可以通过配置

(1) 符号概念集合,在这个任务里,哪些是最常见的概念和符号, 设计或学习它们背后的神经表征

这有点像编写一个游戏, 你需要规定一个元概念,然后里面的角色都是可以由这些元概念所配置的。元概念设置地越好, 你就可以用更少的概念表达更多的角色,这是符号神经结构泛化的基础。

(2)符号和符号间的关系,结构, 一般一个任务里符号间的配合使用需要符合一定的关系结构,如果是设计一个机器人导航系统,符号是位置,结构可能是地图,如果是一个人脸识别系统,可能是从脸部特征组成的决策树, 如果是一个对话系统,结构可能是有向无环的chain of 。这些结构,也可以看做元结构, 是可以被配置和具体化的。

结构一旦设定,符号就可以被嵌入到结构里, 同一个结构可以结合不同的符号, 从而进一步提升神经符号架构的泛化力

(3)定义在关系结构上的操作规则, 可以通过迭代使得结构不停发生改变, 或者产生新的节点和信息。这里节点代表抽象知识, 在任何一个任务里,都应该是需要一些基本的操作和规则进行的 。

操作和规则可以学习, 也可以人工编辑和制定, 这是神经符号系统可以大量加入人类经验和知识的基础。

如此设计的系统,它具有几个特别突出的优势:

chatgpt依据什么建立神经元网络 神经符号对话chatgpt

3)神经符号主义的三个不同阶段

神经符号主义试图让神经网络结合人类知识最终掌握这个完整的知识体系, 并且不失去神经网络的灵活性。我觉得神经符号系统也和AI一样有初级版本和进阶版本,和高级版本。所谓初级版本, 是简单的把神经网络和人类语言或知识图谱整合, 进阶版本, 是具有一定符号推理能力的多模态网络, 而高级版本, 恰恰是和目前的类似这种高级形态的神经系统充分结合的通用智能系统

让我们看几个(假想)例子:

(1)小样本的疾病检测系统

假设让你设置一个新冠检测系统,来检测病毒样本的照片是不是新冠病毒,一个方法是来提供大量病毒照片, 训练一个“新冠识别” 模型, 但是, 你没那么多数据,另一个方法呢?就是神经符号的方案, 你找一个知识图谱,它告诉你, 新冠是由病毒的形状, 比如具有皇冠型的外壳, 和针状的尖刺, 那么这些就可以被用来初始化已经能够识别这些特征的网络, 组合起来, 在其上建立一个and逻辑, 来识别新冠

(2) 懂得人类规则的服务机器人

虽然你有大量的能够进行一般对话的自然系统, 但是设定一个特定领域的服务机器人并不简单, 这个时候你可以把神经符号框架拿上来,通过设定领域常识和规则, 并且让它的行为,比如走路避障, 拿东西, 都可以通过特定算子调用来解决。

4)神经符号主义对话

当然, 当下的神经符号系统一般仅仅进阶到二级阶段, 而且经常被做大模型的流派diss, 因为随着的发生,越来越多的工作把知识预训练和神经网络结合到一起,像是一个具备了很强范化能力的知识图谱, 从而使得单纯使用知识本体的系统显得过时和蠢笨。

但是,实际上神经符号系统依据具有一些知识预训练系统所不具备的优点,或者

(1)领域知识加入更灵活,编辑成本更低

大型语言模型的范化能力来自于他们经过大量日常语言训练, 但是领域知识是稀缺的, 缺乏数据, 更缺乏公开数据, 如果用专门的领域知识“小数据“ 进行训练, 就会造成之前大量日常语言样本学习的知识发生遗忘,这使得直接在大模型插入领域知识不是那么简单, 而且重新训练成本高

chatgpt依据什么建立神经元网络 神经符号对话chatgpt

(2)推理过程更加严谨,容易与真实世界结合, 相比之下, 依然缺少一定量的与真实世界中的真假概念

如同之前文章讨论的,语言里学到的知识经常是真假边界模糊的, 同时大模型又没有在真实世界生活过, 造成他们输出的可信度比较低, 这在准确性要求严格的医学等领域就比较难应用

这些不足恰好可以被神经符号系统所弥补和解决, 由此看来, 在特定领域里使用神经符号系统其实还是很香的。

当然, 既然大模型发展到这个阶段,神经符号的很多优点确实已经被大模型所替代, 且更加灵活, 大模型已经学到了大量的可用结构和人类符号 , 所以神经符号系统也不能仅仅是像以前那么玩, 而必然的要借力于大模型

这种结合的优势, 一个是在神经符号的提取, 一个是神经符号的操作, 这些被预先定义的规则, 可以通过大模型进行生成, 操作过程本身,可以由大模型的算子给出, 而它所操作的下游算子,则依然可以由传统方法定义

从大模型到神经符号的另一路径, 是反过来, 思考大模型既然具有一些人类基本的人类系统二思维, 那么它的内部是不是包含了符号和结构本身, 如果是,它们在哪里?它们是不是可以被操作和编辑的?

假如上述问题都得到肯定答案,那么一定程度,神经符号系统已经被蕴含在大模型内部。

首先,我们知道和图网络有某种内在的对应关系。另一方面, 已经有一些工作, 想办法把里的显式知识给挖出来

in

这篇文章试图通过定位里和特定知识对应的“神经元” 来定位知识, 并且通过一定方法编辑和改造这些知识, 而且居然确实在的FFN层, 找到了这样的神经元,且命名为 。

这个工作厉害的地方在于, 如果上述假设成立,我们每次给模型增加新知识, 就不用重新训练模型, 而是进行局部更新。如果这部分工作都是正确的,这就几乎把反过来当做了一个知识图谱来用。

如果我们有一天能够完全定位里的知识分布, 那么大模型就白盒化了, 从而具备神经符号系统的全部优势, 这时候强调是大模型还是神经符号系统,就失去了意义, 因为它们最终成为了一颗硬币的两面(波粒二象性), 就如同人脑一样,它既是神经网络,又具备一个完全的符号能力。

323AI导航网发布

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...