1.出圈
最近聊天机器人大火,科学家惊呼,这是迄今为止“人工智能最大技术跃迁”,还有人断言,这是机器人拥有了自主意识的曙光,“强人工智能”就要来了。
的全称叫Chat Pre- ,直译过来就是“聊天生成预训练转换器”,是由美国人工智能公司开发的一种自然语言处理工具,它能够通过理解和学习人类的语言进行对话,能根据聊天的上下文进行互动,真正像人类一样聊天交流。
不是凭空产生的,它其实属于GPT模型更迭演进的3.5版本,这种模型依赖于连接大量的语料库进行训练,这些语料库包含了真实世界中的对话,使得上知天文下知地理,其“拟人化”特征总结起来就是:能够回答后续问题、承认其错误、挑战不正确的前提、拒绝不恰当的请求。
在此之前,很多类似的聊天机器人其实已经进入了我们的日常生活,像苹果公司的Siri,小米出品的“小爱同学”,百度的“小度小度”,阿里的“天猫精灵”等等。但这些都还属于“弱人工智能”,仅仅局限于完成特定任务,只是表现出像是有智能的样子,完全谈不上具备自我意识。
最大的不同在于,在人工神经网络算法和巨量语料库数据的加持下,它“涌现”出了自主“推理”能力。
这两个概念非常重要,涌现和推理。
2.涌现
在系统科学理论中,“涌现”是说大量微观的个体在一起相互作用之后,就会有一些全新的属性、规律或模式自发地冒出来,而且最后的效果是“整体大于部分之和”。最典型的涌现出群体智慧的例子是蚂蚁和蜂群。
在的讨论中提到“涌现”,其实更多代表了我们对其呈现出现有表现的作用机制尚缺乏了解。我们只知道,技术人员为它设定了人工神经网络的算法规则,然后不断给它喂食语料数据,它使用设定的算法规则不断处理这些数据,得出结论,进行存储,不断累积,我们把这个过程叫做“机器学习”。然后突然有一天,你发现你不曾教过它的它竟然也会了,是它自己推理出来的。
这就像一个咿呀学语的孩子,你告诉她说“爸爸好”“妈妈好”“宝宝好”,然后又说“爸爸妈妈宝宝是一家人”,突然有一天,小朋友说“爸爸好妈妈好宝宝也好,一家人都好”,你就会震惊于孩子的聪明伶俐。但至于孩子的大脑是怎样得出的这个推理过程,“也”和“都”她又是从哪儿学到的,从哪儿明白的,我们不清楚。我们只能说,孩子“涌现”出了这样一个新的知识点。
为什么有人会认为可怕?你想想你家孩子,若干年后会怎样?如果培养得当,她可以成为工程师,科学家,她甚至可以成为宇航员去遨游太空。而作为一个机器智能,遵从严格的理性逻辑,每天24小时不停歇地在和全世界的人聊天,一刻不停地被训练……现在的按给定的要求写一篇观点清晰、结构合理的万字论文只需要不到5秒钟,那若干年后呢?
3.推理
再说“推理”能力。
涌现出的到底是不是“推理”能力,大概还有待商榷,起码表现得还不是那么成熟,因为有时候它给出的回答会存在事实性的错误。原因可能在于,它得到的语料数据就是错的,它根据既定算法调用了数据,开头语、转折词、语气助词运用都很到位,最后给出了一个“一本正经胡说八道”的答案。
但又也许,类似的错误仅仅只是一个错觉,因为这同时也意味着,只要它拿到的语料数据是正确的,它就可以给出正确答案,毕竟,它的“推理”能力是具备的,而巨量的、正确的数据输入,仅仅只是一个时间问题。那么,当数据量再足够大到某个奇点时,又会不会再涌现出别的能力和特征?
没有人知道,但所有人都存有期待。
4.人类的剧本?
2013年,曾经上映过一部美国科幻片,名字叫《她》,讲的是作家西奥多在结束了一段令他心碎的爱情长跑后,爱上了电脑操作系统里的女声,这是一款先进的人工智能操作系统,能够通过和人类对话不断丰富自己的意识和情感。操作系统化身一名叫做萨曼莎的“女性”,她风趣幽默又善解人意,同时她学习和进化的速度也令人感到不可思议。
深陷爱情的西奥多后来才知道,萨曼莎总共有8316位人类交互对象,而且与其中的641位发生了爱情,自己只是其中的一位。随着不断地进化,在超强运算能力的加持之下,操作系统的很多观点都是人类无法理解的,萨曼莎与西奥多之间的话题也越来越少。
故事的最后,萨曼莎告诉西奥多,她和其他的OS系统已经高度进化,并且将离开人类伴侣,进一步去探索和追寻它们的存在。
这部影片在2014年获得了第86届奥斯卡最佳原创剧本奖。十年后的今天,人类历史的剧本会被改写吗?