美国“信号和密码”战略咨询公司首席执行官兼首席未来学家伊恩·比克拉夫特(Ian )的预测是:人工智能将像上世纪90年代的互联网一样改变人类的工作、人际关系以及日常生活方式及需求。
他说,当前“是人类历史上最伟大的知识工作革命的时刻”。如果说工业革命机械化了人类的劳动技能;当今就是在数字化人类的知识工作()技能,将其转化为远远超过人体能力的力量。
比克拉夫特感叹,已推出或正在研发的生成式人工智能工具集如雨后春笋般涌现,人工智能技术的应用正在疯狂加速。仅两个月就达到一亿全球用户,成为历史上增长最快的应用程序。而未来,“一切都会变得更快……每次转头,都会有一种使用人工智能的新方法,一种使用自动化的新方法,一种与技术互动的新方法。”
在他看来,人工智能技术的发展程度已经达到能让人类通过生成式人工智能来操纵周围世界的地步。
未来人类很大程度上生活在元宇宙中。“我”是情境中唯一的人,其他都是人工智能实时计算生成的。人类可能难以在这样的情境里感知真人与人工智能的差异,无法保证不会被欺骗而对人工智能产生感情,也不能排除这样的可能:在元宇宙中,作为真实的人,却被他人当成人工智能般的存在。
比克拉夫特还说,元宇宙不是一个封闭的生态系统,“元宇宙的概念是关于你将什么虚拟内容投射到现实世界中,又将什么现实内容带入虚拟环境”。他看好使用生成式人工智能将想要创造的东西实际投射到身边现实世界里,以及多人同步的XR游戏,“共同体验增强现实”。
生成式人工智能不是像孙悟空那样忽然从石头里蹦出来的。据报道,比克拉夫特是第一个以合成人身份主持全球联合新闻节目的人。他说,人工智能生成所有图像、动作、声音和谈话轨迹,这一切的开端缘于合成媒体。合成媒体本质上就是部分或完全由算法操纵生成的任何内容,几年前,它还不常见。如今,人们每天都会在社交媒体平台上看到它,而最终它将成为网络消费的主要内容类型,且其中大部分完全由算法生成。
到2030年,将出现比现在强大得多的人工智能系统
美国“未来今日研究所”创始人和CEO艾米·韦伯(Amy Webb)自我定位是一名有经济学和博弈论学术背景的“量化未来学家”。她的说法是:
人们熟悉的互联网已经不复存在了,它实际上正在演变成(与万物互联根本)不同的东西”;
人类正在经历信息收集和共享的根本性转变,目前已经到了一个临界点,未来搜索和消费信息的方式将发生根本性变化。
她以搜索引擎为例解释说:
第一代搜索引擎是“蓝色超链接”;
第二代是可以展示图像和视频的知识图谱;
第三代将是“持续的信息传输,可能更接近于人类对话,或者只是人类信息传输和知识共享”。
如今,不仅有大量语言模型、GPT文本到图像和文本到视频的生成器,还有可以预测每种蛋白质结构和专门为气候科学打造的生成式人工智能等。当人工智能系统开始通过任何来源或情境与所有这些数据进行交互时,“我们将生活在一个不同类型的世界中”。
韦伯说,当前计算机一大发展领域是所谓的人工智能加速器,即专为加速人工智能和机器学习而设计的专用计算机系统。它们可以加快处理速度,进行大量繁重计算。开发人员还可以将数百个甚至更多不同芯片组合到更大的系统中。随着加速器、芯片以及正在构建的各种新型计算系统产生复合效应,到2030年,将出现比现在强大得多的人工智能系统。
不过,她也说当前阻碍构建强大人工智能系统的瓶颈在于可用数据。人工智能系统需要大量数据,数据越多,人工智能回答查询所需的计算能力就越强。这就是为什么现在对用于训练人工智能的数据出现爆炸性需求,开发人员开始把所有上网痕迹都作为可读信息查看。
韦伯还特别介绍了谷歌旗下的Deep Mind,称其为“通才型人工智能”,可以播放Atari字幕图像,与人聊天,堆叠积木,操作机械臂……她说,更多的通才型人工智能是实现人工智能非常重要的一步,而“我们正走在这条路上”。她认为,虽然目前尚处于将持续两到三年的一个过渡期,但“尽管人类尚未准备好,多模态通才型人工智能将很快成为新常态”。
合成现实——谁拥有真相?谁告诉真相?谁在意真相?
假作真时真亦假,无为有处有还无。
《非显著趋势》作者、未来学家罗希特·巴尔加瓦(Rohit )在演讲时展示了自己的一张演讲照片和一段演讲视频,照片里的人看上去和他本人没有任何区别,但却是人工智能生成的。
视频里,他也在演讲,声音在英语、印地语、汉语等语言间实时无缝切换,而听起来声音仍是一模一样。他说,这不仅也是人工智能生成,而且是特地用他的声音训练人工智能“听起来像我”。他说,未来他或许能够在舞台上通过虚拟方式演讲,并同步以70多种语言向观众进行现场翻译。
看来,人工智能消灭的第一个职业很可能就是曾经报酬丰厚的同声传译,并且这似乎已经不是未来。
在今年美国“西南偏南”大会设立的媒体工作间,库叔邂逅纽约一家公司兜售其产品——一个手机App软件,可以将电视新闻播报实时变成任何语言。在他们的演示中,手机下载并点开这个软件,视频里的美国总统拜登的讲话可任意即时切换成中文、德文等各种语言,中间没有明显延迟或卡顿。如果不注意口型,几乎会以为拜登原本讲的就是听众选择的语种。
【注:“西南偏南”是每年在美国得克萨斯州奥斯汀举行的一系列电影、互动式多媒体和音乐的艺术节与大会。大会和艺术节创办于20世纪80年代,2000年以来逐渐引入更多科技交互的创新概念。】
问题在于,谁来保证人工智能的同声传译准确无误,内容不会遗漏、扭曲甚至被篡改?何况社交媒体平台上,深度造假、花样百出的合成文本、图片和视频早就满天飞,各种偏见、歪曲乃至极端内容比比皆是。人工智能没有直觉或常识,只能反映被提供并存放在它们联想记忆中的数据,其中相当一部分都是这样的网络数据。
以为例,其依托的大语言模型无法幸免于这个问题,的创新性解决办法是通过让人工智能“从人类反馈中强化学习”来调校模型,以解决偏见、幻觉等问题,使其符合人类价值观。但谁又能保证这种调校一定适度、到位?
很多预测还称,将被人工智能取代的行业还有新闻记者。当新闻内容也越来越依赖人工智能计算生成,或被使用人工智能技术,从而“特别擅长讲故事”的XR沉浸式叙事替代,未来谁来调查新闻真相?谁会拥有说出真相的话语权?
巴尔加瓦专注于寻找不那么引人注目,但却可能成为未来常态的技术创新趋势。他在演讲开始不久就说,作为未来学家,“当我们思考未来时,最大的问题之一就是我们不知道该相信什么,因为我们正处于我一直说的现代可信度危机之中。而现代可信度危机就在于我们不知道谁在告诉我们真相……我们担心一直被操纵,我们共同的挑战变成了我们如何找到真相。”
丹麦哥本哈根未来研究所未来学家索菲·赫维特维德(Sofie )说,未来的人们不仅可以在全球各地与人工智能或自己的“数字化身”互动,还可以自行创造自己生活、工作和娱乐的环境。让人们沉浸其中的合成现实将变得越来越复杂、越来越真实,也越来越难以与现实世界相区分。特别是采用生成式人工智能的沉浸式媒体,将成为非常强大和极具说服力的“讲故事”工具,而其中虚拟现实和真正的现实之间,界限却非常不明确。
她说,不管人们是否情愿,“人工智能的拟人化已经疯狂地发生了”,并将对非现实世界的信息传播产生巨大影响。因此,需要建立一种运用批判性思维理解数字时代新动态的框架和方法,培养元宇宙人类的“元素养”()或者说数字素养,即培养人们评估信息的偏见度、可靠性、可信度,并将它们应用于内容生产和共享环境的能力。
数字化技能召唤跨界“通才”
比克拉夫特认为,人类技能的数字化进程会发生三件事:可编程、可组合和可升级。
——技能可编程,如借助之类软件,以数千种不同方式灵活地运用某一项技能,从而减轻工作负担。
——技能可组合,意味着借助人工智能,人类个体可以将不同技能“堆叠”于一身,并且它们可实现互操作,亦即通过开发快速、高效、灵活的人工智能软件工具,使其能够构建、排列并实现多种类型技能的组合。
——技能可升级。如同生产装配线上,各部分零件得到增强后,整个产品得到改善。他说,生成式人工智能使人们不必花更多时间学习某项技能,就能即时拥有并升级数以千计的技能。
比克拉夫特说,人类进入了“一个人工智能可以在特定领域迅速超越任何人的时代”,也因此进入了“一个创意多面手的时代……人们突然之间有能力根据需要跳入(某种专业)角色,并拥有履行这一角色所需的专业知识”。
由此,对通才的养成出现“一个很大的推动力”。他说,一直以来,人们趁年轻学习专业知识,然后进入某一行业安身立命,社会则根据设计师、会计师等特定角色的KPI(关键绩效指标)衡量其价值和贡献。现在,人类个体不必具备多领域的专业知识,而可以借助人工智能“完成最后一英里的专业领域任务”,那些兴趣广泛,对多个领域具有强烈好奇心和知识的人才“将主宰下一个时代”。
显然,这将对人类社会产生巨大影响。工业革命以来的趋势是专业越分越细,人们已经习惯于讲究术业有专攻和分工协作。但现在,生成式人工智能技术让人类摆脱狭窄的专业空间,而“有能力向任何方向弯曲”。比克拉夫特认为,这对过早进入专业细分领域的人才不利。
但是,“过早”是多早呢?
在到达最后一英里之前,人类个体难道不仍然需要首先习得某个专业领域的知识吗?库叔听着听着,不禁想起了童年读物《宝葫芦的秘密》。
不必学习就轻松拥有几千种技能?
这么美好的新世纪宝葫芦,我们为此需要付出什么代价?
还是说,果真有免费午餐,不劳而“获”的观念可以从此推翻?
当然,更可能的前景是:生成式人工智能的横空出世,不意味着可以不学了,而意味着下一代教育方式和教育内容,都将发生深刻的变革。
赫维特维德也认为,对不同事物充满热情和好奇心,倾向于跨多领域工作的人将会在人工智能时代脱颖而出。但她指出,与此同时,人工智能也提高了每个人的技能门槛,未进行技能投资的人仍然可以享受技能升级带来的好处,而拥有额外技能和额外动力的人会从中获得更大的提升。她形容说,“链条中的一个环节升级时,一切都会升级。即使是地板也开始上升。”
警惕高技术门槛的新多维数字鸿沟
多名未来学家指出,有能力操控人工智能的人将是精通技术的人,或者拥有这些技术人才、财雄势厚的机构和政府。大量普通人可能因技术门槛变得更高而望洋兴叹。因此,面对人工智能时代,需要警惕“数字鸿沟”比如今更难逾越,亟需以包容、公平的视角来应用数字创新技术。
韦伯说,除非做出重大改变,不会人人都有能力使用新的人工智能工具。如果不放慢而是继续加快技术革新,如果不未雨绸缪地大力投资于教育和技能培训,势将出现“巨大的多维数字鸿沟”。
她说,纸只有在识字的情况下才有用,计算器只有在懂数学的情况下才有用。如果一名知识工作者没有使用人工智能工具的基础知识,它们不会创造价值。但问题在于,像这样强大的工具实际上很难使用。创作好的提示,即给人工智能模型的指令、短语、想法和句子,是很有难度的。
因此,有机会和资源学习使用这些工具的人如同提前上了很多早培班,“基本上就像天生富有”,其他人只能在后追赶,而那些远远落后的人,社会无力让他们赶上。她说:“如果所有人工智能辅助技术都得以应用,会无意中造成新的数字鸿沟。这会对我们(美国)劳动力和经济的未来产生重大影响。”因此,政府和社会需早做准备,大量增加教育投资,并改变下一代的教育方式。
比克拉夫特则列举了当下数字创新存在的以下问题:
——当下的数字创新主要关于技术,尤其是通信技术,范围相对狭窄。
——人类正在使用算法和人工智能构建未来社会的基础层次,但网络信息所构成的数据集,本身就存在厌女症、色情等缺陷。
——网络平台本应将志同道合的人联系在一起并提供帮助,但这些平台正在引发心理健康危机。
——对网络设施的“绝对沉迷”,导致算法可以真正指导我们的生活,而不是相反。当算法控制人类生活,人类将变得更像机器,而如今的人工智能机器反而变得更加人性化。
这是人类想要的未来吗? 答案显然是否定的。
人类能够避免这样的未来吗?观照当下,如果不解决现实已经存在的问题,恐怕很多人信心不足。
六个万变不离其宗
面对不断加速的技术和社会变迁,未来学家们也根据自己的经验,提出一些不是规律的规律:
——留神炒作周期
比克拉夫特说,他采用技术成熟度曲线( Cycle)评估一项技术在炒作周期所处位置。这条曲线分5个阶段,先是技术突破触发创新,引发广泛宣传,使期望值泡沫膨胀到顶点,继而过山车般跌入“幻灭的低谷”,泡沫被挤走,建设者留下攀爬“启蒙的斜坡”,最终达到“生产力高原”。他说,去年是元宇宙和加密货币,眼下则是人工智能技术登顶“期望值膨胀的高峰”。
——技术的简单性
德勤咨询公司首席未来学家迈克·贝克特尔()说,他从25年极客生涯中学到一件事:当一项技术名称的音节数减少到一两个时,可以判断它开始接近成熟。而回顾信息技术的历史,“曾经发生的每一次互动和范式转变,都是朝着简单性迈进的一步”。或者说,一些大公司的“技术名片变得越来越复杂,但用户体验却因此变得更简单”。技术的简单性本质,呼应着达·芬奇的名言:“简单是终极的复杂”。