酷玩实验室作品
首发于微信号 酷玩实验室
微信ID:
1886年4月,美国芝加哥,为了反对每天10小时、12小时,甚至14小时的强制劳动,25万人参与了那场由国际工人联合会组织的大游行。
随着游行继续,当地政府和商业俱乐部急忙增加警力、加购枪支。进入5月摩擦升级,有人向警察群中扔炸弹,当地警察向罢工人群开火……
这场以多人流血死亡为代价的斗争,虽然最终被镇压,却给世界留下深远影响。毕竟,全天下的工人都想做人,而不是牛马或者机器。从此,全球各地工人为了8小时工作而发起的运动,此起彼伏。
1889年7月,由恩格斯领导的“第二国际”在巴黎的代表大会上,通过了决议,从1890年开始,每年5月1日为国际劳动节。
又到了一年一度的劳动节了。这个来自于劳资斗争的节日,可以说从1890年直到今天,既让人感觉治愈,又感觉致郁。
尤其是在这样的AI“大脑”以天为单位快速进化的当下,虽然体力工人暂时还算安全,脑力工人的焦虑却与日俱增。
而今天,酷玩想告诉所有脑力工作的家人们一个“好消息”,体力工人的焦虑马上也要变大了!
因为,机器飞升速度加快了。
这并非是级别的机器人横空出世,而是整个机器人产业进入到“量变引起质变”的关键期了。
不论你有没有做好迎接未来的心理准备,暂且先放下人族的偏见,顺着机器视角看一眼未来……
01
蹒跚稚子,长势惊人
2021年12月,位于英国的 Arts 公司发布了人类有史以来最像人的机器人Ameca。其细微到略显夸张的眼神、表情和丰富的肢体语言能力,让其在推特和引起一阵轰动。
注意!这是现实中的机器人!不是演习!
在它的视频下方甚至有网友评论说,它比扎克伯格的面部表情还多。由此,Ameca的拟人水平由此可见一斑。
去年11月,Ameca就将其语言系统接入了-3,它甚至能很好的用沉默思考的表情来度过为其提供答案的时间窗口,并且将的答案与表情和肢体语言完美融合在一起。
他们团队已经在4月将Ameca接入-4,人类理想中的陪伴人形机器人似乎就在眼前。
机器人的突破还不止于此。
在2022年的特斯拉AI日上,科技狂人马斯克首次公开展示了其最新的人形机器人产品“擎天柱”。
虽然很多人都嘲笑它行动迟缓,运动水平甚至不如2010年的波士顿动力,最后还要人装在架子上推出来。
但是在今年3月的特斯拉投资者日上,“擎天柱”发生了惊人的进化。它不但行动稳健,甚至非常有恶趣味地去修理另一台“擎天柱”。
更为夸张的是,马斯克在2022年的AI日上表示,未来特斯拉量产的机器人预计售价将少于2万美元。这甚至不到降价前特斯拉的一半。
试想一下,如果马斯克的“擎天柱”再升级一下,配合未来和微软的,再配合上Ameca的“颜艺”。我们普通打工人不就完全没有生存空间了吗?科幻电影里面的智械危机是不是就在眼前?
而当我们审视近十年来在机器人领域的主要技术跨越,会发现智能机器人的爆火主要驱动因素不完全来自于原理性的突破,反而很多来自于智能机器人在硬件和软件在应用层面突破导致的进步。
以广大果粉们最熟悉的为例,2012年,仅仅搭载120万像素的前置摄像头和800万像素的后置摄像头,没有面部识别功能也没有光学变焦能力。
相比之下,2022年的 14,集成了两个1200万像素后置摄像头和一个1200万像素前置摄像头。前置摄像头拥有面部识别和自动对焦能力,后置摄像头有光学变焦能力。
虽然这样对比有点揶揄,但依旧展现出了同一个厂商十年间,同等价位、相近重量下,可安装的传感器在性能、成本和重量控制上实现飞跃。
智能传感器也有类似进步,十多年前,一个激光雷达价格是数十万美元,所以即使有人想量产机器人完全不敢想象使用高级激光雷达。
但是2020年激光雷达鼻祖公司发布了的激光雷达,售价仅为100美元。2023年,览沃公司发布360°混合固态激光雷达Mid-360价格甚至可以低到3999元。
价格的雪崩让机器人批量使用高等级激光雷达成为可能。而这还不算传感器在性能、重量和散热方面的进步。
回想一下,作为等等党的你等了几年终于等到了可以用官价买到最新显卡时候的意气风发。现在机器人产业也等到了可以用低价买到高精度传感器的时代。
但是高精传感器的升级仅仅是硬件升级的一部分,横亘在机器人发展最难的部分长期以来还是落在对搜集到信息的处理能力方向。而这方就要感谢机器人可用芯片升级了。
首先芯片的升级还是体现在算力的直观提升上。我们还是回到,2012年的A6芯片是一颗采用三星32 纳米工艺制造,单核最大频率1.3GHz的32位双核芯片,并搭配有一个3核GPU。芯片适配1GB -1066 RAM,图形运算速度是0.03万亿次浮点运算。
而最新上采用的苹果A16芯片则是一颗4纳米芯片。其CPU采用64 位六核CPU,单大核最大频率为3.46GHz;GPU则是5核。内存已升级为。芯片内置的16个内核的针对深度学习专门设计神经拟态芯片NPU每秒可进行17万亿次运算。
可以说当年的A6和现在的A16之间在信息处理能力方面差距简直是小汽车和宇宙飞船的速度差距一样。
机器人也是类似原理,虽然特斯拉等机器人厂商没有具体公布其核心芯片相关性能参数,但是参考手机等其他智能产品,以及对比十年前和现在机器人厂商放出的识别物品效果的视频。我们就能很直观的感受到,机器人硬件在无论是视频信息处理还是对于物体识别方面信息处理效率的巨大提升。
廉价高算力芯片的普及是近十年来人工智能以及人工智能衍生物的爆发的一个重要原因,但是单纯靠算力的提高不能完全解释人工智能产品能够快速融入我们生活的原因。
现在养育一个“机器小孩”的各项成本都大幅降低了。
不仅如此,“机器小孩”长大之后,不仅“脑子”更好使,“饭量”也变小了。
02
脑子变大,饭量变小
其实,机器人的“脑子”好使,“饭量”变小,是同步进行的——芯片架构的升级。
还是从我们触手可及的手机入手,如果我们回想早期智能机时代,我们会发现,当年炒作最厉害的话题是CPU性能,之后是谈论图形处理能力尤其是GPU性能的提升。
首次将人工智能和手机高端芯片联系起来是2017年,当年华为余承东发布的华为麒麟970 首次在芯片上集成了NPU。同月苹果也发布了自己首款集成了NPU的高端芯片A11。
此后基于人工智能需求专门设计硬件架构的神经拟态芯片NPU成为了高端手机芯片以及人工智能芯片的重要组成部分。
那么为什么需要一个NPU呢?为什么CPU和GPU不够呢?
传统CPU设计是基于通用设计理念,主要是专注功能处理的芯片,是为串行指令处理而设计。
简单来说,CPU就像一个可以很快记住并解决一连串有逻辑联系问题的人。但是在由于设计的取舍,如果我们要给他在同时解决一大堆1+1=2的时候,他每次都要依次阅读1+1这个题目,然后再计算出等于2,然后再阅读下一道题目。
而GPU则是擅长并行计算,可以同时处理更多短链运算。
它虽然在解决长串首尾相连问题的时候不如CPU,但是它可以同时计算很多个1+1=2。这使得GPU比CPU更适合处理类似图形计算之类的计算密集型任务。
2011年提出了利用大规模神经网络进行图像识别的技术路径,标志着深度学习技术的崛起。但是深度学习对于并行计算的要求是当时CPU和GPU都难以完全满足的。
所以针对深度学习的计算需求,包括可编程门电路FPGA、专用集成电路ASIC、分担CPU算力的中央处理器分散处理单元DPU以及一类设计参考人体神经突触结构的ASIC的NPU走上了时代需求的前列。而NPU可能是其中最具颠覆性的一类芯片。
NPU相比于CPU和GPU,NPU并不参考经典的冯诺依曼架构,不将程序指令存储器和数据存储器合并在一起。而是参考人脑神经结构进行设计。在脑神经网络中存储和处理是一体化的,都是通过突触权重来体现,而NPU模拟了这个过程。
可以说“脑子”更好使。
相比之下,采用传统冯诺依曼架构的芯片,就不可避免地受到存储和处理分离式结构的制约,效率更低。这也是专门设计人工智能芯片能够对传统芯片有一定先天优势的物理原因。
那么它还有什么好处呢?那就是节省能耗,就是“饭量”变小。
近年来的生物实验反复证明,机器连接动物脑神经进行包括机器学习和自然语言分析效果极好,例如:ICLR 2021 上曾发布过一篇论文“Can a Fruit Fly Learn Word ?”。
在实验中,研究者们“黑”进了果蝇的神经网络并测试了其自然语言分析能力。
结果发现果蝇大脑的自然语言分析表现略优于常见的GloVe 、模型,而仅仅落后BERT3.5%。而且测试结果显示果蝇大脑只需要更短的训练时间和更小的内存就能达到和上述模型类似的效果。
苍蝇还是好用啊
这显然显示了生物大脑在自然语言分析在内的机器学习方向具有更高的效率。而这种对资源的更高效利用意味着,采用高等级智能的人工智能和智能机器人将会有更广阔的使用图景。
毕竟谁也不希望自己未来的机器人,100kg里面有50kg是用在散热系统,或者机器人隔五分钟就要去充一次电,这岂不是一个纯纯的饭桶。
硬件的发展为智能机器人发展创造了一半的物质基础,那另一半是什么呢?软件和数据。这可以视为机器人的“教育体系”。
理论上说,机器人,可以根据社会需要,出厂就设定为某领域的高级技工。
从某种意义上来说,限制机器人和人工智能在现阶段大规模普及的限制有很大一部分是源于数据的限制。
以最近爆火的来说,去年引发关注的gpt-3模型有1750 亿个参数需要 800GB 来存储,它还配备了一个570 GB 的大规模文本语料库。虽然公司没有公布gpt-4模型细节,但我们可以想见,作为基于同一技术路径的升级版,它不太可能比gpt-3小。
想象一下,一个机器人,光和你说话就要背着1.4TB的数据包,然后每次说话还需要特别高等级硬件进行高速运算分析,从而找出合适的回答。然后它还要需要处理除了说话以外的事务。
那这个机器人软硬件成本将会非常恐怖。
我们似乎只有联网来进行云处理?
但是看看我们云服务的价格,再估计一下现在支持完全云信息交换的网速对应的网费,似乎把机器人的数据都放在云端也不是现阶段一个可以接受的选项。
所以强化学习成为人工智能本地化最重要的基石之一。
强化学习这个概念提出时间非常早,1954年,著名科学家明斯基在其论文中就提出了首次提出“强化”和“强化学习”的概念和术语。但长期以来,强化学习的模式被监督学习所掩盖。
2013年随着发表了利用强化学习玩Atari游戏的论文,强化学习重新走上了正轨, 2015年宣布基于强化学习的AI攻克了人类智慧的堡垒——围棋。
我们普通人第一次普遍接触强化学习相关新闻就是的阿尔法狗。当年基于“深度学习+强化学习”的阿尔法狗在2016年击败了李世石,之后在2017年击败了现b站知名up主“八冠王”柯洁。这件事是人类人工智能历史的里程碑,也标志着强化学习路径实现阶段性成熟。
强化学习的基本逻辑就像人训练一只猴子做事情一样,进行强化学习的机器会基于环境给予的奖励或惩罚的刺激进行总结,逐步形成对刺激的预期,从而产生能获得最大利益的习惯性行为。
强化学习的本质是实现“自动决策”。机器会在没有任何指导、标签的情况下,自主尝试行为,得到一个有明确对错的结果,然后通过不断地调整,实现算法持续优化。
这一点在阿尔法狗的进化上体现的十分明显,经过一年自我对弈和强化学习,2017年对战柯洁的阿尔法狗对弈所需要的计算量仅为对阵李世石时的1/10。对弈时从需要多机运行升级为只需要一台计算机。而到了阿尔法狗 Zero版本,仅仅40天的自我学习,通过单一神经网络,实现了对打败柯洁的版本实现100:0 的碾压胜利。
现在强化学习已在包括汽车自动驾驶、机器人智能化以及其他方向的AI训练上展现出了强大的实力。
但是强化学习并没有解决一个事情,那就是当训练需要和环境接触的机器时候,我们需要复现物理场景。这在普通训练的时候就还好,但当你需要复现发生小概率事故的时候,头就大了。
很多小概率事件是天时地利人和的综合结果,缺一不可。但是正常情况下我们训练一万小时也不一定遇得到一次。而且很多时候需要复现的场景比较特殊,很难低成本反复出现。
但这种事件尤其是事故后果都很严重,比如汽车出现小概率事故是会要人命的,机器人出小概率事故可能会伤人乃至死人。我们需要怎么处理呢?
客观来说,这已经不单纯是技术问题,其实是一个伦理问题。
03
伦理之枷,逐步打开
关注机器伦理,尤其关注智能驾驶的朋友,可能会想起一个概念叫数字孪生。
这个概念是由美国教授迈克尔·格里夫斯在2002年提出的,其核心理念就是通过重构镜像现实世界到数字世界,通过仿真来模拟包括老化在内的产品全生命周期过程。
该理念首先被应用于NASA的航天器设计和实验中,现在已经被广泛应用于包括汽车设计、生产优化、航空航天等多个维度。
通过数字孪生,在有足够数据的前提下,厂商可以基于数据模拟产品和周围环境状态。在理想状态下,设计人员甚至可以通过一键调参的方式,显著提高小概率事件在虚拟世界中的出现频率。
这样可以让软件在对抗性环境里面高强度强化学习,以快速解决得到最优解,并且减少为此显卡消耗和电费。同时,也减少伦理难题出现。
在这方面跟进最快的高科技企业还是特斯拉,2011年特斯拉就设立了“设计工作室”,赋予其产品“数字孪生”能力。
特斯拉公司宣称,其每一辆车和未来的每一个机器人都会有数字孪生体。公司可以利用从汽车传感器收集并上传到云端的数据,对其每辆汽车以及未来的机器人的状态进行数字模拟。
当然理论上特斯拉也可以进一步通过收集到的环境数据还原一些场景进行专门的对抗性训练。所以我们也就能理解一些敏感部门的人员不能买特斯拉的原因。
当然除了特斯拉,包括英伟达、IBM、微软等国际巨头,也在各自领域推进包括机器人数字孪生在内的各类数字孪生项目。
近几年乘着智能驾驶的风潮包括国内机器人数字孪生项目在内的数字孪生产业有了一定发展,但是整体而言我国依旧慢于美国。
根据&估算美国2021年智能机器人市场规模达到了69亿美元,到2026年预计会达到353亿美元。年复合增长达到38.6%。
这是什么概念呢?
上一个以这个速度腾飞的产业叫智能手机:2006-2011年的美国智能手机市场规模五年内从51.9扩大到275亿美元。
而现在智能手机已经成为我们居家出门必不可少的随身装备了。
国内追赶势头也十分明显。
根据艾瑞咨询相关报告,2020年,中国智能机器人市场规模达到168亿元。尽管受疫情等因素和整体经济形势相对低迷的影响,2021年国内市场规模依旧突破250亿元。
2022年在国内疫情的反复爆发客观上也促进了多领域对无人化、自动化、智能化生产力及劳动力的旺盛需求。根据预测,2025年中国智能机器人市场规模接近千亿元。
而且相比于前些年在工业机器人的大力投入,商用服务机器人为主营的企业已经成为国内市场最关注机器人投资方向。
在2018年至2022年第三季度的共有254家企业共计500起融资事件,融资总额达到840亿元。这其中60%的企业主营业务是商用服务机器人,远超工业机器人。
根据中国机器人网不完全统计,2023年一季度,中国机器人行业融资事件共50余起,融资金额在近亿元及以上级别的接近20起。
至于对智能机器人的追捧,首当其冲的是军方。
由于现代战争侦察和精确火力打击效率革命,密集部署的部队在火力下生存能力反而能降低了,所以以更少的兵力控制更大范围的分布式战争正在成为作战的刚需。
同时为了弥补感知能力和自身携带火力的不足,一方面军队需要更精准的应召火力支援;另一方面士兵们就需要更多的无人智能化装备。
使用智能化装备而非遥控装备的理由很简单,俄罗斯在叙利亚使用遥控无人战斗车的实践证明,即使仅仅是在电磁相对干净但是地形复杂的环境下,其“天王星-9”型无人坦克遥控距离就300米左右。
即使换装更先进的通信系统,考虑到成本问题,也不太可能让遥控武器在战场环境下获得质变。何况遥控本身并不能显著提高单个士兵对于周围环境的感知能力,甚至反而会因为需要分心而降低自身的感知能力。
所以出发后不管,甚至能识别敌我,并自主决策打击的智能化装备,是军用无人化装备未来必然的需求。这样士兵只需要处理关键信息,而同时可以实现用更少人感知更多空间的需求。
毕竟在现实世界里面像打英雄连一样打仗从来都是指挥员的梦想。而去年我国珠海航展的部分无人装备已经开始实现这个梦了。
智能机器人需求的第二个方面来自于服务行业。
智能服务机器人在近几年已经在包括酒店、餐厅、商场和银行等场景铺开使用。根据中美等国的市场报告,近年服务机器人的需求增长的主动力来源于人力成本上升和新冠疫情导致的无接触服务需求增加。
以酒店快递外卖运送机器人为例,由于外卖和快递业务在国内大规模发展,为了处理快递件一般大一点酒店的礼宾部需要至少平均至少会有一个白班和一个夜班的服务员处理外卖和快递,甚至在高峰期会有更多的服务员服务于外卖到房间的配送。
我们假设以某星级酒店基础员工的平均月工资在5000块钱,2个人工资加社保、住宿、用餐等费用,每个月就需要13000-14000元。再考虑到酒店的相关培训和离职成本,均摊下来可能要15000元左右一个月。
相比之下,网络上一个酒店服务机器人的价格基本很少超过20万元,甚至有些就六七万元一台,也就是说酒店一年乃至半年节约的工资就能买一台服务机器人,回本周期极短。
现在随着迎宾机器人、清洁机器人、以及极限环境机器人等产业发展,智能机器人正在以超乎想象的速度向下渗透。
第三个需求则是来自于工业方向。
4月中旬,有一个机器人过劳死的视频爆火网络,起因是在3月的一个美国机器人展上,一个智能搬运机器人在连续搬运货物20多小时后突然倒地不起,似乎过劳死了一样。但这恰恰是工业机器人最新的发展。
夭寿了,机器人过劳死了!
随着智能机器人的发展,工业机器人不仅在生产线这种单调环境中展现出了强大的工业生产能力。同时随着智能化水平的提高和电池容量的提高,智能机器人也在厂房、库房等相对复杂环境中展现出了较高的适应能力。
现在我国虽然在人形工业智能机器人上有所落后,但是自动导向车(AGV)在工业仓储物流的应用已经铺开。相关网站上购买一台零售的无人搬运叉车AGV大约10到20万,智能搬运平板车AGV甚至只要五六万一台。低成本智能化的仓储物流的物质条件已经逐步成熟。
在工业产线上,人机协同的协作机器人在焊接、装配、喷涂、磨抛等机器人新产品低成本趋势也非常明显,部分小型协作工业机器人采购价格已经达到两万人民币一台。
总的来说,智能机器人在多场景应用落地趋势已经确定。并且,在如此多“早期”应用领域,基本都不会发生伦理问题。
尾声
人口退潮,机器善后
1886年4月,美国芝加哥,为了反对每天10小时、12小时,甚至14小时的强制劳动,25万人参与了那场由国际工人联合会组织的大游行。
处在当时的那一代美国工人是痛苦的,但是走出“摩登时代”之后的美国,又是幸运的。
全球公认的,论智商、论勤奋,美国人都远远不如中国人。那么,为什么美国人的生活水平、工作环境却远远高于中国人?
抛开主义,不得不承认,美国这个国家,一直执着于先进生产力。因为,坚船利炮,可横扫刀耕火种的土著。
美国的恶,不值一哂。但是,美国对生产力的追求,却已经形成全球最大的“内卷”,我们除了全力角逐,别无二路。
机器,是用来取代人的。所以,机器人普及取代的工作,一定会对于机器人产业发展所带来的新工作。这一点无论怎么洗,也是洗不动的。
最近几年大学生毕业人数增加,就业承压,也是客观事实。
但是,中国人口素质结构已经发生巨大变化。体力劳动人口正在快速退潮,脑力人口快速登场。然而,国家的产业迭代速度不能完全匹配劳动市场需求。
尤其是当下我们国内高端芯片制成依旧受限于美国,英伟达A100或者以上级别的通用GPU对华出口受到限制,5G产业链国产化尚未完成。国内14纳米芯片制程量产刚刚起步。高端传感器尤其是民用传感器依旧对外国产品有较高依赖。去年11月30日,发布,中国大陆是四个IP地址禁止访问的地区之一。
这些都严重限制了我们高端产业获取的速度。
因此,在高端产业取胜之前,依靠体力、劳动密集的中低端产业还必须有所保留。毕竟,蛋糕如何分的问题永远没有保住多大蛋糕重要。
如果从“产业公地”角度来看,中低端产业是中高端产业的土壤、根系,一旦流失,再难回来。
今年工业和信息化部、教育部、公安部等十七部门联合发布了《“机器人﹢”应用行动实施方案》。
该方案明确了未来智能机器人十大应用重点领域,分别是经济发展领域的制造业、农业、建筑、能源、商贸物流,社会民生领域的医疗健康、养老服务、教育、商业社区服务、安全应急和极限环境应用。
根据计划,2025年,制造业机器人密度预计将较2020年实现翻番,服务机器人、特种机器人行业应用深度和广度显著提升。
中国需要机器人,善后、加固后方。
挣钱的方式明明有很多,除了靠体力和脑力,还能靠技术、金融、能源、矿产……当然,还可以靠军工。
就像丁院士面对柴静的经典反问:中国人,是不是人?
难道中国人就只能以最温良的姿态从事最繁重的体力和脑力劳动,就不能像美国人一样手持先进生产力,成为全球各个领域资源、技术的拥有者和管理者?
所以,我们看到中国一方面发展机器人巩固后方,一方面也在积极走向前方,比如调停沙特伊朗矛盾、人民币结算大宗能源、法德加大在华投资、中国军工出海……
这个时代,地球正在越来越小,留给守旧者的时间和空间,都越来越少了。
每次谈到机器人,大家总是习惯调侃“血肉苦弱,机器飞升”,恰恰说明我们前进的速度,还是不够快。
我们需要更快地重构劳动的意义和形式,让更多人能在劳动中找到快乐!
酷玩实验室整理编辑