ai智能自动生成视频软工具人工智能行业专题：大模型带来机器人变革

默认分类1年前 (2024)发布 admin

1,044 0 0

AMR机器人市场空间快速增长。

根据GGII数据，从全球维度来看，22年全球移动机器人市场规模约292亿，预计27年增长至1874亿元，对应22-27年CAGR为 45.07%；从国内维度来看，22年中国移动机器人市场规模约97亿元，预计27年增长至462亿元，对应22-27年CAGR为36.74%，市场规模快速增长。

软件和算法构筑竞争力核心壁垒。

在实际应用中，移动机器人通常以集群的方式系统完成特定任务；未来，成百上千台机器人规模化集群作业是发展的必然趋势，即逐步从单体智能向群体智能演进，软件和算法成为构筑核心竞争力的壁垒，例如统一环境下完成作业调度、找到全局最优方案提升集群机器人工作总效率等。我们认为随着行业应用场景的丰富和技术的发展，产品模块化、软件模块化将成为AMR发展的必然趋势。

英伟达等海外大厂发布AMR机器人方案。

英伟达专为机器人提供的集成式端到端解决方案（ ISAAC），用于部署全自主移动机器人（AMR），包含 ISACC SIM、ISACC 、 ISACC GEMs和ISACC APPs四个模块。开发者可通过ISACC SIM在仿真环境中完成世界和机器人的建模（包含描述传感器的标定信息和电机控制等），利用ISAAC GEMs完善机器人的软件主体，并在仿真平台完成算法的测试、训练，之后通过ISACC 部署到机器人本体进行现场实测。

多模态大模型赋能机器人。

主要体现为多模态感知和多模态交互。

1）多模态感知：通过多类型传感器的配合，机器人处理多个模态接收的信息，从而实现对文本、图像、视频、音频等模态信息的学习和理解；

2）多模态交互：用户可以同时使用语音、手势、文本等与机器人交互，同单模态交互相比，多模态交互具有减轻用户认知负担（交互更自然）、消除任务歧义（交互更准确）、降低环境干扰（交互更加鲁棒）等优势，使交互更加灵活和高效。未来，云端大模型泛化出基本能力，并把这部分“记忆”植入机器人边缘端（通过蒸馏等方式压缩模型大小），进而机器人本体可以将识别到的视觉、雷达、语音交互数据进行处理，并规划动作，完成反馈。

机器人作为国家战略新兴产业之一，是国家从制造大国发展成为制造强国的重要抓手，在当今国家制造业处于人口红利逐渐消失、产业迫切需要转型升级的背景下，提升产业智能化升级将助力企业提高制造效率，中国移动机器人市场规模快速增长。同时，叠加AI大模型（特别是多模态AI大模型）的赋能，移动机器人的能力有望大幅提升。

机器人分类与关键技术

移动机器人：可以在复杂环境下工作，具有自行组织、自主运行、自主规划的智能机器人，主要可以分为自主移动机器人（AMR）、关节型机器人、人机协作机器人等。

市场空间：根据GGII数据，从全球维度来看，22年全球移动机器人市场规模约292亿，预计27年增长至1874亿元，对应22-27年CAGR为45.07%；从国内维度来看，22年中国移动机器人市场规模约97亿元，预计27年增长至462亿元，对应22-27年CAGR为36.74%，市场规模快速增长。

移动机器人——自主移动机器人（AMR）：是一种能够独立理解环境并在环境中移动的机器人。AMR 与其前身自动导引车 (AGV) 不同，后者依赖于轨道或预定义路径，并且通常需要操作员监督。AMR 使用一组复杂的传感器、人工智能、机器学习和计算来进行路径规划，以解释和导航其环境，不受有线电源的束缚，具体的工作逻辑包括：a）分析收集到的信息；b）通过 3D 相机和 LiDAR 传感器捕获信息；c）根据他们的环境和总体使命做出推断；d）采取行动以实现最佳结果。

关键技术路径：1）容器化的SDK工具集——包含感知、导航软件堆栈；好用的开发环境，模拟工具；后续优化升级；2）边缘微服务器支撑—— 无线通信，安全设备，协作SLAM Fleet管理。

AMR技术核心——原来的划分

传统机械划分：1）基本围绕机械的控制、反馈两个步骤进行分解，缺乏信息流转脉络；2）任务定义、拆解和机器人运动代码生成由机器人工程师编写代码、调优和部署.

现代机器人公司划分：机器人公司会把的任务、动作、关节拆解的更细，关键在硬件层，操作系统单列。 AI目前应用在任务层的分解和动作生成，在一定程度上可以替代机器人工程师完成工作。

1）任务层：包括任务描述、任务分解与动作生成，目前主要有人工完成，LLMs在该层应用潜力巨大；

2）控制层：控制层包括规划（运动轨迹规划、实时速度调整、路径修正等）、控制（位置控制、力控制等）和建模（运动学模型、动力学模型、几何模型等），同时包括支持模块和端口。

3）操作系统层支持库：包括RT-、RT-等，以及操作系统（Linux、、RTX）和第三方支持库。

4）硬件层：包括伺服电机、相机/视觉、力传感器等。

AMR技术核心——架构

AMR本体能力：具备传感和智能路径规划，运动控制、安全和人机交互HMI，机器视觉和智能导航等能力，赋能制造业向柔性化、智能化发展。

云端交互任务处理：AMR本体通过网络（WIFI/以太）与云端计算中心交互，在云端完成数据分析，推理，模拟等工作，需要云端AI芯片支持（例如英伟达H100等）。

AMR架构组成：目前主要由控制系统、导航传感系统、驱动模块、安全监测模块、交互模块、通讯模块、动力模块（电池等）、执行机构（机械装置）组成，不同场景品类的机器人对配置要求不同。

AMR技术核心——硬件是基础

TMT零部件价值量持续提升：机器人硬件主要包括TMT零部件（控制系统相关硬件、导航传感器、驱动模块、通讯模块等）、电池（动力模块）、机械装置（执行机构等），随着定位导航、机器视觉、规划执行等环节对芯片需求的增长，以及激光雷达等新型传感器的应用，机器人中TMT零部件的价值量持续提升。

智能机器人的诞生，移动GPU嵌入AMR本体是发展趋势。未来，AI将走出计算机，进而影响外部世界（物理世界），机器人是AI最佳载体之一；随着智能机器人的发展，机器人传感器、执行器将同AI相结合，具备模拟（用于仿真的虚拟空间）、映射（实时地图创建能力）、自主（独立运行）等能力，需要强大的端侧算力支撑，移动GPU嵌入AMR本体是发展趋势。

AMR技术核心——软件、算法是核心

软件和算法构筑竞争力核心壁垒：在实际应用中，移动机器人通常以集群的方式系统完成特定任务；未来，成百上千台机器人规划化集群作业是发展的必然趋势，即逐步从单体智能向群体智能演进，软件和算法成为构筑核心竞争力的壁垒，例如统一环境下完成作业调度、找到全局最优方案提升集群机器人工作总效率等。我们认为随着行业应用场景的丰富和技术的发展，产品模块化、软件模块化将成为 AMR发展的必然趋势。

云边端各有算法、软件支撑：端侧（即机器人本体）软件、算法主要有ROS 2、地图规划算法、AI算法、样点算法等，支撑路径规划、障碍躲避、运动控制等功能；云侧（及边缘）软件、算法主要有集群管理算法、训练、远端推理、远端SLAM、数据分析算法等，支撑算力调度、机器人集群协作、数据分析等功能。目前，各头部厂商拥有自己的解决方案，技术路径随大模型的发展，快速迭代。

提供软件与开发工具平台：以Intel为例，其提供相应的开发工具和平台，使开发者可以快速、低成本地搭建、管理AMR机器人。

AMR核心——英伟达

ISAAC：专为机器人提供的集成式端到端解决方案，用于部署全自主移动机器人（AMR），包含ISACC SIM、ISACC 、 ISACC GEMs和ISACC APPs四个模块。开发者可通过ISACC SIM在仿真环境中完成世界和机器人的建模（包含描述传感器的标定信息和电机控制等），利用ISAAC GEMs完善机器人的软件主体，并在仿真平台完成算法的测试、训练，之后通过ISACC 部署到机器人本体进行现场实测。

ISAAC SIM：机器人仿真平台，可以进行环境和机器人的建模，算法的验证，强化学习，监督学习的模型训练等。

ISAAC Apps：提供基于ISAAC平台的参考应用程序；

ISAAC GEMs：预先构建的深度神经网络模型、算法、库、驱动程序和API，是机器人的算法功能模块，例如目标检测、机械臂控制、二维码检测、激光定位、视觉定位、3D重建等；

ai智能自动生成视频软工具人工智能行业专题：大模型带来机器人变革

ISAAC ：提供可视化的开发套件以及Debug的工具。

AMR核心——英伟达系列产品

英伟达是适用于自主机器和其他嵌入式应用的先进平台。该平台包括模组、用于加速软件的 SDK，以及传感器、SDK、服务和产品的生态系统；与其他Nvdia平台上使用的相同AI软件和云原生工作流兼容，并提供客户构建软件定义的自主机器所需的节能性能。

（模组）：包括GPU、CPU、内存、电源管理和高速接口等，不同性能、能效和外形规格的组合可满足各行业客户需要，其中包括 Orin系列、系列、 TX2系列和 Nano。

Orin系列：主要包括 AGX Orin、 Orin NX和 Orin Nano，算力分别为275、100、40 TOPs，体积逐步减小；

系列：主要包括 AGX 、 NX，可提供扩展的温度范围、防震和抗震规格，以及新的功能性安全能力；

TX2系列： TX2 NX与 Nano引脚和外形规格兼容，而 TX2、TX2 4GB和TX2i与最初的 TX2外形规格相同；

Nano系列： Nano模组是一款小巧的AI计算机，具备优越的性能和功耗，可满足运行现代AI工作负载、并行运行多个神经网络及同时处理来自多个高分辨率传感器的数据的需求。

AMR技术核心——特斯拉的FSD+Dojo

特斯拉AMR方案：特斯拉机器人边缘侧采用FSD芯片，训练侧采用Dojo的超算中心（自研芯片），两者通过终端软件平台交互。

自研Dojo方案：Dojo采用集群部署，每个有10个机柜（包含3000个D1芯片）；若以格点级布局来看，每个训练模组Dojo Tile（5*5个芯片）可以达到6组GPU服务器的性能，成本却少于单组GPU服务器，但Dojo方案的算力能效比略低于GPU方案。

FSD芯片：特斯拉自主设计的芯片，单芯片封装了60亿个晶体管，具备12个64位ARM内核、NPU和轻量级GPU，支持128位内存，算力强大，可以满足特斯拉机器人边缘测需要。

当前机器人价值链划分里面没有智能系统

机器人软硬件相互制约、相互促进：机器人是典型的机电软一体化产品，软件与硬件是相互限制又相互促进的矛盾体；边缘算力硬件将会制约机器人相关应用的发展，边缘算力硬件的突破使得机器人可以承载更强大的AI，同时机器人应用的发展会倒逼边缘算力硬件的提升。

缺少智能系统：当下的机器人智能停留在视觉（）阶段，机器人缺乏智能系统（即机器人的大脑）；在未来，在AI对机器人赋能的大背景下，机器人可以逐步理解物理世界，未来有可能向具身智能方向发展，智能系统对机器人的重要性愈发凸显。

巨变——从大模型到多模态

任务识别：大语言模型（LLM）赋能机器人语义理解，从传统的关键词语义识别，进化到可以理解人类复杂的语音命令；同时，通过预训练大模型将“记忆”移植到智能机器人终端，机器人具备理解任务的能力。

任务指令生成：进而拆分任务动作，生成应用层控制指令，并根据任务过程反馈修正动作。

多模态大模型赋能机器人：主要体现为多模态感知和多模态交互。

多模态感知：通过多类型传感器的配合，机器人处理多个模态接收的信息，从而实现对文本、图像、视频、音频等模态信息的学习和理解。

多模态交互：用户可以同时使用语音、手势、文本等与机器人交互，同单模态交互相比，多模态交互具有减轻用户认知负担（交互更自然）、消除任务歧义（交互更准确）、降低环境干扰（交互更加鲁棒）等优势，使交互更加灵活和高效。

巨变——从大模型到多模态

目前：云-网-端架构为主。由于机器人本体计算能力有限，需要通过强大的云端计算能力给机器人赋能。

“端”是机器人本体及本体自身的控制系统，嵌入式AI芯片逐步替代传统嵌入式芯片，机器人本体的智能性快速提升；

“网”主要指通过Wifi、5G及其他无线通信网络将机器人连接起来，实现机器人本体和云端大脑的连接；

“云”通过机器学习，不断进化，进而使前端机器人本体的智能随之提升。

未来：模型植入机器人本体。云端大模型泛化出基本能力，并把这部分“记忆”植入机器人边缘端（通过蒸馏等方式压缩模型大小），进而机器人本体可以将识别到的视觉、雷达、语音交互数据进行处理，并规划动作，完成反馈。

巨变—— RT2

RT-2：视觉-语言-动作（VLA）模型。传统模型（例如VLM、LLM）应用到机器人中，通常仅能解决机器人High-level 的问题，即解释命令并将其解析为单个短语，然后由单独的Low-level 执行，但Low-level 并不能从互联网规模的丰富语义中受益；谷歌采用VLM模型（使用PaLi-X和PaLM-E）为基座，并将机器人动作表示为类似语言模型中使用的离散的Token，使用机器人数据和互联网数据进行Co-Fine-Tune，进而得到视觉-语言-动作（VLA）模型——RT-2。

巨变—— RT2

符号理解、推理、人类识别等领域能力大幅提升。以VC-1、RT-1为基准，RT-2在符号理解、推理、人类识别等领域能力大幅提升，超越VC-1、RT-1等模型。

泛化能力大幅提升。以R3M、VC-1、RT-1、MOO为基准，在未见过物体、未见过背景、未见过环境等三个维度进行评测，RT-2性能表现相较于RT-1有翻倍提升，泛化能力出色。

国内机器人产业

国内机器人产业：机器人产业链上游包括核心零部件、配套零部件和软件系统开发，中游为机器人本体的生产及系统集成，目前主要集中在工业机器人和服务机器人领域，下游主要包括工业应用（汽车制造、家电制造、航空航天等）和服务应用（餐饮服务、酒店服务、医疗服务、物流服务等）；近两年一些做算法的软件公司借助海外大模型的风，开始自研垂直小模型，并供给下游终端厂。

创业公司情况：根据中国机器人网统计数据，2023年中国机器人行业共发生134起融资事件，其中近亿/过亿元级融资事件52起，2023 年融资金额总计为200亿元左右；2023年融资事件主要发生在工业机器人相关（37起左右）、医疗机器人（29起左右）、服务机器人（24起左右）、人形机器人（12起左右）等领域。

上市公司情况：目前上市公司以提供终端硬件为主，并逐步优化机器人软件（模型、算法等），提升机器人性能表现。

ai智能自动生成视频软工具人工智能行业专题：大模型带来机器人变革

工业机器人——海康机器人

海康机器人是面向全球的机器视觉和移动机器人产品及解决方案提供商。公司依托潜伏、移/重载、叉取和料箱四大硬件产品线和机器人调度系统RCS、智能仓储系统iWMS两大软件平台，重点覆盖汽车、新能源、3C电子、医药医疗、电商零售等细分领域客户，提供专业的智能物流解决方案。

海康机器人定位机器人产业链的中上游。公司以移动机器人的整机制造及机器人调度系统和智能仓储系统的研发为主，同时对大部分上游核心零部件进行自研，包括机器人主控制器、视觉传感器、电机驱动器、电源管理模块等。

工业机器人——海康机器人

海康机器人系统主要包括移动机器人本体、自动充换电系统、通讯系统、机器人调度系统和业务系统。

移动机器人本体：为系统的硬件核心，具备定位、导航和一定的自主决策能力，为适应不同的应用场景，通常有多种不同的结构形式，主要包括地盘、执行机构、传感器模块、通讯模块及动力模块；

通讯系统：主要负责机器人群体和机器人调度系统之间的无线通讯，一般以Wifi或5G讯号进行链接；

充换电系统：主要负责给机器人补充电能，有自主充电和自动换电两种模式；

调度系统：为整个系统的核心，主要负责将工厂的作业任务分配给合适的机器人，并负责整个机器人群体的交通调度；

业务系统：负责将工厂的需求指令转换为机器人的搬运指令，并下发给机器人调度系统。

工业机器人——宝信软件

保罗机器人：宝信软件继PLC自动化之后，推出宝罗机器人；以制造业全流程机器人应用融合5G技术，面向智能制造业提供一系列机器人产品、服务和方案。目前宝罗机器人已经应用到了冶炼、炼钢、热轧、冷轧各条业务线，同时覆盖智能巡检、高温炉前自动化等生产环节。

万台机器人有望落地：宝信软件与宝钢股份、马钢集团、太钢集团通过视频签署了《机器人实施框架合作协议》，八钢公司与宝信软件达成了宝罗上岗合作框架协议。宝武集团于 2022 年 3 月提出万名“宝罗”上岗计划，即中国宝武到 2026 年实现万台机器人落地。宝信软件推动万名“宝罗”上岗，同时未来所有的工业宝罗都将接入基于宝武工业互联网平台（由宝信软件支撑研发运营）打造的宝罗云平台，打开全新增量空间。

增资扩股上海图灵机器人：上海图灵机器人是工业机器人产品线最全的公司之一，主要产品包括1.5-500公斤负载的六轴工业机器人， 3-80公斤负载的SCARA工业机器人，以及3-20公斤负载的工业协作机器人；本次增资扩股，宝信软件旨在以国产机器人行业发展风口为契机，补强公司自身产业链缺失环节，形成自主高端工业机器人品牌，打破国际品牌对高端重载工业机器人市场的垄断。

工业机器人——九联科技

募投机器人研究院：2023年7月，公司发布《广东九联科技股份有限公司以简易程序向特定对象发行股票的预案》，募集资金投资特种机器人研究院；基于公司已有的嵌入式多媒体播放（解码）技术、WIFI 无线局域网技术、基于视觉定位的三轴机械运动技术、产品功能自动化测试技术等核心智能制造技术，对特种机器人所需的软硬件技术进行集成开发，对特种机器人模块加入新算法，对传感器等核心部件进行技术升级和定制化设计，实现特种机器人在特定环境、特定任务中实现更多的功能，抓取更多、更精确的数据。

同华谊信息合作化工领域机器人：23年4月，公司同华谊信息签署战略合作协议，推动双方在化工领域基于算力、框架、模型、应用等多个维度的联合研发、联合交付、联合推广的全面深入合作，加速赋能化工行业数字化发展；双方将在防爆机器人的研发及生产、销售进行深度合作。

工业机器人——北路智控

井下无人运输机器人：北路智控在23年10月“第二十届中国国际煤炭采矿技术交流及设备展览会”首次展示了井下无人运输机器人— —穿山甲。该款运输机器人深度融合5G、数字建模、无线通信、UWB精确定位、机器视觉、惯性导航等技术，采用全时四驱、双向行驶的独特设计和智能操作系统，实现对无卫星导航、空间狭小、防爆要求高、工况复杂条件下的井下环境360°全方位感知与障碍物识别，达到井下无人化物料运输的无人驾驶、路径规划与车路协同。同时，为满足矿方多样化需求，穿山甲可自由切换遥控驾驶、远程驾驶、自动驾驶等模式，按照预设的驾驶模式及路线规划，安全高效完成运输任务。

工业机器人——今天国际

AGV机器人全线布局，产品矩阵丰富：今天国际目前拥有叉取型AGV、定制属具型AGV、定制车体型AGV、潜伏顶升型AGV、背驮型 AGV、协作机器人，基本覆盖AGV全领域，产品矩阵丰富。

叉取型AGV：该系列AGV采用单舵轮形式的底盘结构，运动灵活稳定；应用场景广，可适用于地堆、不同高度的站台和多种货架类型；

定制属具型AGV：基于标准型叉车结构，定制不同属具类型，可适应于不同类型的货物搬运，如特殊的托盘尺寸、纸卷轴、箱式货物、双托盘搬运；

定制车体型AGV：定制化的车型结构，应用于有特殊要求的场景，如狭窄巷道或承载能力较弱的地面等；

潜伏顶升型AGV：标准化的差速驱动底盘结构，运动灵活，行走速度最高可达2m/s；搭配可定制化的顶升机构与对接平台；

背驮型AGV：不同形式的底盘结构，搭载不同类型的移载机构；可适用于多种站台，支持多种对接方式；

协作机器人：标准化的驱动底盘结构，运动灵活；行走速度最高可达1.7m/s，搭配可定制化的机械手；可以在协作区域内直接与设备或人进行交互、

服务机器人——萤石网络

萤石机器人业务表现优异，快速进入市场前列。公司2021年首次召开智能机器人新品发布会，扫地机器人RS1、儿童陪护机器人RK2 和儿童可视手表KW2正式发布，公司的智能服务机器人产品线全面铺开。公司陪伴机器人拥有基于视觉和听觉的环境感知能力及自主的运动能力，通过连接萤石物联云平台，能够提供个性化的儿童教育和安全陪伴服务；扫地机器人基于智能视觉算法能力，并融合了多维传感的感知、分析和理解。儿童陪护机器人在2021年天猫平台618购物节中排名同品类销量前十位。

海康分拆机器人业务，AI浪潮下萤石机器人业务可期。海康威视正在分拆其机器人创新业务子公司上市，结合当前AI在大模型带领下的突破性进展，无论是工业、消费级机器人均大有可为。萤石的消费场景有望率先接入更多AI能力。

服务机器人——萤石网络

萤石发布机器人新品，积极投入具身智能。公司近期发布两款采用具身智能理念研发的清洁服务机器人新品：AI扫拖宝 RS20 Pro，云视觉商用清洁机器人BS1。AI扫拖宝主要是面向C端家庭场景，具备AI智能融合避障+主动切毛滚刷等功能，能够智能识别超过65种障碍物，能够智能识别超过65种障碍物。云视觉商用清洁机器人，搭载了萤石自研的“多目视觉计算系统++”，可感知到场景中更多的数据。

本文仅供参考，不代表我们的任何投资建议。幻影视界整理分享的资料仅推荐阅读，用户获取的资料仅供个人学习，如需使用请参阅报告原文。

人工智能行业专题：大模型带来机器人变革–国信证券-31页.pdf

幻影视界行业报告资源库，每天分享实用资源。扫描下方二维码加入后，直接搜索下载，海量的历史资料随时查看、随意下载。