前言
我自己是做算法出身,喜欢思考问题的本质。比如,AI对于我们整个工业视觉的本质到底是什么。今天我把这个不仅是我的思考,也是阿丘科技整个公司的思考分享给大家,供大家参考。但这也是一个比较初级的思考,要在以后的实践中深化。
今天我讲的内容包含三个主题,第一个是讲AI对于工业视觉到底意味着什么;第二个是我们从整个技术发展周期的角度,看一看工业AI视觉发展的一个大的路线图;第三个,也是必不可少的,要谈一谈我们对未来的一个趋势和观点的一些理解。
AI重构工业视觉
首先我们来看第一个主题,AI对于工业视觉算法到底有什么价值?
传统算法,我用两个关键词来定义它,就是定量分析和特征工程。特征工程就是算不同的特征。后面做判断的时候,一堆的if···else···是传统算法的一个特点。那AI这块的话大家已经很了解了,基于样本来做学习。我认为这是很本质的一个东西。
从功能角度出发,工业视觉算法可分为图像处理、定位、检测、测量、识别;从算法实现技术角度就是分类、识别、测量三大类。本质上,工业视觉算法将会或正在被AI全部重构,当然如果涉及到测量技术,即定量分析技术,传统算法依然不可或缺。
AI重构工业视觉算法的价值体现在以下 3 个方面:
1. 升维
AI通过升维来解决我们的一些复杂的分类和识别问题。包括复杂的背景、低对比度、柔性电子、一些强干扰。这些东西原来传统方法是没问题的,但是用AI的话,我觉得能更加好。这个点大家是能够肉眼可见的。后面第二点和第三点可能未必肉眼可见,但实际上是更关键的。
2. 简化、通用化
AI的一大优势是可以对算法问题做极度的抽象,抽象之后较为复杂的工业视觉问题就会变得比较简单,还有一个就是通用化。很多工业视觉里面比较复杂的算法问题,用两到三个比较通用的算法模块去训练数据,结果就出来了,并且这个指标还非常优秀。
3. 降本
大家听到这个东西好像有点反直觉,觉得AI对算力有要求,怎么还能降本?
我们举一个所有做传统算法的人都能够理解的一个例子。比如几何形状匹配,这个属于是整个机器视觉里面,传统算法绕不过的这样的一个算法,它需要设置非常多的参数。如果要用好,工程师需要理解几何匹配算法的基本原理、参数的物理含义,这需要较为专业的图像处理背景知识,门槛要求高。如果你理解不到位,可能定位的结果不是你想要的,或者达不到一个非常精准的效果。要做到这一点的话,是需要有图像处理算法背景的。所以说我原来做传统图像,就是我在原来东家的时候,我们带着底下的应用工程师都是硕士,这个成本是非常高的。
而我们用 AI 来做,比如说我们只是训练三、五个样本,甚至是一个样本,后面整个定位的精度跟效率都能够达到,甚至超过传统算法的精度。当然,整个鲁棒性肯定也比传统算法要好。那这样使用的成本就可以降到非常低。
这个解决方案的范畴是什么?可以说是视觉系统范畴,也可以说是视觉检测设备范畴。叫解决方案,就是基于算法叠加的一个完整方案。我们内部的观点是,AI不仅仅是一个技术模块,它是一种新的认知框架,本质上是基于数据和标准驱动的。首先我们要有这么一个认知框架,再往下看我们的视觉解决方案,核心包括哪些部分?对这些部分意味着是什么?
我抽取了里面三个核心部分:
1. 成像模组
成像模组就是整个机器视觉里面成像的所有器件跟方案,它背后的基本原理是什么?是基于传统算法,而传统算法基于定量分析。所以说我们基于传统算法来做的成像方案,它的底层要求是“定量、高对比度”。
这个会导致什么样的后果?比如说我们要检测一个表面很多不同类型的缺陷。为了要达到高对比度的定量,可能我需要打若干场光。可能每场光对应两种缺陷,后面才能把这些缺陷完整的呈现出来,成像的效率非常低。
而我们进入AI时代以后,我们对成像的要求变了,只要是目视可见即可。当前基于传统算法构建的成像方案,本质上还只是一个“光电转换器”。只是把一个关键信号转换成图像,距离我们所说的眼睛差的太远了。当然,我们也不可能一步跃成眼睛,那至少阶段性的目标我们是不是可以达到摄影水准。这个做到了有什么好处呢?一方面是能够提高我们整个成像的空间效率,更重要的是它简化了、通用化了、成本低了。这是很重要的一个根本变化。
2. 算法模组
客观来说,当前落地的各种项目,成本还是比较高的。根源在于大部分只是把AI作为一个算法模块,把它叠加到原来的体系里面,就比较低效。后续算法方案一定要以AI为中心,打通和优化整个计算流和数据流,这个才是最优的方式,能够提高训练推理效率、降低部署维护成本。
3. 自动化模组
在传统算法时代,由于成像有很多约束,自动化能发挥的作用非常受限。AI其实是打破了算法的束缚,本质上也打破了我们成像的束缚。可以自动化帮我们拍图,各种“凹姿势”“摆造型”。只要能将缺陷拍清楚就可以,并不需要那么明亮的成像。如果这么来做的话,极大地降低了自动化复杂度,提高了自动化通用性。并且能够比较简单高效地解决产品异形、多型号小批量等成像难题。
从大的维度来看,工业视觉解决方案会按两个极端方向演进:
– 轻量级场景:更强调一体化,极致的简单易用,可能需要线上训练。
– 复杂场景:更强调通用化解决方案,包括:通用成像模组、通用大模型、通用自动化模组,降低全链路综合成本。
工业AI视觉进化论
任何技术导入都有它的一个生命周期,每个阶段有不同的特点。基于落地多个项目的思考,我们将AI工业视觉发展路径划分为三个阶段:早期市场时期(2019)、保龄球道时期(2024)、龙卷风时期(2029)。
– 2019年是AI工业视觉元年,意味着有相关的AI项目落地,即早期市场。阿丘也是在这一年开始逐步项目落地,我们的第一个落地项目是3C行业的模组外观检测。
– 自 2021年开始,AI逐步在各细分市场成为标配,该趋势将延续到2024年,即所谓的保龄球道时期。阿丘从2021年开始在结构件、模组、包装等众多细分市场批量落地。
– 预计在 2029年, AI 将在全域市场普及,即龙卷风时期。
这是一个大概的判断,时间周期有可能会早或晚,仅供大家参考。
我们首先来看一下早期市场有什么特点?
核心还属于是技术创新的一个时期。换句话说,AI这个东西在工业视觉里面到底能不能用,比较专业的说法就叫技术创新导向。
那么工业AI算法跟我们自然场景(比如人脸识别、自动驾驶)的技术到底有什么差别?一是小样本,大家知道缺陷是由非受控因素产生的,获取成本很高,所以需要小样本;二是高精度,包括尺寸小、对比度低、过检率和漏检率指标严格,特别是关键缺陷要达到零漏杀;三是低算力,本质上是由于工业产品对成本有约束。
正是基于这些洞察,我们构建了自主底层算法框架、上层算法工具,即大家耳熟能详的工业 AI 视觉软件平台AIDI。
在推AIDI的过程中,有两个比较有意思的点,在这里与大家分享下:
1、设备厂商甚至集成商大部分都有自研基础AI算法的冲动,基本都无疾而终。甚至这个公司可能只有五六个人,他也安排一个人来自研。核心原因就两个:一是有很多开源的框架;二是确实把这些数据拉到框架里充分跑一跑能看到不错的指标。但是真正上线时会受三个约束,即小样本、高精度、低算力。所以很多人可能做到后面无法突破这三个约束,慢慢地就悄无声息了。
通过和客户的交流和我个人的思考,我认为其实它是一个经济学问题,不是一个技术问题。我们在传统算法时代,用去做项目也能做一部分,但是大部分的系统和设备,还是一定要用专业的平台软件来做。在AI这个时代我认为也是一样的。能不能自研AI算法呢?我认为是比自研传统算法更难的。主要是三个方面:第一个方面,自然场景跟工业场景的问题特性有非常大的差别;第二个方面是AI算法的参数维度更多;第三个,要达到低算力,需要对算法做高性能优化,优化复杂度是非常高的。如果一个公司真的要自研AI算法,投入的强度要很高,要有很多工程师,所以我觉得最终它实际上是一个经济学问题。
总的来说,如果大家投入资源的强度足够,我认为也能够做一个至少能用的东西,但如果要做到更好,就看你有没有天花板足够高的研发人员。
2、有些人问我,做传统算法的视觉厂商来做AI算法是更容易还是更难?针对这个问题我还真是进行了深度的思考,这也是我想给大家分享的第二个点。其实我认为是更难,可能比一个完全初创的公司还更难。为什么?本质上AI算法和传统算法的架构和迭代方式完全不同,研发理念也是天壤之别。要从传统算法的方式切换到AI,我不是说没有可能,只是概率较小。
阿丘落地的第一个项目是3C模组外观检测,这个项目是有一定复杂度的。其中涉及注塑件、金属件等多种材料组合,产品异形,缺陷种类多达70余种、形态多变。 检测要求漏检率低于0.1%,过检率3%左右,以传统算法视角看来该项目基本无解。我们从方案到样机上线花了超过6个月的时间,在项目进行过程中,我们发现 POC指标和上线指标之间存在巨大鸿沟。为什么会有这个鸿沟?我认为主要有四个方面:
第一个就是对AI的认知。它到底能解决什么问题?不能解决什么问题?所谓AI是不论复杂度的,只要学习过的,再复杂也可以解决,没学习过的再简单也无法解决。
第二个是对需求边界的认知。AI本身无法分辨正确与错误,这意味着你给它错误的样本,它也会学习。从这个角度,他对标准是有很严格的要求的。
第三个是对数据的管理。核心主要是两个点,如何把握标注的标准以及如何筛选对迭代模型有信息量的数据。标注标准太严苛,成本太高;不够严苛,标准对AI来说又不明确。
最后一个是模型相关的问题。如何保证指标的稳定性和在产线间进行复制。比如,不同的产品型号该如何做到兼容。
为了解决这些问题,我们基于项目经验,提炼出了AI落地方法论,比较成熟的方法,就会成为AIDI产品功能的一个组成部分。
该阶段客户的特征:拥抱新技术、有痛点、有一定支付能力。我认为这三个特征缺一不可。这样来看,早期我们项目落地在3C行业是有其必然性的,因为以Apple为主驱动的3C供应链是最早拥抱新技术的行业之一。并且在3C供应链中,自动化程度最低的就在质检环节。
前几年疫情引起的人员受限等问题更加推动了检测自动化。由于检测问题的复杂性,传统算法时代实现检测自动化可能性非常小。当然也做了一些AOI,但实现的效果不太好,没有一个真正的解决方案。可能你上了一台设备,但还需要更多的人来维护这台设备。AI提供了全新的强力的技术手段,和更多的可能性!
早期市场阶段,我认为是找一些场景落地,后面到了保龄球道时期,一定是在细分市场。
这里面的一个焦点就是产品创新。从算法维度来看就是算法的标准化,包括工具链标准化。把前面说的那套落地方法论抽象成一套工具,集成到产品中,让大家更方便地使用。从解决方案维度,核心点在于创新简化。发掘AI特性,在提高检测性能的同时,简化成像、算法、自动化解决方案,缩短产品上市周期,降低产品生命周期综合成本。
该阶段客户的特征:有痛点且关注性价比。我们认为这个阶段还需要延续两到三年的时间。
下一个时期就是龙卷风时期,重点在于重构行业价值链。
该时期的前置条件是杀手级产品的出现,该杀手级产品把行业价值链卷一遍,在暴风过后,将会呈现新的价值链格局。比如,移动互联网时代的杀手级产品就是。视觉行业的杀手级产品是康耐视的,有了这个产品才定义了我们现在提到的很多术语。那AI时代的杀手级产品是什么?这个还是需要由市场来选择。
龙卷风时期的重要特征:大量“伪AI公司出现”。特别是传统视觉公司没有涉及AI也纷纷披上AI的外衣,因为大家都感知到暴风即将来临,想跟上风潮的同时又恐惧被暴风卷走。
演进趋势观点
最后我来分享下我们对未来3-5年AI演进趋势的一些观点。
第一个是算法方面:第一个是非监督,这个主要针对轻量级场景;第二个是大模型,前面提到对于复杂场景,大模型是最佳机会;最后一个是轻量化,即低算力,低成本是工业视觉永恒的关键维度。
第二个趋势属于解决方案。第一个核心还是简化和通用化,前面提到的成像、算法自动化都是属于简化、通用化。还有一个是全链路的成本优化。这是什么意思?一个行业要达到最大化普及,成本是很关键的一个因素。整个链条包括硬件、算力、开发成本、部署成本、维护成本,如何实现整体最低。
第三个我认为是整个行业大的趋势。未来五年左右,一定会出现杀手级产品。这个产品的出现靠能力,也要靠点运气,最终它是由市场筛选出来。整个行业将会因为这个杀手级产品重新洗牌。这个杀手级产品的出现将影响什么?我分享一下我个人的观点:第一个就是不了解AI的工程师可能将被淘汰。还有一个就是传统的视觉公司从业者能不能在大的图景里面创造价值,否则也会被淘汰。这个我们可以用时间来检验。
以上所有内容整理自
阿丘科技研发VP 钟克洪博士
于2023 北京大会演讲