这是我有嘉宾发布的第883篇文章
6200字 | 阅读 15 分钟
虽然去年5月云知声CEO黄伟说不做芯片就必死无疑的悲壮态度,在外界看来过于夸张,但大部分语音交互AI公司也都一致认为“软硬兼施”是一条必走之路。
随着深度学习和AI应用的不断演进,近两年人工智能行业对AI芯片的需求开始显现。加之中美贸易摩擦中芯片概念的普及,2018年的造芯热情被彻底点燃。尤其是在语音交互行业,正在上演一场声势浩荡的跨界造芯梦———去年5月到6月间,就有超过五家公司对外发布AI语音芯片,而在今年1月,又有两家公司涌入到了AI语音芯片市场,推动战火升级。
然而,就在这些公司摩拳擦掌大把烧钱时,市场中却出现了两种声音。一是中国在芯片领域的确有弯道超车的机会。二是芯片门槛较高,并非是门外汉都能够把玩的游戏。
基于此,一时间所有的问题都指向了这些跨界造芯的人工智能公司:为什么是他们最先涌入芯片行业?他们是否有能力造出芯片?究竟是实热还是虚火?AI芯片争夺的真的是芯片本身吗?
国内语音交互人工智能公司纷纷涉入造芯行列,是否意味着语音交互技术走到了下一个竞争拐点?
在过去的一年里,一场声势浩荡的造芯梦在语音交互行业上演。去年5月到6月间,出门问问、云知声、Rokid分别发布了自己的AI语音芯片。今年1月,思必驰、猎豹移动旗下AI公司猎户星空也涌入到了AI语音芯片市场。一时间,外界定论,国内AI语音定制芯片时代似乎已然到来。
但在业内人的眼中,一切还为时尚早。带着团队专攻国内语音技术的思必驰创始人高始兴认为,AI语音芯片的确可以优化价格、优化成本、优化效率,但定制芯片最重要的一点就是要达到量产数。“这就相当于人工智能公司要有极强的预判能力,在AI语音芯片还没有制作出来时,就要确定谁会用它,怎么用它。”高始兴说。
即使出门问问切入到AI语音芯片领域占有时间优势,并自称已完成了量产,但公司研发副总裁李勤也不得不承认,“真正的竞争在于芯片做出来后,看谁能最快落地到产品中”。
可是,就在无法确认跨界造芯的尽头,究竟是弯道超车的机会,还是一场虚假繁荣时,钱已经烧起来了,前赴后继的追赶者纷勇踏至。
谁逼AI公司跨界造芯?
2017年的“双十一”,阿里的天猫精灵做了一次高额补贴活动。在发起的一波价格营销战中,只售99元的智能音箱在“双十一”当天销售突破了百万台,让业内看到了国内语音交互市场的潜力。这种由亚马逊引起的压低价格走量的行为,迅速在国内形成了连锁反应。去年,市场研究机构 总结,2018年全球智能音箱的销量有望突破一亿大关,智能音箱市场达到这一里程碑的速度,比过去10年推出其他消费电子产品都要快。“当设备的需求量刚起来时,连带着与语音相关的芯片商机开始在全球发酵。”高始兴说。
语音芯片的发展经历了三个阶段——通用芯片、专用芯片和AI芯片。其中,以通用主控芯片方案为主的代表芯片厂商是联发科。在行业逐渐转向使用专用语音芯片后,代表厂商有联发科、科胜讯。
而随着智能家居市场逐渐成熟后,这些芯片在实际应用场景中暴露出了明显的不足,更多公司开始通过软硬件结合的方式自研芯片,进一步确立自己在行业中的地位。比如思必驰、出门问问、云知声,最终决定研发AI芯片时,更多的想法是建立自己的语音核心算法优势。
虽然高通、英伟达、启明、华为、MTK研发的通用芯片为了满足行业通用性,将自身的计算能力打造的更强,但英伟达GPU是针对游戏设计的芯片,高通的SoC是针对手机设计的芯片,而智能终端对芯片的需求却区别于传统的PC、手机。比如,智能家居、智能音响一般都是通电的,它对芯片的功耗要求更多的是性价比,对跨平台、跨系统性、安全性和对边缘计算的要求也存在独特性。
以智能电视来说,在未来人机交互的发展过程,用户更多的是直接对着电视做语音层面的操作和搜索,此时人机交互必须要加入远场的信号处理。而信号处理的算法非常复杂,要加入本地的唤醒、本地的识别放在芯片上。但目前,大部分电视的主芯片都是ARM架构——ARM架构是一处理器架构,由于节能的特点,ARM处理器非常适用于移动通讯领域——电视收到音视频数据后,要做音频解码、视频解码,以及显示的加速和边缘增强。所以高负载的ARM芯片上无法再承受语言的算法,否则会影响电视芯片的寿命。在这种情况下,为了完成语音交互功能,电视厂商通常需要承受更高的成本,额外再加一块芯片。
有时候计算力并不是越高越好,而是需要针对特定场景做特定优化,寻找性价比最高的方案。 “与其杀鸡用牛刀,能针对这一市场需求做一颗集成度高、功耗低、成本低,又能够实现算法和终端完美结合的AI语音芯片,其市场潜力可想而知。”李勤说。
深聪智能执行副总裁吴耿源在半导体行业有二十多年的工作经验,2002年加入到了中芯国际。去年2月,思必驰与中芯国际共同注资成立上海深聪半导体有限责任公司后,吴耿源也涉入了思必驰的业务中。他发现,思必驰决定跨界造芯,还有一个重要的原因是解决不了“鸡生蛋,还是蛋生鸡的问题” 。思必驰CTO周伟达对吴耿源指出的这一问题颇有认同感。
“软件和硬件公司合作一款芯片,到底谁要配合谁?”周伟达说,芯片厂商能完成思必驰交付的算力、内存和带宽,但功耗和成本在此基础上却难以保证。为解决这一问题,芯片厂商必须将原有芯片架构重新拆开后再打包,甚至要单独为思必驰设计一款AI算法的模块。这种情况下,一是思必驰将核心竞争力的算法全部告诉给芯片厂商,二是芯片厂商按照思必驰做软件的思维一步步做设计。“然而,谁也不愿意迈出这步。”周伟达说。
在进退两难间,思必驰没有“最优选择”,只能动用几千万人民币的资金做软硬件的结合。他们想向市场证明,抛开以前既有的架构,基于自己核心的算法在硬件上做更好的优化,也可以满足智能设备功耗及成本的需求。
一场造梦的开端
思必驰最早提出造芯的是周伟达。2016年,他提出跨界造芯意见后,思必驰的内部犹豫不决,因为他们无法预判未来的市场空间究竟有多大。而周伟达在一次开会时撂下话说:“我们想不想做成世界级的大公司,(如果)想做,今天就得下这个决定。”
在周伟达看来,AI领域中下一个大公司是属于真正做AI芯片的。从过往行业经验看,类似于PC时代的硬件成就了英特尔,软件成就了微软。移动互联网时代的硬件成就了ARM,软件成就了安卓、谷歌。而在如今的AI时代,也必然会诞生出AI软件大公司和AI芯片大公司,以及做平台应用的大公司。但究竟谁是这一类公司,现在还未形成定局。“思必驰不一定就能把握住这次机会,但这个事情一定要做。” 周伟达说。
思必驰之前犹豫不决的原因不无道理。没有经验,就会四处碰壁。在思必驰为期一年多的市场调研里,几乎与芯片厂商可合作的各种可能性都做了尝试。
最初,思必驰的想法很简单。与IP方合作,将思必驰的算法直接移植到他们的处理器上。但很快发现,不对硬件做优化,直接进行算法的移植,效率并没有明显的提升。
之后,思必驰又开始接触芯片外包设计公司。思必驰提出需求,芯片外公司按需求设计芯片。但由于思必驰与外包公司采用的是项目制,在芯片制成后,后续的优化又无法继续进行。“而高效能的芯片,最重要的却是后续的优化。”周伟达说。
与外包公司的合作也行不通,下一步思必驰只能与芯片设计公司进行更深度的合作。但考虑到核心算法知识产权问题,思必驰最终决定与芯片厂商合资成立一家独立的公司来打造芯片。Rokid的造芯方式也是如此。这样做的原因,一方面是芯片厂商对IP的验证以及芯片的生产具备足够的经验。另一方面是芯片代工厂有完善的上下游产业链,对芯片的量产、良率、订货和交货周期都有很好的保障。
去年3月,思必驰完成了芯片制作,当年8月完成了流片。在集成电路设计领域,流片是指设计完电路以后,先生产几十片,供测试用。如果测试通过,就开始大规模生产。今年1月初,思必驰向外界发布了一款面向家居、移动、车载、办公场景的AI语音芯片,并自称这款芯片相较于传统通用芯片有10倍以上的效率提升。
与思必驰有同样梦想和需求的还有出门问问。但出门问问是造芯的“保守派”,他们对跨界造芯的态度是轻量级参与和继续观望。用李勤的话说,人工智能创业公司做硬件相当需要勇气,在资本市场收缩和行业势头不明朗的情况下,贸然启动高额的资金,无疑是一种风险。而与芯片厂商合作,风险不高、投入不大,同时又不会错过软件与硬件结合的潮流。
确定目标后,出门问问开始接触大量的芯片厂商。但是在出门问问创始人李志飞的调研中发现,可合作的厂商中能够生产出带NPU的AI芯片却寥寥无几。NPU是神经网络处理器,负责处理涉及神经网络算法和机器学习的海量数据,体积、能耗都小,是大型处理器的百分之一左右。直到李志飞知道杭州国芯科技即将推出集成NPU的AI芯片后,出门问问决定与杭州国芯科技合作研发芯片。双方达成共识,出门问问将自己的算法芯片做优化,直接移植在国芯的芯片上进行快速量产。去年5月,在出门问问新品发布会上,李志飞推出了这款AI语音芯片模组。
无论是在出门问问的发布会,还是行业通稿里,“量产”二字始终在被强调。在李勤看来,在市场竞争如此激烈的情况下,时间就是优势。“虽然竞争对手也在宣布做AI语音芯片,但是它们并没有更快的完成量产。这也意味着我们有先发优势进入市场,有更多的时间去打磨产品。” 李勤说。
做AI芯片的方式有三种,第一种是PPT造芯——他们所重视的领域并非是技术研发,而是如何撰写一份与芯片沾边的、制作精良的PPT。第二种是合作的方式。第三种才是自主研发。在业内共识中,一块芯片产业需要数年的技术沉淀,因为一条生产线就涉及大约50多个行业,2000-5000道工序。但从思必驰、出门问问、云知声、Rokid等发布的造芯时间表来看,芯片从研发到量产都只用了两年的时间,甚至几个月。这也引起了外界对他们的质疑:过快的生产周期,会出现弊端吗?
吴耿源并不否认造芯的难度。但他也认为,对于思必驰来说,第一颗造芯的目的是验证软件与硬件融合的想法。“我们专注核心IP与软件定义芯片的整体架构,其他非核心流程则采取外包,由此,造芯的环节和时间就会大大压缩”。
需求背后的“底气不足”
定制芯片的一个原则,就是要有足够的量产数来支撑成本的回收。据了解,这些人工智能创业公司在芯片定制化过程中都投入了上千万人民币的成本。而要达到收支平衡,卖出的终端设备数至少也要达到千万级别的数量。
“半导体的难度不仅是技术,更在于烧钱的能力”。吴耿源说。过去一颗40nm的芯片,流片需要1000万到2000万人民币。28nm的芯片,费用就是之前的两倍。到了14nm,它的费用就是之前的五倍。“而这并非最先进的技术。从目前看,苹果已经在量产7nm的芯片,而它涉及的费用又有几家公司能玩得起。”
在周伟达看来,有时未必烧钱就能烧出一个成品,芯片还是个“一锤子”买卖的行业。它的风险在于,芯片设计好样片时没有任何实物可以做验证,都是在软件平台上做仿真,谁也不知道样片出来后到底能不能成功。如果在设计细节中存在一个错误,或导出一个风险,出来的芯片成品很可能就是一块板砖。“我们也在担心,做硬件不是思必驰的强项,芯片行业又有很多的标准化。行业内一些知名的世界大公司都做不好的情况下,思必驰能靠什么成功。”周伟达说。
但真正扎入到行业后,周伟达发现,之前的担心早了,调试验证芯片还仅仅是行业的第一步。后面如何去提升芯片的性能,提升芯片的良率,应市场需求随时生产,甚至如何做业务推广都是非常专业的。“芯片行业还涉及到账期,既是一个非常复杂又是形成一定规则的行业,与软件行业差距甚远。” 周伟达说。
基于此,思必驰最终决定与芯片公司合作,大家各做各自擅长的。“包括市场中的其他人工智能公司,造芯的方式也都是轻量级的选手,现在还没有谁能真正的自己做芯片。”吴耿源说。
落地市场在B端
AI语音对专用芯片低功耗、降成本的需求毋庸置疑,但商业化落地才是更强的驱动力。
Rokid CEO祝铭明曾公开谈到了造芯的目的。他说,Rokid不是一家芯片公司,不是为做芯片而做芯片,也不靠芯片赚钱。Rokid更注重通过芯片来提供足够的算力,实现芯片与算法更好的匹配并降低成本,核心在于输出解决方案。而对于思必驰、出门问问来说,造芯的意义是更好地服务B端客户。
出门问问在2012年刚刚进入到智能语音行业时,专注做智能可穿戴、智能车载和智能家居的C端产品。但在2018年后,无论从出门问问发布的产品,还是从市场战略上看,无不显示其正在发力B端市场。比如,推出了智能反欺诈解决方案、智能语音对话机器人、AI语音芯片产品。而出门问问这一转变,也意味着人工智能创业公司单做C端市场所面临的困局,以及面对现实进行“两条腿走路”的商业模式探索。
李勤承认,国内智能音箱市场群雄割据,巨头不惜以补贴的方式“赔本赚吆喝”,抢占入口。在价格差异过大的情况下,C端产品差异化的优势无从体现,这种局面对于创业公司过于被动。反而出门问问在B端市场能释放更大的技术价值。在他看来,出门问问最大的优势在于语音技术的自由掌控和通过C端场景建立的软硬结合能力。“如果将算法与芯片结合起来,为B端客户提供一个简单的接口,让用户去做集成,出门问问开发B端项目的应用场景就会更加容易。”李勤坦言。越来越多的人工智能公司今年在挖掘穿戴与智能家居领域,为了拓宽销售面,芯片是必须涉足的,这有利于人工智能公司在垂直领域建立优势。
思必驰的想法与出门问问如出一辙。自思必驰创立以来,一直深扎B端市场,并在智能车载后装市场占有一席之地——在思必驰官方网站上,提到公司目前在国内智能车载后装市场占有率第一,约为70%的市场份额。但此次思必驰发布的这款芯片并不是专门针对车载领域的语音芯片,更多的是赋予智能家居的语音能力。在外界看来,思必驰有意做深做透智能家居领域。
据业内人了解,去年云知声大部分的收入来自于白电业务,但其中很大部分的利润被采购的芯片厂商吞噬了。而此次云知声发布的芯片也是在针对白电领域,其中的用意不乏是在降低白电芯片模组的利润。这一点也从云知声创始人黄伟的口述中得到了证实。他曾公开表示,在芯片面向市场后,公司可以将语音技术以外的能力同步写进芯片中。这意味着公司可以提供更高性价比的解决方案,从而解决当前制约智能语音交互硬件普及的两大难题:技术与成本。
但是,“大家都抢占同一个领域,就看谁能生产出AI杀手级的应用”,周伟达总结说。他还表示,思必驰对AI芯片是保持开放的态度。可以输出给方案商,也可以以IP授权的方式提供给传统芯片厂商,“落地、满足市场需求对于我们是第一位的”。
进入2019年,AI技术的场景落地和商用化会成为一个更迫切的议题。同时对于他们来说,也是AI芯片应该量产的一年。但在芯片领域面前,这些人工智能创业公司仍保持着敬畏之心。就如周伟达所说,“我们现阶段只是完成了做AI语音芯片的一小步,离成功还为时尚早”。李勤则强调,“我们还是先看这个市场砸下去的回声有多大,再决定是否要深耕下去”。
的确,作为门外汉的人工智能创业公司跨界到专业度极高的芯片领域就相当于蒙眼狂奔。他们所面临的是真正解决现实场景的实际痛点,才能被行业与市场认可。而这一场战役才刚刚拉开序幕。
但谁也不可否认,趁着高通、英伟达、英特尔等芯片巨头还没有进入语音芯片市场,此时也恰是他们野蛮生长的好时机。
文 | 鱼多多
编辑 | 赵建凯