ai绿化软件 藏不住了!当红AI应用的背后就是TA

默认分类1年前 (2023)发布 admin
3,528 0
ChatGPT国内版

生成式AI有多火?周末出去喝杯咖啡,耳边有一半人在聊、文心一言。

打工人在热切地谈论着如何用它(划水)写周报、画海报、出方案、码代码……

事实上,在横空出世之前,人工智能在众多领域已经默默应用了多年:医生用AI辅助诊疗,科学家用AI验证假设,连路边的交通灯都用上了AI武装。

人工智能技术应用的“遍地开花”绝非一蹴而就,每一个应用场景背后都需要长年累月的技术积累和突破,每一项技术突破和落地背后都有一大群默默攻坚克难的研究人员在驱动着技术的创新,他们是技术创新的“先行者”,也是改变世界的“发明家”。

4月26日,第23个世界知识产权日来临!百度发布《百度人工智能创新与专利白皮书2023》(下称“白皮书”),展示百度高质量的人工智能创新和深厚的知识产权储备,用知识产权生态搭建起技术合作的桥梁,推动人工智能技术的产业化落地,实现高水平科技自立自强。循着白皮书中的技术创新和专利应用成果,让我们来看看隐藏在AI技术创新背后的那些技术大牛和发明家的故事吧。

王鲲:

车路协同面向未来加速自动驾驶商业化,兼容当下赋能智能交通

每逢上下班高峰或是节假日旅游,交通安全和出行拥堵都是一个“老大难”问题,今年以来商务和旅游的出行需求双双“爆发”,各地拥堵的话题更是频繁冲上热搜。

这也让百度车路协同技术战略专家王鲲压力倍增,“过往的车路协同,路侧基础设施由于缺乏与交通参与者的直接协同机制,主要服务于高速和交通管理部门,配合做好交通监控和执法管理工作,而新一代的车路协同在5G、C-V2X通信等技术支持下,需要满足广泛人群更加精细化、个性化的出行需求,同时解决自动驾驶这一未来交通出行模式带来的新问题”。

车路协同首先要解决的问题是交通安全。超过90%的交通事故都是人为因素造成的,以自动紧急刹车为例,在夜间或者儿童穿梭等场景下,车辆的应对能力不足,很容易出现碰撞危险;另外在特殊目标识别(例如下雨天打伞或穿雨衣的行人)和高精度定位(如隧道、城市桥梁等)方面,也较容易出现系统失效的现象。车路协同通过V2V、V2I或V2P等多重技术保障,可以显著提升车辆驾驶的安全性,至少解决90%的人为交通事故。

王鲲介绍,车路协同在缓解城市拥堵方面,“我们主要从两方面疏导,一是通过地图车道级精细化导航为车辆提供准确实施交通信息,如交通信号灯、交通事件等,帮助驾驶员选择最优化路径和最优化变道决策,减少拥堵,二是通过交通信号灯智能调控来缓解疏导交通拥堵,目前已经在单点优化的基础上,还可以实现干线级和区域级的信控优化,让绿波通行成为可能。”

所谓“绿波通行”,是在指定的交通线路上,按一定范围的平均速度行驶,从第一个路口绿灯通过后,后续路口仍能保持绿灯通行。“如在一条道路上有七八个信号灯,地图可以给一个规划路径和建议车速,按照这个车速行驶能保证你经过的所有的路口都是绿灯,这可以极大提升车主的体验。”王鲲介绍。

车路协同也是自动驾驶发展的必然趋势,自动驾驶的规模化发展需要车与路“双向奔赴”。通过车路协同自动驾驶可以全流程参与自动驾驶的感知、定位、地图、决策规划和控制等全部过程,在ODD范围内保证自动驾驶安全,远高于人类驾驶水平;在ODD范围外,动态管理和扩展自动驾驶ODD,优化自动驾驶运行环境,实现高速+城市自动驾驶无接管连续运行。

ai绿化软件 藏不住了!当红AI应用的背后就是TA

说起来轻松,但背后包含的技术研发以及落地过程却一点也不轻松。“涉及多种智能化技术的综合运用,是一个跨学科、跨领域的信息物理复杂系统。”王鲲说,“车路协同首先要对交通参与者、交通事件、交通信号灯、交通运行状况等进行实时检测识别,并且达到与L4高等级自动驾驶系统融合的精度和可靠性要求,比如厘米级定位、毫秒级时延、3个9的可靠性,需要用到的技术包括网络通信技术(LTE-V2X、5G)、高性能硬件技术(相机、毫米波雷达、激光雷达、边缘计算、AI芯片等)、人工智能技术(深度学习、图像识别、大模型等)、地图与定位技术、云计算与大数据技术、AIOT等,这些技术的背后,离不开专利的支撑和保护。”

王鲲介绍,百度的强项是在自动驾驶与智能交通全栈技术上都拥有充足的技术储备。根据全球知识产权解决方案提供商发布的《2022年自动驾驶和智能交通专利全景分析报告》( and Smart 2022 ),百度高级别自动驾驶全球专利族数、专利价值度均位列全球第一,专利影响力也排名全球第二,百度智能交通专利族、专利价值度均位列全球第二。自动驾驶与智能交通面临的痛点仍然还有很多,并不是靠单一系统能够解决的问题。让技术储备的红利彻底释放到实际场景中也还有很长一段路要走,希望5到10年之后,在整个交通系统中,车和路都要更加智能化,不同类型的车在不同的通道有序行驶,构建更加安全、高效、绿色、低碳的新一代智能交通系统。

韩钧宇:

擅长发掘AI技术创新,最大快乐是化创新成果为应用

在车路“双向奔赴”的过程中,离不开一项更为关键的技术,计算机视觉。如在自动驾驶场景中,计算机视觉技术相当于无人车的“智慧之眼”,它能够感知周围环境和自身状态信息,只有计算机视觉技术提供了准确感知信息给无人车决策系统,才能够实现安全可控的的驾驶体验。

“人类接收世界的信息中,80%以上来自眼睛,机器想要具备人类的全面自主智能能力,计算机视觉技术是必须要解决的问题。”百度视觉技术部高级经理韩钧宇称,基于这一认知,他在本科时代便锚定了计算机视觉这一方向,2012年研究生毕业后到加入百度,不知不觉中韩钧宇已在这一领域深耕了10多年,过程中既有“坐冷板凳”的阶段,也有热血澎湃的时刻。

2022年7月26日,国家知识产权局正式公布第二十三届中国专利奖授奖决定,百度再获5项中国专利奖,包括2项银奖、3项优秀奖,涉及自动驾驶、计算机视觉、自然语言处理、地图等领域。其中,韩钧宇团队申请的文字识别相关专利获得了第二十三届中国专利银奖,这让团队无比振奋。

“中国专利奖是我国知识产权领域的最高奖项,它不仅是对技术创新的肯定和鼓励,也是对我们技术实用性的认可,表明这项技术对全社会有很大的正向价值。”谈及技术的创新点和应用,韩钧宇滔滔不绝,“这项技术主要解决了文字识别中检测环节的痛点问题,一方面通过化整为零,在文字行整体检测过程中引入了各个字符局部位置引导信息,显著提高了倾斜、扭曲等复杂场景的文字检测精准度,另一方面,通过弱监督的字符检测训练方式,大幅降低了大规模训练数据的标注成本。”

这项专利技术申请于2017年,在2022年获得第二十三届中国专利银奖,这也意味着这一技术的社会价值得以验证,除了大规模应用于百度搜索、地图、网盘、小度在家等内部产品外,还通过百度智能云服务广泛应用于银行、保险等行业。像这样的计算机视觉技术专利,韩钧宇所在的计算机视觉团队已经进行了大量布局,“简单梳理为两类,一类是在技术算法研究上持续做创新和突破,最终去解决业务问题,比如我们获得的文字识别国家专利银奖专利,比如为了提升大规模图片标注效率,通过人机交互的方式把标注效率提高到数十倍。第二类是偏前沿性的探索,近期对话式人工智能爆火而被广泛关注的多模态交互技术,几年前我们就已经结合多模态搜索启动了很多探索和专利申请,比如基于用户交互指令的文本图像多模态交互方案。”

截至目前,百度在计算机视觉领域的专利布局量已经超过4000件,涵盖图像处理、视频分析、AR、VR等各个技术领域,这些高质量专利正助力计算机视觉技术进入新的应用阶段。谈及10多年研发生涯中的快乐时刻,韩钧宇称,比起技术上的突破,专利技术落地应用带来的成就感更为深刻。“申请技术专利只是研发征程的起点,我们希望它能够匹配市场需求,实现大规模应用,给社会带来更美好的生活体验、发挥出巨大的应用价值才是终点。”

基于在视觉技术领域的技术沉淀,韩钧宇对于技术研发及创新成果应用方向的判断也早于社会大众的认知,在其看来,计算机视觉技术在市场上已经成功证明其应用价值的领域有泛安防、金融、工业等,现在在自动驾驶、AI大模型等领域的技术应用价值闭环处于快速发展期,未来大家广泛关注的机器人、元宇宙等赛道都需要计算机视觉技术支撑。无论是成熟应用的领域还是面向未来的赛道,百度研发团队都有相应的技术储备和前瞻布局。

“这是一个非常非常宽阔的科技造梦的舞台,参与其中,你能清晰地感觉到AI技术迅速发展的磅礴气势,感受到通过技术创新慢慢地把人类美好前景画卷逐步打开的过程。”回顾10多年的研发过程,韩钧宇称总结道,展望未来,计算机视觉领域仍有广阔天地,身处其中的每一个研究人员都需要穷其一生不断学习。

ai绿化软件 藏不住了!当红AI应用的背后就是TA

辛望:

致力于降低量子计算学习门槛,愿景是“人人皆可量子”

比起计算机视觉技术,量子计算产业是一个更深更广的“坑”。自从14岁那年与量子科技概念接触以来,百度量子计算研究所资深研究员辛望已经在量子产业的“坑”里“摸爬滚打”了十多年,逐渐从“量子少年”成长为“量子专家”。

据介绍,辛望在2018年于悉尼科技大学获得博士学位,获评校长杰出博士论文。2018-2019年,作为 在美国马里兰大学量子信息与计算机科学联合中心从事研究,2019年加入百度量子计算研究所。入职百度以来,辛望已经陆续带过三十多位实习生,其中很多目前都在量子计算的学界或工业界持续前行,“看到自己指导过的实习生找到自己兴趣所在,在行业里不断成长,这是我觉得很有意义的事情。”

提起和量子的结缘,辛望回忆道,那还是在他14岁参加江苏省天一中学少年班暑期活动时,听到过杜江峰院士回母校做报告,报告是量子博弈实验相关的主题。去年年底杜江峰院士已经执教浙江大学,出任校长职务。某种程度上正是早期的这次短暂邂逅,给辛望心中种下了关于量子科技的种子。

在四川大学吴玉章学院求学4年后,他在21岁之际前往澳洲读博,彼时量子计算还是一个相对冷门的专业,但他还是被量子计算展现出的广阔未来所吸引,“经典计算机可能发展未来是有局限的。但量子计算可能是偏未来的计算范式。”

2019年,辛望在回国后加入了百度量子计算研究所。入职百度后,辛望和团队基于产业级深度学习平台飞桨开发了量子机器学习的平台——量桨,除了国内的开发者用户也还会收到来自美国、印度的研究人员的使用反馈和咨询。他提到,目前这个开源平台已经收获450个星标,“在同类型的量子计算领域的开源软件里,在国际上也是比较靠前的。”量桨平台能赋能量子计算的学习和研发也带来了很多成就感。

加入百度以来,辛望也参与了不少公众科普的工作。让他印象深刻的是,有一年他作为出题委员会成员给2020年“百度之星”比赛的现场做量子科普,科普的对象都是国内编程的精英学生,甚至还包括一位五年级的小学生。为了更好地向公众科普量子计算,降低学习门槛,他还作为主导者之一推动开发了一个免费的量子学习平台——量易简。在官方首页写着,“让量子计算易学简单,力争实现‘人人皆可量子’的美好愿景。”

今年3月,由百度和北京量子信息科学研究院牵头发起,国内首个“量子计算产业知识产权联盟”正式成立。该联盟设立了四大工作组,包括标准与知识产权工作组,并成立了国内首个“量子计算产业专利池”。未来,该专利池将重点覆盖七大领域,包括量子测控、量子安全与加密、量子架构与软件、量子纠错、量子算法与应用等。

“量子计算产业知识产权联盟”的初衷是希望将北京地区涉及量子计算的互联网公司、新型研发机构和初创公司联合起来,共同布局量子计算知识产权领域,并通过产学研各方面的合作推动量子计算标准的建立,促进量子计算技术的研发。

百度作为联盟发起方之一,在量子知识产权领域深耕多年。目前,百度量子计算研究所已经申请超过210项高质量专利,覆盖量子算法与应用、量子通信与网络等重要领域。随着“量子计算产业知识产权联盟”的成立,一个推动产业更为高效发展的量子计算产业知识产权生态正在形成,“人人皆可量子”的愿景也更加接近了一步。

文/马宁宁 汪陈晨

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...