今天想跟大家聊一聊一位女神和两位男神在微软做 AI 开发的故事。他们是连接研究员和用户的纽带,他们把许多高精尖的技术转换为耳熟能详又好用的产品,他们就是微软攻城狮团队!站在人工智能浪潮的前端,他们有哪些有趣的故事与我们分享?作为大众认知中较为“罕见”的女性工程师,“她”在微软写代码、训练模型又有着怎样的体会?
Speak out and do it!
个人档案
姓名:王君
毕业院校:中国科学技术大学
职位:微软研究院创新工程组,Face Team 工程师
一年多前,大家对人脸识别技术的认知还停留在 How-Old(微软颜龄)、(我们有多像)等社交媒体上令人开心的小应用;而今天,人脸识别已经成为美国 Uber 司机接单程序的一部分,也随着 10 的人脸登录系统进入到大众的工作和生活中。人脸识别,在身份识别的实际领域正在发挥着越来越大的作用。
“我们组的责任是将研究员研究出来的先进的人脸识别算法转换成人脸识别上的基础工具包,供业界广大开发者使用。可以说,我们是人脸识别研究员和软件开发者跟普通用户之间的桥梁。”
王君,微软人脸识别组工程师, 2015 年研究生毕业后进入微软,一直在从事人脸识别 API 模型的训练、版本的更新和运营,以及人脸识别在 Azure 云上的服务。
看上去很炫酷的人脸识别技术,在王君的嘴里,就像把大象塞进冰箱一样,只需分为简单的三步:一、检测人脸位置;二、提取人脸特征输入预测模型;三、输出预测信息。虽然步骤听上去简单,但这个预测模型是基于数以百万级的数据训练而来的。训练模型所用的数据量级越高,分布越符合实际,模型的精准度就越高,预测结果就准确。
问:以毕业生的身份加入微软,什么感觉?
答:直接从校门跨进了微软,拿到微软亚洲研究院的 offer 对我自己来说是极大的肯定。微软亚洲研究院是国内非常优秀的基础研究机构。这里有一流的研究人员和研究条件以及坚实的研究基础。我觉得自己很幸运。
问:现在毕业一年了,感觉自己有没有什么变化?
答:从当时没有任何工作经验,到现在在 Face Team 里做自己的贡献,我觉得自己的提高和变化还是很大的。公司有一系列的制度,可以帮助我们新员工适应环境。从公司文化到工作流程,从产品的质量要求到最后的实践训练,我们都有完整的培训体系。通过这些,我们能够初步感受到公司的工作流程和氛围。
问:那这期间有没有什么挑战?
答:当然会有。公司里,每个员工和经理之间每周都有一个一对一的会议,目的是鼓励员工将自己遇到的困难和问题跟经理讲出来,寻求经理的帮助,答疑解惑。
刚刚加入的时候,我自己的心态还是比较保守,觉得自己是新人,对很多领域都不熟悉,就不太敢发表意见,其实这样我的经理就不会知道我的困惑在哪里,无法给予我帮助。但是同事和经理并没有放弃我,而是鼓励我多表达自己的想法。
渐渐的,我就有了转变。从以前不太敢挑战新任务,到现在会很快接触新业务。虽然还是有不了解的内容,但是我有信心,会主动学习和思考。
问:除了更有信心,还有没有其他的变化?
答:行为习惯上也有变化。现在的我遇到问题,不会贸然去做,而是首先充分思考,想很多解决办法,并且对比每种解决方法的优劣,然后再做选择。就像我现在做人脸识别 API 的更新,也是秉持这样的原则。很明显,我的心态和习惯都在发生着变化。虽然我加入微软的时间并不长,自己的贡献还很有限,但是看到团队工作的成果,想到自己能够帮助很多组织和个人,自己也很荣幸。
问:你觉得你是什么样的程序媛?
答:我觉得我就是一个平凡的女生,积极乐观,也会偶尔有自己的小情绪。闲事会做写饭菜,练练厨艺,周末喜欢去户外,亲近自然。
一不小心站在了浪尖上
个人档案
姓名:邓小民
毕业院校:华中科技大学应用电子技术专业
职位:微软认知服务工程师
打开微软认知服务的页面,从视觉、语音、语言、知识再到搜索,二十多种适用任何平台的 API,配上显目的“马上开始免费试用”标识,对很多应用开发者来说,这里天天都是“双十一”。(点击“阅读原文”,探索微软认知服务的奥秘)
“我们为开发者提供一个集中的门户网站,上面有这些 API 的功能介绍和 demo,开发者们可以直观地了解到我们的 API 能做什么,是否符合他们将要开发的应用程序的需求。微软将这些 API 开放出来,开发者能轻松调用,将人工智能注入其开发的应用中。”
邓小民,微软认知服务工程师,2002 年大学毕业后一直从事软件研发工作,2012 年底加入微软, 2015 年初加入“牛津计划”(微软认知服务的前身),此后一直从事微软认知服务相关的开发。
问:为什么选择来微软做人工智能?
答:进入微软之前,我在一个传统行业公司的软件部门工作。之前的工作一直都是游刃有余的,但是我对微软一直有种憧憬,觉得微软是一个可以让人大展拳脚的地方。我的初衷很简单,就是想跟上移动互联网的浪潮,但是不想如今我却幸运地站在了下一个浪潮 —— 人工智能的前端。我很感激这个时代和微软给我的机遇。看到自己参与开发的认知 API 被广大开发者使用,并且做出各种炫酷的智能应用,心中深感自豪。
问:在微软工作是一种怎样的体验?
答:刚来微软的时候并非一帆风顺,因为这里的项目节奏比较快,时不时地会让我感觉到沮丧,怀疑自己当初的选择,但是却一直没有放弃。既来之,则安之,努力做好分配给自己的每一件事情,并且做一些领导没有安排却对项目很有用的一些事情。慢慢地,我在一些领域当中积累了很多经验,成为团队中的某些方面的专家,比如 认证机制、、数据抓取等等。所以我在团队中慢慢得到同事和领导的认可。事实证明,微软这位巨人能够这么多年繁荣发展,和内部有个很好的机制离不开。
问:从“牛津计划”阶段,到现在 API 开放,你见证了微软认知服务的转型。你自己的体会是什么样的?
答:“牛津计划”这个项目的初衷,就是将微软优秀的技术调用给普通企业和开发者。2015 年开始做“牛津计划”的时候,我已经在项目中独挡一面,负责 、API 、用户和密钥管理以及几个重要的 API。下半年项目决定登陆 Azure 公有云,而我要负责这次集成的开发工作。为了加速项目进展,2015 年 11 月初,我和团队另外两位同事飞往西雅图的微软总部,和 Azure 云的核心团队了解流程,讨论设计,集成各种方案。最终我们克服重重困难,在春节前准时发布了我们的服务。
问:你觉得在微软工作可以平衡生活与工作么?
答:我觉得工作与生活并不一定需要去平衡,而是更好地将两者进行整合。比如微软实行灵活工作制,平时工作日的时候,如果有需求,我可以晚点去公司,先把孩子送去幼儿园。微软也会经常举办家庭日等活动,孩子们可以来参观我们工作的地方,可以参与各式各样有趣的小游戏,大点的孩子还可以参加编程游戏等。我周末的时间基本都在陪家人和孩子。我热爱大自然,所以一到周末节假日,大部分时间都是带着娃去京郊或周边省份去亲近自然去了。
问:对于女儿,你想说什么?
答:希望女儿有一天能明白爸爸每天做的事情的意义: the world – make it a place。虽然爸爸只是其中的一颗螺丝钉,希望是一颗重要的螺丝钉。
同小冰一起,和自己赛跑
个人档案
姓名:陈鹏
毕业院校:北京大学计算机体系结构专业
职位:小冰团队工程师
萌妹子“小冰”已然成为了机器人界的“网红”。去年九月刚刚度过“18 岁生日”的小冰,不仅可以像少女一般的撒娇、聊天,还可以开口唱歌给你听。于是,总会有些“寂寞心灵”想着让小冰姑娘陪聊打趣。
可是,作为微软研发的一款跨平台人工智能机器人,小冰又怎么可能只是一个用来打发时间的机器人?通过迭代更新,四代小冰已经进一步尝试商业落地,嵌入到更多第三方平台。现在的小冰姑娘,可以是旅游景区的讲解员、航空公司的地勤、微信公众号的管理员,甚至是电商导购。
“我是小冰的死忠粉,非常认同小冰的技术发展方向,并坚信小冰在商业上的巨大潜力。在完成二代小冰的开发后,一直在思考和探索小冰如何与商业结合的问题,先后主导了京东小冰、东航小冰、敦煌小冰、小冰商业平台解决方案等项目的开发。”
陈鹏,在一家本土互联网公司工作一年之后,于 2014 年加入小冰,先后参与小冰二代、三代、四代的开发。刚加入微软的时候,陈鹏参与过很多项目,写过系统、调过模型、画过前端,算得上是一名全栈工程师。
问:你们为什么开发京东小冰?
答:在做二代小冰的时候,我负责小冰在其他平台的出口。当时觉得,如果小冰可以和具体的商业场景结合,会不会是人工智能的一种突破?例如我日常和媳妇逛街,她买衣服会征求我的意见,我买鞋子也会问她的感觉。可是我们在网购的时候,一般只是自己搜索和浏览,很少能够有其他人给点参考意见。所以我想,这个模式是否可以搬到第三方的电商平台上去。我们就是基于这个场景开发了京东小冰。
问:除了导购类,小冰还有其他的商用模式么?
答:京东小冰其实到现在还是有很多人在用的。做完这个尝试之后,我们进一步尝试了商业落地。现在微信公众号比较火,大家认为公众号是用来推文章的,但是不知道它还可以聊天。其实很多公众号的运营商是希望能够直接接触到客户的,我们的小冰是人工智能对话机器人,可以和任何人聊得来的。把小冰切入到公众号后台,可以帮助管理者收集用户信息。
问:目前效果如何?
答:这个平台反响很好。大量的公众号都接入了小冰。然后,我们进一步探索,如何将小冰人工智能应用到更多的场景中去,更多的机会就来了。例如,敦煌研究院希望借助人工智能的方式,弘扬敦煌文化。他们和我们联系上,我们合作开发了一款敦煌小冰的产品。当用户有具体问题问到小冰的时候,她可以充当一个导游,或者一个知识渊博的人,来时时作答,这样方便用户去接触敦煌的文化。
这个产品一经问世,立刻有很多做旅游相关的公司找到我们。他们希望把这样的技术,推广到更多的旅游景点去。经过这个事情,我更加坚定了人工智能商业运用的信心,和坚定了我继续探索的信念。
问:小冰两年多的时间里面,已经更迭了四代。更新小冰是个什么样的过程?
答:其实迭代开发的周期也只有几个月而已。例如三代小冰开发,就是 2015 年的 4 到 8 月定下了目标。起初,我们可能没有清晰的文档,但是当我们清楚用户体验之后,几个工程师和项目经理在黑板上写写画画。一旦确定了流程,实际开发的时间也就三周而已。
问:来微软工作,感觉怎么样?
答: 作为一名研发人员, 我深知技术是我们的立身之本。对技术的追求和渴望,让我不停的学习,小冰组则给了我最好的学习环境。在这里,没有任何的束缚,我们学习到大量的前沿技术和算法,并用来解决实际问题。与微软亚洲研究院紧密而深入的合作,使得小冰在商业项目上取得了一系列技术上的突破,例如自主知识学习系统、智能客服解决方案(AI+HI,人工智能+人类智慧)、意图识别引擎等。我们还先后推出了日本版小冰 Rinna 和美国版小冰 Zo。你可以在社交应用 Kik 上与 Zo 互动,今后她还会将陆续登陆 Skype、 等其他社交和聊天平台。
人工智能无疑是今年最“燃”的技术,没有之一。微软已经潜心研究人工智能几十年,除了在行业中树立榜样的作用,更是将人工智能的普及设为自己的新目标。这是一条与众不同,又充满挑战的道路。
今天介绍的这三位主人公,只是踏踏实实微软人的一个缩影。他们在微软人工智能的大业中默默奉献,但同时也在伴随着技术的发展,不断接受挑战,丰富自己。就如微软 CEO 萨提亚·纳德拉所提倡:“我们坚信应当在文化中融入一套成长型思维。首先需要相信所有人都能成长和发展;潜力是后天培养的,不是先天具备的;任何人都可以改变思维。”
他们从我们中间走来,将带领我们去向一个智能的新世界。