百度在硅谷争抢人工智能“大脑”
12月中旬的一天,我出门去百度位于加州桑尼维尔的研究院采访,当我对手机说出研究院地址,手机自动打开地图为我导航……
对于用惯了智能手机的我们来说,这一切早已稀疏平常,但想起20年前在小学机房,我需要用费劲背下来的固定语句向Dos系统的电脑输入指令,就为了打开个文档,不得不感叹这些年人和机器之间交流的方式发生了怎样翻天覆地的变化——不用会写代码,甚至不用识字,用平时说话的方式就能操作智能设备。
为了实现和机器交流能够像“和人聊天”一样,背后是为数不多的一群科学家数十年沉浸于神经网络和深度学习领域的研究——这是一个曾不被学界认可的领域,研究人员也经历过数次受追捧和被冷藏的沉浮。
几年前,谷歌等科技公司忽然意识到这个领域的价值,开始了重金争夺这群为数不多的科学家,与此同时,这也让越来越多的公司加入这场“军备竞赛”。
意外的是,百度作为一家中国公司卷入其中。作为一家中国公司在美国硅谷的研究院,百度位于加州桑尼维尔的研究院吸引了吴恩达(Adrew Ng)——深度学习研究领军人物的加入,让人大感意外,在此之后,他的学生,他的信徒也追随其来到百度。
1.
百度的研究院所在地桑尼维尔并不是硅谷的核心地区,一栋并不大的建筑里,没有人有自己独立的办公室,大多数会面都在餐厅,吴恩达(Adrew Ng)在这个下午不时走到餐厅,像是安排了什么会面,因为他的加入,即便是美国媒体在谈论深度学习时,也无法避开百度。
深度学习再一次受到关注与这些科技公司的“军备赛”不无关系。2014年,谷歌花费4亿美元收购人工智能初创公司DeepMind,而此前Facebook对这家公司也在猛烈追求;但Facebook并不肯示弱,在谷歌拥有Geoffrey Hinton这样的研究巨擎时,它邀请到Hinton的亲密队友——纽约大学Yann LeCun建立实验室;而百度,则邀请到了吴恩达建立自己的实验室,他曾为谷歌建立了被外界称为“谷歌大脑”项目,能够在诸多图片中识别出“猫”,成为谷歌最重要的研究成果之一,也是深度学习的里程碑。
Tesla的创始人Elon Musk最近的“参赛”更是让人闻到了火药味。这名超人式的硅谷企业家曾不止一次对外界表达对人工智能的负面思考,担心人工智能未来会摧毁人类。而最近他表示,和Y Combinator的董事长Sam Altma一起出资10亿美元建立非盈利性人工智能(AI)研究机构Open AI,他表示,不希望人工智能在未来成为少数公司所独有的资源。撇开这个机构设立的目的,毫无疑问,它的出现会进一步加剧人才之间的争夺。
即便深度学习现在是炙手可热的领域,但几年前还是一个冷门领域,少有博士生从事这个领域的研究,而在这几年重新受人关注之后,专注于这一课题的博士生们大多还在学习过程中,因此人才极为稀缺。
“实际上这个领域有几次寒冬”,当我问Adam Coates,百度硅谷AI实验室主管,怎么看待上一次深度学习寒冬出现的原因时,他纠正我说,并不止一次,而是有很几次。
如果仅仅是跟风一个热门的领域,并不需要一个企业需要太多前瞻眼光,但在深度学习领域的投入多少是具有不确定性的,即便是在百度确立这个目标的两三年前。
早在1960年代,深度学习的前身“神经网络”概念雏形就已经出现,轰动一时,关键词是“训练机器”,让机器能够识别物体。但由于这一理论迥异于传统人工智能研究方法——那种能够被数学计算证明的路径,同时由于当时计算能力的局限,并未在应用领域显示出自己的优势,最终在向政府争取研究经费时输给了传统派。到了1980年代末,神经网络重新被关注,《纽约时报》在头版位置报道,好莱坞也以此博取眼球,阿诺德·施瓦辛格扮演的机器人终结者说:“我的CPU是一个神经网络处理器,一个会学习的计算机。”但1960年代景象最终重现——神经网络仍然没能达到外界预期,而被学界冷落。
只有一小群人坚持了下来,包括现在加入谷歌的Geoffrey Hinton和为Facebook主持实验室的LeCun一直坚持扎根于这一领域。
再次兴起带有偶然。2007年前后,计算机计算能力到达了一个新的节点,而Google等公司也收集了大量数据,Hinton一个学生将Hinton的语音识别技术导入了Google系统,旋即取得成功,这几乎是让Google尝到甜头的开端,此后几年间,Google花了较大精力投入,包括邀请到吴恩达(Adrew Ng)和Hinton的加入。
“人工智能”这个词近几年几乎被过度应用,投行、媒体或者是企业开始用“深度学习”代替“人工智能”,分析它的商业前景、变现能力。
“一些企业家又在承诺,过几年之后深度学习又会带来怎样的愿景,毫无疑问这是过度宣传。”下午3点,Adam百度餐厅旁会议室接受界面新闻记者采访时说,“可能是因为我们身在其中做研究的缘故,我们更关注眼下人工智能和深度学习能够做什么。”他希望此次这些人不要对这个领域带来什么负面影响。
Adam是吴恩达(Adrew Ng)的学生,今年32岁,典型的美国大学里好学生的样子,2014年跟随吴恩达一起来到百度。
2.
2014年5月,吴恩达离开Google,甚至逐渐淡出自己的在线教育创业项目Cousera的管理,加入百度,主持这家中国公司的人工智能实验室。
对于吴恩达加入百度的原因,并不乏媒体报道,大多诉诸于百度的“灵活性”,但这个理由似乎并不那么充分——至少在美国几大科技公司中,谷歌是具有相当灵活性的,Hinton曾表示,微软和IBM比谷歌都要先得到他的学生,但是在产品化上,谷歌比任何人都要快。
无论如何,吴恩达的到来为百度吸引到了最顶尖的科学家。Adam Coates在斯坦福大学师从吴恩达,研究进入博士后阶段时,“我问他,做什么事情,在哪里做,能够让我们的研究在这个世界上能够产生最大的影响力?他告诉我应该去百度。”
无论是吴恩达还是谷歌的Hinton或者是Facebook的Lecun,这样学院派人物加入企业非常重要的一点是他能够带来自己门生和追随者。
在百度工作一年半之后,在接受界面新闻采访时,Adam同意了吴恩达当初的说法,他说百度让人激动的是百度的这些产品是和十亿级的用户紧密地联系在一起。
除此之外,这些顶尖的科学家愿意从大学实验室来到互联网公司的重要原因就是数据和计算能力。关于数据对于人工智能的重要性,谷歌创始人之一拉里佩奇和凯文·凯利之间的一段对话能够作为例证:早在2002年,在接受凯文·凯利采访时就表示,Google未来不是用人工智能改进搜索,人工智能未来是谷歌主营业务,谷歌将用搜索得到的数据来改进人工。而当2007年语音识别产品在谷歌偶然被Hinton的学生运行成功时,基于的却是他若干年前的研究成果,“回顾往昔,缺乏的只是数据量和计算能力”,Hinton当时感叹——彼时他经历了深度学习在学界数次沉浮。