美国东部时间3月27日,美国计算机协会(ACM)宣布,深度学习的三位推动者尤舒亚·本吉奥(Yoshua Bengio)、杰弗里·辛顿(Geoffrey Hinton),和雅恩·乐昆(Yann LeCun)因其在神经网络方面的成就赢得了2018年的图灵奖(A.M. Turing Award)。
图灵奖诞生于1966年,这一奖项名称取自计算机先驱艾伦·图灵(AlanMathison Turing)。通常获奖者必须是在计算机领域具有持续而重大的先进性的技术贡献,因此被称为诺贝尔计算机奖,获奖者将获得100万美元的奖金。
由于评奖流程极为严格,且对获奖者的要求极高,一般每年图灵奖只奖励1名计算机科学家,极少数情况有2名以上在同一方向上做出贡献的科学家同时获奖。此次,是自2002年和2007年之后,第三次图灵奖同时颁给了3名科学家。
雅恩·乐昆曾为多伦多大学杰弗里·辛顿实验室的博士后研究员,雅恩·乐昆在AT&T贝尔实验室工作时又与尤舒亚·本吉奥成为同事,据《纽约时报》报道,2004年在加拿大政府的支持下,杰弗里·辛顿组建研究项目,邀请雅恩·乐昆和尤舒亚·本吉奥加入了他的项目组。杰弗里·辛顿曾表示,他们几乎每周都要见一面,而聚会常以吵架结束。
在过去数十年间,上述三人既独立研究又相互合作,共同奠定了深度神经网络领域的基础概念。他们还进行了大量实验,发现了这项技术的潜力,并进一步在工程上付出努力,证明了深度神经网络的优势。
ACM指出,近年来计算机视觉、语音识别、自然语言处理和机器人技术以及其他应用取得突破,是因为这三人推动的这场长达三十年的深度革命。协会主席Cherri M. Pancake指出,人工智能的发展在很大程度上归功于深度学习的最新进展 。
Cherri M. Pancake表示,任何有智能手机的人都可以明确体会到自然语言处理和计算机视觉技术的进步,这在10年前是不可能实现的,除了我们每天使用的产品之外,深度学习的发展为医学、天文学、材料科学等领域的科学家提供了强大的新工具 。
但深度学习也经历过低谷。在提出之后,由于当时计算能力尚未达到需求,且主流声音并未看重,深度学习曾经遭遇学界质疑,甚至不被看好。但是上述三位科学家仍然坚持,他们克服了计算力和数据量的限制,突破性地研究了反向传播(Backpropagation)、卷积神经网络(CNN)和生成对抗式神经网络(GAN)等。
他们的研究和想法启发了整个行业对问题的探索,为这一轮以机器学习/深度学习为主的人工智能浪潮打下了基础,加速了人脸识别服务,数字语音助理,仓库机器人和自动驾驶汽车等技术的发展。因此,他们三人也被称为“深度学习的三剑客”。他们是Google Scholar计算机科学领域被引用最为频繁的三位作者。
目前,杰弗里·辛顿为谷歌副总裁兼工程研究员,雅恩·乐昆担任Facebook的副总裁和首席人工智能科学家,据《纽约时报》报道,尤舒亚·本吉奥也与IBM和微软签订了相关协议,他参与的研究进入了许多机器翻译、人工智能助手类的产品。
AMC将于6月15日在美国旧金山召开颁奖典礼,而这一奖项目前由谷歌赞助。
尤舒亚·本吉奥:论文平均每天被引用131次
尤舒亚·本吉奥,1964年出生,加拿大计算机科学家,蒙特利尔大学的教授。他同时是加拿大先进技术研究院人工智能主席、魁北克人工智能研究所(MILA)的科学主任、加拿大数据定价中心主任。他建立的MILA,目前拥有300名研究人员和35名教职员工,是世界上最大的深度学习研究学术中心之一。
ACM颁奖给他,主要表彰了他在神经网络概率模型、高维度向量自然语言表征和注意力机制,以及生成对抗性神经网络方面的贡献。他曾与其他专家合著《深度学习》,这是一本被业内誉为“圣经”的书。他的论文在2018年平均每天被引用131次。
尤舒亚·本吉奥在1990年发明了Probabilistic models of sequences(序列概率模型),把神经网络和概率模型(例如隐马尔可夫模型)相结合,与美国电信运营商AT&T合作,用新技术识别手写支票,这被认为是20世纪90年代神经网络研究的巅峰之作,现代深度学习技术中的语音识别就是这些概念的扩展。
2000年,他发表了具有里程碑意义的论文“A Neural Probabilistic Language Model(神经概率语言模型)”,该论文引入了高维词嵌入作为词义的表征方法,他的观点对自然语言处理任务产生了巨大而持久的影响,包括机器翻译、知识问答、视觉问答等,他的研究团队还提出了一种注意力机制,该方法直接导致了机器翻译领域的突破,并构成了深度学习序列建模的关键组成部分。
自2010年以来,尤舒亚·本吉奥非常关注生成式深度学习,特别是他与伊恩·古德费洛(Ian Goodfellow)等研究者提出的生成对抗网络(GAN)。这项研究引起了计算机视觉和计算机图形学的革命。这项工作令人惊奇的地方在于,计算机能生成与原始图像相媲美的图像,甚至让人联想到人类水平的创造力。
尤舒亚·本吉奥还成为了多家人工智能公司的顾问,其中一些已被业内巨头收购。其中,2017年,微软收购的初创公司Maluuba,是由尤舒亚·本吉奥的学生创办。微软负责人工智能研究的全球执行副总裁沈向洋曾表示,尤舒亚·本吉奥将成为微软和他个人的顾问。
杰弗里·辛顿:免费教授神经网络课程
杰弗里·辛顿出生于1947年,1970年毕业于剑桥大学国王学院获得实验心理学学士学位,后于1987年在爱丁堡大学获得人工智能博士学位。因在英国找不到足够的资金,辗转美国多所大学工作,最终落脚加拿大,至今仍在多伦多大学担任计算机科学教授。
ACM颁奖给他,主要是因为其在反向传播算法、提出最早神经网络模型之一的玻尔兹曼机,以及对CNN的改进等方面的贡献。
1986年,杰弗里·辛顿团队发表论文“Learning Internal Representations by Error Propagation(通过误差传播学习内部表征)”,提出反向传播算法;1983年,他和Terrence Sejnowski 提出了玻尔兹曼机;2012年,杰弗里·辛顿与学生率先使用修正线性神经元(ReLU)和Dropout正则化提升了深度卷积神经网络的性能,后在ImageNet竞赛中,他们几乎将图像识别的误差率减半。
杰弗里·辛顿在2013年3月加入谷歌,同时谷歌并购了他所创办的DNNresearch公司。他担任副总裁直到今天,不过一两年前,他淡出了日常科研和业务,更多地投入到了教职。此外,杰弗里·辛顿在百度前高管吴恩达创办的Coursera上免费教授神经网络课程。
雅恩·乐昆:推动Facebook产品整合人工智能
雅恩·乐昆,是法国裔美国计算机科学家。在法国巴黎第六大学攻读博士学位期间,就曾提出反向传播算法的早期版本之一,因而得到了杰弗里·辛顿的关注。博士毕业后,雅恩·乐昆在杰弗里·辛顿的实验室里做了一年的博士后研究。
雅恩·乐昆随后加入了贝尔实验室,开始崭露头角。在上个世纪末,先后发明了多种广泛应用的神经网络,·他最著名的工作是在光学字符识别和计算机视觉上使用CNN。
ACM颁奖给雅恩·乐昆,主要表彰了他在CNN、改进反向传播算法,以及扩展神经网络用途方面的贡献。
2013年,雅恩·乐昆加入了Facebook,创办了该公司人工智能研究院,并担任院长直至2018年卸任。在任职期间,他参与推动了Facebook在产品里整合人工智能技术,并为该公司吸引人才。目前,他仍是Facebook的副总裁和首席人工智能科学家。
雅恩·乐昆曾被连线杂志选为“2016年100个最具影响力人物”和“创造未来商业的25位天才”。他获得了包括美国工程院院士、IEEE神经网络先锋奖(IEEE Neural Network Pioneer Award)等一系列荣誉。他还是纽约大学数据科学中心的创始人,与尤舒亚·本吉奥一起担任加拿大先进研究院机器与大脑学习项目的主管。
新京报记者 梁辰 实习生 程子娇 编辑 徐超 校对 李立军