投稿/爆料
厂商入驻

【原创】AI和深度学习2017年度回顾

技术干货|论智|2018-01-04 18:19

【编者按】Prediction Machines的研究科学家(2016年夏-2017年夏Google Brain Resident)Denny Britz上周撰文,回顾了2017年AI和深度学习的主要进展。

强化学习在人类的游戏中击败了人类

2017年最大的事件大概是AlphaGo《自然》论文),这个强化学习代理击败了世界上最好的围棋选手。由于围棋极端巨大的搜索空间,人们曾经认为还需要好几年的机器学习研究才能攻克围棋问题。所以说,这可是一个大惊喜!

Alpha Go初版使用了源自人类专家的数据作为起步,然后通过自我对弈(应用蒙特卡洛树搜索)提升自己。不久之后推出的AlphaGo Zero《自然》论文)更进一步,基于之前发表的Thinking Fast and Slow with Deep Learning and Tree Search论文中的技术,不靠人类数据,从头开始学下围棋。AlphaGo Zero轻易打败了AlphaGo初版。快到年底的时候,我们看到了AlphaGo Zero算法更进一步的泛化版本AlphaZero。基于相同技术的AlphaZero不仅擅长围棋,还擅长国际象棋和将棋。有趣的是,这些程序的一些落子让最具经验的围棋棋手大吃一惊,调动棋手学习AlphaGo的下法,调整自身的棋风。DeepMind也发布了AlphaGo Teach教学工具。

MCTS in AlphaGo Zero

除了围棋之外,其他游戏领域也获得了显著的进展。CMU研究人员开发的Libratus系统(《科学》论文),在20日无限制单挑赛上成功击败了顶尖的德州扑克选手。在此之前不久,Charles大学、Czech Technical大学、Alberta大学的研究人员开发的DeepStack系统成为第一个击败职业扑克选手的AI。注意,以上两个系统都是单挑,也就是在两个玩家之间进行,难度比多人扑克要小很多。在2018年,我们很可能会看到AI在多人扑克领域的进展。

强化学习的下一个前沿看起来会是更复杂的多人游戏,包括多人扑克。DeepMind正努力研究星际2,发布了一个研究环境。OpenAI则展示了在一对一Dota 2上的初步胜利。OpenAI的目标是在最近的将来让AI的能力足以胜任完整的5对5游戏。

演化算法的复苏

对于监督学习而言,基于反向传播算法的梯度下降方法表现异常优秀。估计以后的一段时间也会是这样。不过,在强化学习领域,演化策略(Evolution Strategies, ES)看起来正在复苏。因为数据通常是非iid(独立且相同分布)的,误差信号很稀疏,需要探索,所以不依赖梯度的算法可能表现不错。此外,演化算法可以线性伸缩到上千台机器,允许极其迅速的并行训练。演化算法不需要昂贵的GPU,可以在很多(通常是成百上千)的廉价CPU上运行。

2017年第一季度,OpenAI的研究人员展示了演化策略可以达到和深度Q学习之类的标准强化学习算法相当的表现。2017年第四季度,Uber的一个团队发表了1篇博客和5篇论文进一步展示了遗传算法(Genetic Algorithms)和查新(novelty search)的潜力。基于一个极其简单的遗传算法,完全不使用梯度信息,Uber的算法学习进行困难的雅丽达游戏。下面的视频展示了遗传策略(GA)在Frostbite中取得了10500的得分。DQN、AC3、ES的得分则不到1000。

2018年我们很可能会看到更多这个方向的工作。

WaveNet、CNN和注意机制

Google的Tacotron 2语音合成系统能够生成令人印象极为深刻的音频样本,该系统基于WaveNet,WaveNet是一个自动回归模型,该模型同样应用于Google助手,在2017年它的性能大为提升。WaveNet曾经也用于机器翻译,训练时间比循环架构要短。

看起来,机器学习的一些子领域存在一个趋势,从需要花费很长时间训练的昂贵的循环架构迁移到别的机构。在Attention is All you Need中,研究人员彻底摆脱了循环架构和卷积架构,转用一个更复杂的注意机制,在大大降低训练成本的前提下,表现达到了当前最先进的模型的水平。

深度学习框架之年

如果用一句话概括2017年的话,那将是框架之年。Facebook的PyTorch引起巨大轰动。由于PyTorch提供和Chainer类似的动态图建构,PyTorch在自然语言处理的研究者那里很受欢迎,这些研究者经常需要处理动态循环结构。在Tensorflow这样基于静态图的框架中,动态循环结构很难定义。

Tensorflow在2017年发展迅猛。2月份发布的Tensorflow 1.0提供了稳定的向后兼容API。Tensorflow目前的最新版本是1.4.1。除了主框架之外,还发布了一些Tensorflow配套库,包括Tensorflow Fold(动态计算图)、Tensorflow Transform(数据输入管道),以及DeepMind的高层Sonnet库。Tensorflow团队也公布了一个新的贪婪执行(eager execution)模式,提供类似PyTorch的动态计算图。

Google和Facebook以外,许多其他公司也加入了开发机器学习框架的潮流:

  • Apple公布了CoreML移动机器学习库
  • Uber的一个团队发布了Pyro深度概率编程语言。
  • Amazon公布了Gluon,MXNet的高层API。
  • Uber公布了内部使用的Michelangelo机器学习基础设施平台的细节。

由于框架的数目很快就超出掌控了,Facebook和Microsoft公布了ONNX开放格式,用于在框架间共享深度学习模型。例如,你可以使用一个框架训练你的模型,而在生产环境中使用另一个框架。

除了通用的深度学习框架,2017年还有许多强化学习框架发布,包括:

为了使深度学习更易使用,出现了一些面向web的框架,例如Google的deeplearn.jsMIL WebDNN执行框架。

然而,至少有一个非常流行的框架死亡了。那是Theano。Theano的开发者在邮件列表中宣布Theano 1.0将是Theano最后发布的版本。

学习资源

随着深度学习和强化学习越来越流行,2017年有越来越多的讲座、训练营、活动被记录下来并发布到网上。下面是一些我最喜欢的学习资源:

一些学术会议延续了将会议演讲发布在网上的新传统。如果你希望追踪最前沿的研究,你可以观看NIPS 2017ICLR 2017EMNLP 2017的录像。

研究人员也开始在预印本文库(arXiv)上发表易于阅读的指南和论文。以下是一些我最喜欢的2017年的论文和指南:

应用:AI和医学

2017年,有一些大胆的人声称针对医疗问题的深度学习技术击败了人类专家。这当中有很多夸张的不实宣传,对不具有医学背景的人而言,理解其中真正的突破绝非易事。Luke Oakden-Rayner的The End of Human Doctors(人类医生的终结)系列博客提供了一份该领域的全面综述。我在这里将简要介绍其中的一些进展。

2017最重要的新闻之一是Stanford的团队公布了在识别皮肤癌方面表现得和皮肤科医生一样好的一个深度学习算法的细节(《自然》的文章)。Stanford的另一个团队开发了一个模型,该模型基于单导ECG信号,能比心脏病科医生更好地发现心律失常

皮肤癌检测

不过2017年也出现了一些重大错误。DeepMind和NHS的协议充斥着“不容辩解”的错误。NIH发布了一个X光胸片数据集,但细致的检查表明这个数据集其实并不适合训练诊断型AI模型。

应用:艺术和GAN

2017年另一个得到更多关注的应用是面向图像、音乐、绘画和视频的生成式模型。NIPS 2017首次推出了Machine Learning for Creativity and Design(面向创意与设计的机器学习)研讨会。

最流行的应用之一是Google的QuickDraw,使用神经网络来识别你的涂鸦。基于已经发布的数据集,你甚至可以教导机器帮你补完画作

生成对抗网络(Generative Adversarial Networks,GAN)在2017年取得显著进展。例如,CycleGANDiscoGANStarGAN等新模型在人脸生成方面的表现令人印象深刻。GAN曾经一度难以生成逼真的高分辨率图像,但pix2pixHD令人印象深刻的结果表明我们正着手解决这一问题。GAN会成为新的画笔吗?

应用:自动驾驶

自动驾驶领域的重量级选手包括Uber、Lyft、Waymo(属于Alphabet)、Tesla。Uber在2017年开始的时候遇到了一些挫折,由于软件错误,Uber的自动驾驶汽车在San Francisco漏掉了若干红灯。之后Uber分享了内部使用的汽车视觉平台的细节。2017年12月,Uber的自动驾驶汽车程序积累了200万里程

而Waymo则在四月份搭载了第一名真正的乘客,之后在Arizona的Phoenix完全脱离了人类操作员。Waymo也发表了他们使用的测试和模拟技术的细节。

Waymo模拟

Waymo模拟展示改进了的载具导航

Lyft宣布正在创造自己的自主驾驶软硬件。Lyft的第一款产品在Boston起步。Tesla的Autopilot没有太多更新,而Apple则作为新来者进入了这个领域。Tim Cook确认Apple正为自动驾驶汽车开发软件,Apple的研究人员在arXiv上发表了一篇识别3D物体的论文。

应用:酷研究项目

2017年发表了太多有趣的项目和demo,这里不可能全部列出。不过,有一些项目特别突出:

更偏向研究性的:

数据集

众所周知,用于监督学习的神经网络非常渴求数据。因此开放数据集对研究社区而言是极其重要的贡献。下面是2017年一些突出的数据集:

深度学习、可重复性、炼金术

2017年,有很多研究者提醒大家关注学术论文结果的可重复性问题。深度学习模型通常依赖于数目巨大的超参数优化,以得到好到足以发表的结果。这些优化可能变得如此昂贵,以至于只有像Google和Facebook这样的公司能负担得起。研究人员并不总是发布他们的代码,或者忘了在最终论文中写上重要的细节,或者使用了和论文描述略有不同的评估过程,或者通过在同一分区上重复优化超参数以致过拟合了数据。这使得可重复性很成问题。Reinforcement Learning That Matters一文表明,从不同的代码基中得到的同一算法取得了很不一样的结果(方差很高):

不同的代码基

GAN生而平等吗?一个大规模的调查显示,一个经过精心调优、基于昂贵的超参搜索的GAN,可以击败那些声称表现更好的较复杂模型。类似地,On the State of the Art of Evaluation in Neural Language Models(论最先进的自然语言模型的评估)表明,经过适当正则化和调优的简单LSTM架构,可以击败最近的模型。

在一个引起很大反响的NIPS演讲中,Ali Rahimi比较了最近的深度学习方法和炼金术,呼吁更严格的实验设计。Yann Lecun觉得这是一种羞辱,在第二天立即发起了反击

加拿大和中国的人工智能

随着美国移民政策的收紧,看上去有更多的公司在海外设立办公场地,加拿大是其中主要的目的地。Google在Toronto开设了办公室,DeepMind在Edmonton开设了新办公室,Facebook AI Research在Montreal设立了实验室。

中国是另一个受到大量关注的目的地。大量的资本,大量有天赋的开发者,准备就绪的政府数据,在AI研发和产品部署方面,中国是美国相当的对手。Google也宣布在北京设立AI中心

硬件战争:Nvidia、Intel、Google、Tesla

训练最先进的模型需要昂贵的GPU,现代深度学习技术在这一点上很出名。目前为止,Nvidia是最大的赢家。2017年,Nvidia发布了最新的旗舰GPU——金色的Titan V

但竞争正在增强。Google的云平台上可以使用自家的TPU,Intel发布了Nervana处理器,甚至Tesla也承认正在研发自己的AI硬件。竞争还可能来自中国,专门制作比特币矿机的硬件制造商想要进入面向人工智能的GPU领域。

炒作和失败

炒作越猛,责任越大。主流媒体报道的内容几乎总是无法与实验室和生产系统上实际发生的事对应起来。IBM的沃森就是过度炒作的营销模范,没能交出相符的成绩。2017年,所有人都讨厌IBM 沃森,这一点也不奇怪,因为沃森在医疗领域屡战屡败

关于炒作,最佳的故事大概是Facebook的“研究人员关闭可以发明自己的语言的AI”,我故意没有加链接。这篇报道已经造成了恶劣的影响,你可以搜索到它。当然,这标题与事实离得不能更远了。实际发生的事情是研究人员停止了一个标准的实验,因为实验看起来没有给出好的结果。

然而,应该为炒作而内疚的不止媒体。研究人员也有越线的行为,标题和摘要不符合实际的实验结果,比如这篇自然语言生成的论文,和这篇面向市场的机器学习

高调的招聘和跳槽

Coursera联合创始人吴恩达,很多人大概是通过他的机器学习在线课程认识他的,在2017年上了几次新闻。吴恩达三月份离开了百度,(他曾在百度领导AI团队),拿到了1.5亿美元的投资,宣布创办一个新的专注制造业的创业公司,landing.ai。此外,Gary Marcus不再担任Uber人工智能实验室主管,Facebook挖了Siri的自然语言理解负责人,一些知名的研究人员离开OpenAI创建了一家新的机器人公司

2017年保持了学术界流失科学家(去业界)的趋势。大学实验室纷纷表示它们无法与业界巨头开出的薪水竞争。

创业公司投资和收购

像上一年一样,2017年,AI创业的生态环境一片繁荣,有不少高调的收购:

拉到大笔投资的新公司:

最后,新年快乐!感谢你读完了这篇长文 :)

原文 AI and Deep Learning in 2017 – A Year in Review
感谢原作者Denny Britz授权论智编译,未经授权禁止转载。详情见转载须知

本文来自机器人之家,如若转载,请注明出处:https://www.jqr.com/news/009477
爆料投稿,欢迎投递至邮箱:service@jqr.com
机器学习人工智能深度学习 review
推荐阅读

最新评论(0

暂无回帖,快来抢沙发吧

评论

游客
robot
发布需求
联系客服联系客服
robot
联系客服