纽约大学陈溪：机器学习到智能决策还有多远-搜狐

　　6月24日下午，钛媒体和杉数科技主办的2017 AI 大师论坛在京举行，论坛邀请了五位算法优化、机器学习领域的顶尖教授、学者出席并发表学术演讲。论坛上，五位科学家围绕算法、数据、应用，结合各自的研究领域，畅谈了现状和未来的发展。纽约大学商学院助理教授陈溪参加此次论坛并发表题为“从机器学习到智能决策“的演讲。

　　雷锋网了解到，陈溪博士目前是纽约大学商学院助理教授，Carnegie Mellon 大学机器学习系博士，也曾跟随机器学习泰斗Berkeley教授Michael I Jordan 做了为期一年多的博士后研究。同时，陈溪博士拿过 Google Faculty Research Award，在2017年还获得了福布斯杂志全美 30 under 30 最有影响力的青年科学家称号。陈溪博士的主要研究领域为：机器学习、高维统计和运筹学。

　　在演讲中，陈溪博士表示，机器学习是从数据出发，更关心的是预测的问题，或者说更好的去理解这个数据的模式。比如说深度学习，非常擅长对数据的模式进行识别，但是对于不确定的因素下的智能决策、逻辑上的推导，AI还是比较薄弱的。“决策是非常重要的，仅仅有预测是不够的。要把两者有效地结合起来。”

　　雷锋网(公众号：雷锋网)在不更改原意的基础上做了删减整理：

　　陈溪：非常感谢在礼拜六的下午来到这个现场，我给大家分享一下我从机器学习的理解，我会讲到这个decision making，预测不是我们最终的目的，我们希望能通过机器学习最终帮助企业做出智能决策。

　　我的经历也是比较广泛，我先在Carnegie Mellon 大学的运筹学读了硕士学位，后来我在carnegie mellon university 攻读计算机学院下的机器学习的博士，后来在Berkeley 计算机和统计系跟随Michael I. Jordan 做过博士后。我的研究兴趣非常广泛，包括机器学习（尤其是在线数据的学习和决策决策问题, multi-armed bandit），大规模的高维数据统计推断，另外对运筹运营的管理也有一定的工作。这些方面看似是不相关的，但是其实呢，现在看起来是非常有联系的，最根本的联系是我们所有的学科都是用数据驱动的，并且最后都是要为数据服务的，要挖掘数据核心的价值并用以决策。

　　而且我认为这三个领域结合起来才能对这个数据有一个更深更好的理解，并且做出有效的决策。

　　这个图大家可能不陌生了，现在很多人都讨论大数据，有三个不同的特点。

　　一个是量越来越大，从MB一直到PB，而且它的速度越来越快，以前是隔一段时间，现在这个real time，给传统的统计和机器学习提出很大的挑战，传统的数据是收集好，放在硬盘上进行一些挖掘，但是现在这个数据页都是实时进来的，比如你在百度或者做一个搜索，或者在购买一个在线产品，数据就进入服务器，所以数据是不断的在线更新的，第三是数据的多样化，以前都是比较简单的，可以放到文本或者data base，现在更多包括社交数据，手机的数据，视频的数据，也都是没有非常好的结构，对数据多样化的趋势越来越明显。

　　大家提出数据科学，这个图是我们NYU Yann Le Cun 教授机器学习课程用的第一张课件。

　　就是说你仅仅是相当于传统的统计和计算有机结合起来，就产生了机器学习，但是光有这个机器学习是不够的，光发明了这个算法，或者说你光有这个深度学习的结构，这并不是数据科学，要跟实际的问题结合起来，像刚才李建老师、王子卓老师讲到的，把机器学习和定价问题结合起来，在在线出行结合起来，才成为数据科学。这里需要很多一些专业知识，比如哪些地方是交通高峰期，哪些地方人口密度大，这些应用需要把计算，统计，和实际具体问题结合起来才能产生价值。

　　什么是机器学习，首先是数据，然后是学习算法，然后我们需要建模对数据的产生是有一定假设的，在概率模型和假设的基础上建立算法，就可以预测数据的销量，出行的时间，但是更重要的是我们可以通过预测去真正理解数据，比如说反馈出来，这个模型到底适不适合这个数据。那么机器学习一般会分为两类，一个是有监督的学习，和没有监督的学习，当然最近我们还有很多新的学习领域，想半监督学习，active learning, 强化学习等等。

　　监督学习的核心思想是非常简单的，首先就是通过X对Y进行预测，X是你淘宝或者京东以前历史购物的信息，这时候给你一个网页预测你会不会买，或者说放一个广告页面在上面，你会不会点开这个广告页面。我有好几个不同的广告，看看有什么样的概率你会点开这个广告页面，是点开还是没有点开。然后我们是对这个function class有一个假设，我们假设这个是属于H，然后这个学习算法就拿进来，看后在这些training examples，通过learning algorithm就得到这个g，但是这往往并不是真正的prediction function f，但是我们希望找到一个H，使学习出来的g更加的接近f，当然我们需要有好的优化算法，因为你不可能穷尽H里面所有的function。我们要有训练样本，到底买还是没有买，根据历史数据得到的，预测的值相当于老师告诉你的。所以叫有监督的学习。

　　没有监督的学习就更加的需要把今天到场的人员进行分类，但是没有绝对的标准，按照年龄进行的序列，这个性别进行的序列，按照到场的人员不同的行业进行聚类。根据不同的标准，到不同的聚类，这个时候叫没有监督的这个学习，没有一个绝对的标准，根据你不同的需求做出的聚类或者说价格。

　　在机器学习未来20年的高速发展，大家多多少少看到这些词汇，大家公认投票选出了10个最受欢迎算法，然后naive bayes 分类器，然后是k-means 聚类算法，support vector machine 分类器，在一个是线性回归，还有一个logistic 回归，神经网络，随机森林。其实随机森林是非常强大的。比如说分类的话，随机森林比神经网络有更好的可解释性，分类树可以让大家看到清楚的分类的过程。

　　目前最火的机器学习的算法是深度学习。之所有这么powerful, 一个重要的原因是我们有了new hardware， GPU发现这个处理速度的快，各个之间的通讯非常的便捷，比如说从一台机器到一台机器，从硬盘到硬盘的通讯非常的缓慢，但是不同的GPU非常适合并行化，有了这个GPU才可以训练非常大规模的deep 神经网络，才导致了算法革新。另外最近像IBM公司也提出 neuromorphic chips，可能想突破这个冯诺易曼的这个体系。

　　这个机器学习还有一个很大的发展，就叫cloud enabled。放在云端，给各大企业提供一些接口，杉数科技也正在立这个方向，把很多相当于库存定价方面的东西变成一个接口，这个接口不仅服务于大公司，还会服务于所有的中小型公司，当你有一个货品需要定价的时候，也可以把你的数据交给这个机构。有新的数据进来很容易告诉你这个产品该给你多少钱，就慢慢变成更加广泛的通用服务。

　　当然机器学习最近有很多的这个成功的案例，比如说imagenet。

　　这是IBM Watson，这比较早一些，当时jeopardy playing 是一个智力抢答的竞赛，IBM的Watson 能够理解问题并在数据库迅速找到答案，这里可能要做一些逻辑的推理。比如说这个数据是“临近北京的人口密集的地方是什么”，因为有这个地理位置的信息。这个是IBM deepQA问答的总负责人，他说机器学习真正使得计算机变得更加的聪明，使得计算机回答一些问题，并且在回答问题当中，他学习了这个问题的回答是错误还是正确的。

　　这个大家也非常的熟悉。阿法狗，一开始战胜了韩国的李世石，然后在围棋上，相当于计算机超越了人类，但是大家对这个事情不必过于的惊讶，硬件不断的发展，我觉得战胜围棋是必然的。围棋看似复杂，其实规则比较简单，你可以随时看到对方棋子的动态，比商业问题简单的多。商业的决策可能有很多的信息，并不像棋盘的黑白子，是你无法知道背后的原因的。其实星际争霸这样的游戏，可能比这个围棋还要复杂。因为你不能完全知道对方的信息，这对AI是一种挑战。所以还有很多的问题需要我们解决。对于非常多的隐藏信息，对于逻辑上的推导，AI还是非常薄弱的。

　　机器学习广泛地应用在商业当中，这里是Lukas Biewald 总结的一些商业世界里面机器学习的应用。首先机器学习可以让用户产生的数据变得更加有价值，比如说pinterest，社交网络的公司，会告诉你更有趣的是什么。中国也有今日头条，比如说Yelp类似于美国的大众点评，比如说吃了饭通过数据传上去，哪些好吃的，使得用户的信息传上去更有价值。另外机器学习可以让你更快速地找到产品。然后机器学习可以跟你有更多的交互，以前打电话有一个接线员，现在打电话航空订票，这个航班延误就自动的转到比如说改签的人哪里，否则以前要换好几个接线员才可以改签。另外，机器学习可以更好的理解用户的行为，比如预测你是否喜欢这个产品，买东西是理智的还是剁手党。

　　我觉得机器学习是从数据出发，更多关心的也就是预测的问题，或者说更好的去理解数据的模式，比如说深度学习，非常擅长对数据的模式进行识别，但是真正对于这个决策，我们做的还不够。这个时候其实更需要把机器学习跟运筹结合起来，这样通过数据到决策，因为在商业当中仅仅有数据预测是不够的。

　　所以第二部分是讲从机器学习到决策，

　　实际上我们有很多的商业问题都是需要决策的，管理中我们需要决策库存，需要决策在什么地方建厂，需要决定比如说滴滴的车、快递、外卖要走哪一条路线，如何定价，如何决定在推荐系统里，我们给你推荐什么样的产品，我们在金融里我们要怎么做一个financial product portfolio。

　　Operations Research/Management所以就提出一个要求，机器学习更在于数据和预测，而运营是用模型来进行决策。所以我们要有效的结合起来一起。我举一个例子，你需要做一个随机的模型把你的价格跟用户买的概率联系起来。一般来讲，我们的概率模型会认为价格高用户买的概率低一些，价格低用户买的概率高一些。当然有的时候并不这样，比如说苹果手机，大家在开始的时候觉得这个是身份的象征，即便价格很高需求量还是很大，不同的产品有不同的模型，把价格跟用户需求建立起来，当价格和需求知道之后，就可以决定我怎么能够更好的进行定价。

　　这是在去年的Informs大会上Key note speak 的一页slides，用的一个gartner analytics的图，从数据的描述，诊断，发现，预测，到最后要做决策，其实好的预测并不见得可以发挥最好的作用，决策才是落地的关键。

　　我举两个例子，这是2016年informs plenary talk里面的，比如说未来1年，机器学习我要预测未来的股票，但是在运筹学里面我需要通过信息决定最后我到底要不要买这个股票，什么时候买什么时候卖这是决策的问题。光有涨跌的预测，80%的概率会涨，那么我到底要买进多少这是非常复杂的决策问题。

　　这是选址的问题，比如说你有这个风向的数据，大气的数据，雾霾的数据，要预测，比如说明天的雾霾是怎么样的。但是可能有更好的决策问题，就是说，我要在什么地方建立风力发电站，这样我才能够把能源更好的利用，就是说局测问题通过这两个小例子可以给大家说明，决策是非常重要的，仅仅有预测是不够的。

　　在2014年的调查中毕马威说，有95%的CIO和CFO认为并没有把数据和决策的桥梁搭建好。我希望通过一个模型给大家讲一个有趣的例子，使大家理解一下，如何把学习和决策有机的结合起来。

　　这个算法起源是非常简单，起源于赌博，当然赌博在中国是违法的。我讲一个数学的模型，有很多的老虎机，但是每个老虎机都不一样，每拉一个老虎机就会得到一定的报酬，这个钱是随机的，有一个上下的幅度，你作为想赌博的人，这么多的老虎机，我要拉哪一个，这样的话，我通过测试得到最好的老虎机，我可以得到最多的钱。

　　这里面有很重要的问题。一开始给你的老虎机是陌生的，所以你需要勘探，通过试一试每一个老虎机得到更多的信息，另外一个是开发，当我了解到这个老虎机效果不错的时候，我就需要多拉这个老虎机，使得它可以得到更大的收益，那么现实生活中问题更加的复杂，每个老虎机并不是一成不变的。给你的钱随着时间的变化，这样我们就不停的在这个勘探和开发中来进行转换。

　　所以勘探就是要我们做一些随机的动作，使得我们知道每个老虎机是好还是不好，那么开发就是当我知道这个东西很好，我就要不断的利用，这两者是缺一不可，因为你没有足够的勘探，选一个老虎机不停的去开发，如果你选的其实是不好的老虎机，你的效益会非常的差。

　　所以一定要有长远的目标可能会牺牲短期的这个利益，你随机的测试会牺牲短期的利益但是会换取长期的利益。

　　比如说现在有两个老虎机，玩了几次，第一次拉5块钱，第二次拉0块钱，然后根据这样的顺序，我就应该去拉这个老虎机2，但是实际上不是这样的，因为每次拉都给你5块钱，但是第二个老虎机呢，其实可能有四分之一的时间给你100块钱，剩下的给你0块钱，如果多拉的话就会关注到这100块钱，因为没有足够的拉第一个老虎机，以为第二老虎机是最好的，这就是勘探严重不足的例子，所以老虎机的例子非常典型。有些时候，这个用户并是我想主要重点开发的用户，但是我没有足够的勘探，那么这样就可能损失了重要的信息，其实多探测几次可能更有价值。

　　这是叶老师和王子卓的一篇对于单产品的定价我们一边的学习然后一边的做的重要文章，这边商家我们要给一个最好的定价系统，得到他们的收入，所以你需要理解价格和用户购买概率之间的关系，勘探是我们要试更多的价格，想知道价格在用户上的反应，开发是我们知道用户对不同的价格进行选择的时候，我们就要在这个用户开发上下功夫。

　　Crowdsourcing众包最近非常火，能够用很少的钱得到大量有标签的数据。我在这方面做了很多工作，上面列举两篇发在机器学习最好的期刊的文章。和我Microsoft实习导师Dengyong Zhou一起完成的。第一篇也是和我的博士后导师Michael I. Jordan 一起合作的。举个简单的例子，把这些图片分配给每一个人，然后每个人坐在这个电脑前，就告诉你这个东西是正1还是负1，不同的人对图片的反应是不一样的，两个人说正1，然后一个负1，然后取majority voting. 因为对于一个新人，需要给他图片来测量他的能力。

　　我们要知道每个人的信息能力的时候，我们要把图片给最合适的工作者，当一个图片很难的时候我们需要决策到底要分给多少人。

　　这有两篇在机器学习最好的会议上发表的文章，其中第一篇文章也是我跟李建老师一起还有周源老师一起研究，也就是我们想知道最好的老虎机是哪一个，或者哪几个，或者我们想通过最少的图片知道哪几个工作者擅长处理这些图片。这是一个排序的问题。另一个例子是，假设你有两个广告，你知道哪个广告的设计好，哪一个广告是最吸引用户的。怎么办？随机测试这些用户，通过最少的测试来知道哪一种广告的设计是最好，找到那个K-arms，每个arms对应一个广告，然后我们有一段算法，不断的询问，把好的留下来。

　　这个可以有很多的应用，可以应用在医药、系统、广告、拍卖，还有金融科技里。

　　后来我们把这些想法，用在跟杉数科技合作的唯品会项目里面，这是在美国非常有意思的。

　　这是一个和MIT David教授以及他的学生合作的例子，他也是我非常尊敬的MIT的大师，在运营管理和机器学习的交叉方向近几年做了很多杰出的贡献。他给我讲过一个公司叫做Stitch Fix，每个月甚至每两个礼拜，定期给一个女士寄一个盒子，有5个衣服，选择一件留下来，把剩下的退回去，你选的那一件就要收钱，你说5件衣服都不喜欢要退回去，会象征性的收一点邮费。那么怎么寄这些衣服？我们会有搭配。比如说用户的年龄，是男性还是女性，是职场还是学生，我们以前推荐的衣服，为观察他买哪些衣服提供很多的信息。

　　比如新注册的会员，我们有这样的信息，决定到底给他做什么样产品的推荐。

　　这个其实跟以前所谓的用户简单的聚类相比有非常大的优势，因为以前的聚类我们就通过用户是男还是女的。对于新用户，可能并不适合某一类，或者说用户的信息非常复杂，所以，机器学习的观点引入高维的环境的变量，就可以观测到连续的用户变化，相当于用户的种类无穷多种。

　　然后我们通过用户推荐哪些产品，做哪些决策，最后我们要使它的收益最大化。

　　我们相当于可以建立一个用户的信息，给他的推荐，观察它的决策，这是静态选择的过程，最重要我们是叫做learning while -doing。

　　最后我做一个简单的总结。

　　首先我想说商业是大量聚集在决策上的。所以传统的机器学习一定是不够的，我们一定要关注决策，也是杉数科技主要的理念——从数据到决策。

　　真正商业的问题是极其复杂复杂的，光有这个机器学习是不够的，我们要把机器学习和科学还有统计结合起来才会有新的数据产生。

　　机器学习这几年的发展，有图像处理、文本处理，通过这些数据大家可以得到更好的表现，这样大大的推动机器学习的算法。商业大规模的公开数据集还是非常少的，以后有更多数据集，比如说像公司分享数据集，更多研究人员进入这个领域，这样我们就可以得到更多的知识，大大的推动商业化下的机器学习或者说决策技术的发展，谢谢大家！