官方微博:

本院新闻

专家演讲 | 刘克:数据支持的物流科学决策

  • 作者: 超级管理员
  • 时间: 2017-07-04 17:21:22
  • 点击率: 1360

6月27日,由中物协(北京)物流工程设计院承办的全球智慧城市高峰论坛智慧物流分论坛在上海成功举办,中科院数学与系统科学研究所研究员、中国运筹学会秘书长刘克在会上刘克教授发表主题为“数据驱动下的科学原理”的演讲,以下是演讲记录:

 

 

 

今天我将从四个方面来给大家做一个介绍,首先是“科学决策的理念”,其次是“数据、经验的支持”,第三是“共识的形成”,最后是“模型、数据的支持和AI的作用”。

 

科学决策的理念。首先决策是必然的,上至国家层面,下至每个人的日常生活,都是在不断地做决策。首先回忆一下人是怎么做决策的,人肯定要根据当时的现状和观察到的环境,把诸多因素考虑进来以后,选择一个最合适的决策方案并加以实施,这就是决策形成的过程。

 

在这个计算过程中存在几个关键因素。第一个就是决策者对周围环境的认知和对当前自身状态的认知,这个认知在决策中实际上是通过数据来显示。早期的时候人们在做这种决策的时候往往是凭经验,根据人们对现实状况的总结和自身经验的融合,最终产生一个决策方案。这里边反映了人们通过经验总结出来的一定的客观规律,这个往往是非常难以量化;第二个就是依赖于决策理论技术的发展,经验决策的科学依据必然不如依靠决策理论技术做出的决策。随着科技的发展和新技术的出现,一些决策行为逐渐的变得越来越科学。当然还有一点必须要提的就是人是懒惰的,科技进步的发展都是为了让人更懒惰一点,因此人为了更懒惰,必然要去挖掘更新的方法来使得人们的决策行为越来越容易。

 

下面我们来谈谈“数据经验的支持”。首先给大家举个例子,我们知道农民种庄稼这个事情很古老,在刀耕火种的时候就已经存在了,那么农民在往一个坑里播种子的时候要播三粒种子,那么为什么要下三粒种子呢?这实际上就是他做决策的一个经验总结,如果种子播少了,将来长出来的苗可能就不那么健全,甚至一个苗都没长出来,如果种子播多了,就造成种子的浪费。所以播三粒种子是最为合适的,这就是最早的科学决策的形成。这里面体现了两个关键点,第一是大量实践经验的总结,第二是效果的评估。你对决策的效果要做出评估,这里面包括两种评估,一种是后评估,就是当决策效果发生以后,需要对决策效果进行评估。还有一种是在做出决策以后就要对未来预期的效果做出评估,所以也涉及到评估的技术。

 

不同的决策者在反复的决策过程中,经验得到不断的积累,最后一批具有同样经验的人将逐渐具有一些共识,这样就形成相对比较合理的选择方案。我给大家举个例子,库存问题是物流里面最常见的一个问题,早期人们在研究库存问题时是研究“报童问题”。当年英国有个报童每天从事卖报纸工作,因此每天报童的第一件事是到批发商那儿批发一定量的报纸,报纸数量的多少是由报童自己决定的。那么会有什么样的结果呢?一个结果是报纸买多了,然后没法卖出去,这样会带来一些经济损失。另外一个结果就是报纸不够卖,从而损失了销售机会,这也是一种损失。所以报童要通过平衡这两个损失来选择一个最佳的订货点。对于这样一个问题,报童通过每天的尝试,最终逐渐地形成一个最优策略,这个和定量分析出来的结果是一致的。后来人们考虑到由于订货的时候需要一个固定的支付费用,这个费用与订货量是没有关系的,这个一旦考虑到这个固定费用,这个订报纸的问题就不是一个标准的经济批量订货问题了,它变成了一个Ss策略(Ss策略就是说现在缺少货物但不马上补货,而是等到小s和大S那个差额量,这个差额量的产品卖出去所带来的利润正好覆盖了固定费用,这样才值)。

 

早期的时候人们通过经验总结得到Ss策略的结论,而当时有个诺贝尔获奖者叫Arial也一直倡导库存的研究,而他当时也在用Ss策略。这个Ss策略还有一个典型的例子,1957年在美国一个关于库存研究的学术交流会上,然后当时有三个来自东欧的学者,提出了一个反例说明Ss策略不是最优的。当时库存界的所有人全部都震惊了,人们开始怀疑之前通过经验得到的结论不一定是对的。后来有个叫Scaff的人,他是一个数学系还没毕业的学生,他当时也参与了这个学术交流会,听到他回家做了一番功课,第二天来了以后他说:“你们的这个问题我给你们解决了”。他提出一个叫做“K-two”的新概念,如果这个费用函数满足“K-two”的性质,从理论上可以证明Ss策略的是最优的,当时Arial就回去赶紧查阅自己的所有文献,发现所有的文章都满足“K-two”性质,于是他说道:“我的文章至少不是错的,只是有些地方不完善而已”。

 

下面我给大家举个如何去治理假冒伪劣产品的实例。为了限制假冒伪劣产品,我们建立了非常细致的数学数学模型,模型的结果为:商家可以购买两种产品来满足需求,一个是正规产品一个是假冒产品,工商部门通过工商检查,一旦查出假冒伪劣产品,没收假冒伪劣而不考虑其他处罚。下面这张图表示了这种情况下作为商家的最优策略是什么呢?这个图上有四个区域,白色区域的叫O,当处于这个区域内时,最优策略是商家既不进正规产品也不进假冒产品,只是用当前的货来满足需求;当处于曲线下方O12的区域内时,这时候库存水平从O12的点提升到S1和S2的点,提升到这个点是它的最佳的订货策略,这个时候商家既要进一部分正规产品也要进一部分假冒产品来应付随机的抽查,同时满足需求,这是它的期望收益最大化。同样在O1和O2区域也是类似的结论。


 

下面我们通过一个数值例子来验证,这个数值例子中用到了CPU的市场价格,并使用了海龙大厦采集到的数据。底下这两张图表示的是随着检查概率从0到1变化的过程中商家库存水平的变化,当检查概率逐渐增加时,库存水平会从比较高的水平逐渐下降,直至下降到0.5的时候达到最低水平。这张图表明当检查概率在0.4以下时,市场上全部都是假冒伪劣产品,也就是商家购买假冒伪劣产品所获得的利润超过检查所带来的需求不满足的损失;当检查概率超过0.5的时候,这时候市场上只有真货没有假货,在检查概率0.4和0.5之间的时候是一个真假货并存的,上面这个例子中检查概率为0.4时,S1是真货的库存水平,S2是假货的库存水平。如果要限制假冒产品,可以通过增加检查概率来限制。根据这个例子我们要把它延展为更为普适性的情况。


 

 


下面我给大家举一个多阶段的例子,这个例子是一个数据支持的例子。这个例子最早期是一个叫Haora的一个人,他面临这一家叫Sears的公司如何销售的一个问题。Sears的销售形式是通过邮局系统邮寄产品目录到客户手里,客户根据产品目录去勾选、写信并支付支票,再通过邮局把产品目录寄回来形成销售的销售形式。这种销售形式下我们可以发现美国在上个世纪60年代前后Sears公司就拥有所有客户的销售数据,也就是在那个时候它们对于数据的收集就已经极其重视了,而且数据量相当大,所以叫不叫大数据这件事情其实在很多行业里面倒无所谓,只是现在由于收集数据的技术水平越来越高,瞬间被收集更多的数据,所以现在把它突出成为一个大数据。大数据最早是奥巴马提出来的,他提出大数据概念的时候只提出了前半部分的词汇,还有后半部分的词汇没提出来。当时奥巴马提出大数据时,叫“big data and decision making”。最关键的在于“decision making”,也就是做决策,而大数据只是为更好的决策提供更有效的保障。

 

通常来说,在做决策过程中都会有风险,所谓风险就是说你预期是这样一个数值,但实际上可能跟这个数值的偏差会很大。在这种状况下,如何把大数据和模型建立联系就变得至关重要,早期依靠经验总结,这个过程中模型是隐含的。当分析技术越来越先进的时候,我们可以把很多经验总结变成模型抽取出来,并考虑模型的各个条件是否符合现实规律,这样我们就能通过建立模型来分析并做决策。

 

如果决策的依据足以够你做决策,这时候你并不需要大数据,那么为什么会需要大数据呢?正是因为现实中决策过程受到很多外界不确定因素的干扰,使得决策系统变化莫测,于是我们只能采取统计的方法、各种各样先进的技术和可获得的一些数据来支持,但这些数据都不是确定的数据,这时候我们希望用大数据来支持。我给大家举个例子,“深蓝”机器人是下国际象棋的,由于国际象棋的变化不够大,因此只要人走一步,它就能把后面的步数算出来。而在AlphaGo与人的围棋对战中,尽管目前很多人认为计算能力已经相当大,但是依然无法把围棋的所有情况都考虑在内。那么在这种情况下AlphaGo要怎么做呢?第一,通过拍照把目前的围棋图拍下来,通过识别白子和黑子的位置判断目前的局势,之后选择一个接近于高手的走法。在下完棋子后要分析局势的变化,然后往后模拟几步并进行评估,之后在选择步数的时候就需要“深度学习”。所谓“深度学习”就是通过几层神经网络模拟人脑的学习技术。但是实际上目前人们对于神经网络的“深度学习”还是理解不够,人们无法指出其最终一步是什么,其计算出什么结果人们就要接受什么结果,这与前面“深蓝”的计算原理有明显区别。“深蓝”我们可以把它看成决策树最终导致的结果,是可预见性的结果,因此人们无法战胜“深蓝”,但是“AlphaGo”并不是不可战胜的,如果我们无法战胜“AlphaGo”,只能说明我们的知识储备不够。

 

还有一个例子叫“金沙赌场:不要跟赌场说谎,它真的比你老婆还了解你”,这是一个做人工智能方面的人写的,它说的是很多新技术早在一些领域里面应用了,它能够把你所有的消费数据、所有的活动数据都收集起来,并通过数据判断你的各种情况,也就是说它真的比你老婆还了解你自己。所以我们可以看出来西方在很多地方已经把新技术应用得很广泛了,因此我们不能从概念上去谈,我们要通过实践去做,也就是说我们要去找一些物流企业,它们到底有什么需求?我们怎么去挖掘这些需求?

 

下面我们来谈谈物流中的AI,物流实际上主要是提供服务,那么物流的智能体现在什么地方?从我的角度来讲,我个人感觉是能够更有效地为物流企业提供决策方案,也就意味着给他们提供的方案应该是最好的。从这个物流企业角度来讲是一个什么状况呢?目前我们有很多不同的物流园区(也就是说我们有相应的仓库),有很多不同的生产厂家(产品产出地),各个仓库之间的距离、运输费用和存储费用也都不一样,等顾客的订单下来以后,商品通过什么样的流程最终送到客户手里?这整个是一项非常复杂的运算流程。有一个哥伦比亚大学的教授,他们曾经就单品类产品来做这样一个运算流程时就很困难,现在我们知道新加坡国立大学等有些教授已经开始做这方面的东西,而且有一些很优秀的结果,我希望这些这些决策方案将来都有助于我们物流平台的建设。

 

今天的报告就做到这里,谢谢大家。


 

  • 电话咨询

  • 010-68519188
  • 010-68519189