首页

校友招聘

校友专访

校友通讯

校友卡申请

大数据时代应如何正确看待、运用数据分析支持决策

发布时间:2015-09-15浏览量:作者:张立炜/2013级博士在校生,中国工商银行股份有限公司

  “我们正迈向一个崭新的大数据时代!让人憧憬也令人担忧,充满机遇也面临挑战。”这是2015年5月于贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会发起《大数据贵阳宣言》的开篇词。是的,无论你认识没认识到,这个崭新的大数据时代已经真切的到来,深刻的变革将逐渐显现,大到经济格局小到衣食住行。应对变革和引领变革的唯一方法是学习和创新。


  大数据时代,数据已成为竞争发展的关键资源,而用数据分析指导生产经营决策的能力则决定了企业的核心竞争力。那么究竟如何获取数据、如何分析使用数据,才能真正发挥数据的生产力,有效指导决策?

  面对各种结构化、非结构化数据、各种深奥的统计模型、五花八门的数据挖掘工具、各类多彩炫目的数据可视化工具,我不禁在想,这是技术的狂欢还是忽悠?大数据的发展究竟应该是“技术至上”还是“哲学思想与人至上”?

  带着这些思考,我读了郑毅著的《证析-大数据与基于证据的决策》一书,感觉作者确实对这个问题进行过深入细致全面的探索,见地深刻、阐述有据,人文情怀倾注于字里行间。对如何做分析有正本清源之功效。

  “证析”一词是作者对“analytics”的中文翻译,作者给出的定义是:“analytics就是基于证据尤其是数字化证据进行决策的实践,它区别于那些基于经验、直觉、甚至胆识进行的决策。”也强调了analytics发展的动力来自学术圈,更来自于业界。无论是产品设计、物流规划,还是营销管理,一系列决策都离不开数据分析的指导。

  下面介绍几个让我印象深刻的观点:

  一、业务证析不是以技术复杂性为目的,而是以解决问题为根本

  我本人也以为:能用简单方法处理问题的才是真高手。

  分析一定要看“疗效”,解决问题要用适切的工具和方法。打蚊子不需要高射炮,同样解决一个问题,高手使用的方法往往更简单。同样,解决问题所需要的数据并不都得是海量、多源、异构的数据,小数据也可以解决大问题,能用简单的“食材”(数据)做出好菜才是高手。

  这也让给我想起一个笑话,一个产香皂的厂长十分头痛,因为流水线上经常有漏装香皂的空盒子,但这样的盒子和其他装香皂的盒子表面看并无差异,在传送带上无法区分。于是请了一个博士,博士的解决方法是引入一套X射线透视设备,通过设备查看哪些是空盒子;此事被一个农民工得知,他扛了一台落地电扇,开大风力对着传送带的盒子们猛吹,空盒子自然就被吹飞。博士的方法也能解决问题,但成本较大且做得很累,而农民工凭借生活常识轻松低成本解决问题。这个故事中当然农民工是高手。

  二、业务证析的数据来源多样,从实验获取的数据可作为有益补充

  业务证析强调以技术手段解决业务问题,所以其数据来源不限于数据仓库,可以创造性地通过实验等方式获取数据辅助决策。比如为了检验一个决策的作用,可以做一些试点实验搜集数据分析,而不仅限于使用数据仓库既有的数据。分析师们除了使用庞大的数据仓库来做分析,一定要开放思维、发挥创造力、想象力,感知可以量化的数据来创造性解决问题。

  三、数据的实时分析在特定场景下对企业运营越趋重要

  对数据的利用不能够仅停留在简单的汇总数据、对数据进行事后分析,在特定场景下要能实时收集、分析数据,并对客户的行为实时做出反应。

  作者以拉斯维加斯的Harra's Entertainment为例,该赌场通过对顾客的数据积累、消费模式分析计算出客户的痛点值,如果输钱超过痛点,则此次赌博将成为一个痛苦回忆,也将不再返回该赌场。通过系统测算,某位白人女性顾客的痛点是输1000美元,若系统发现她玩老虎机马上就要输到1000美元时,赌场会派出一位幸运大使将她从老虎机前劝离,并告诉她:“看来您今晚在老虎机上运气不太好。是时候去餐厅犒劳一下自己了,送您一张30美元代金券”。顾客虽然输了钱,回想当天经历总不算太糟。这里的数据分析已经到了实时收集、实时决策的境界。

 

 

  四、证析一定不能只重视技术,而要重视与企业实践融合

 

 

 

  要想让证析在实践中发挥作用,一定不能只重视技术,要充分重视、总结证析实践中遇到的问题,不断探索在现有企业环境下如何更好地组织、管理证析资源与项目,更好地将证析结果融合与企业生产决策流程。


  作者将证析流程大致分为了十四项,并逐一细致探讨。流程为:需求分析、决策流程分析、数据管理、度量、探索性数据分析与数据可视化、提出假设、发现模型、关联与模式、检验与评估、形成理论与洞察、推理与优化、干预与解决方案设计、模拟与仿真、实验、应用推广、监控。从这里就大致能看出证析是怎样一个科学严谨的系统工程,这也提示我们在出一些分析成果后,在大规模推行时最好选一些试点实验反馈,分析成果的实践效果评价极其重要,得到的反馈要进一步来修正之前的分析结果。

  五、要慎重对待证析结果,清楚数字证据的局限

  我个人觉得证析的结果仅能做决策参考,做决策前一定要融合对业务、对常识的了解来综合判断,最终做决策还是人,而不是数据和模型。

  作者指出很多因素可以干扰分析结论,如:有无问正确的问题、被操纵的证据、模型的外推等。对于“有无问正确的问题”,有这样一个例子:当年百事可乐强势推出时,曾进行过现场实验,让受试者各尝一小口不同标签的可乐(可口可乐和百事可乐),结果是百事胜出。可口可乐公司立刻私下重新组织相同实验,得到一样的结论。于是乎可口可乐公司苦思悯想之后更改了多年未变的神秘配方,推出口味更淡、更甜、更像百事可乐的新可乐,这个耗资不菲的改变却并未收到市场认可。原因你猜是什么?原来是问题没问对!谁喝可乐会只喝一小口?可口可乐小口喝可能感受不如百事,但大口大口整瓶喝还是胜过百事。

  六、证析要有人文情怀,在数字之外,要更加关心数字背后的人

  证析必定会在未来有大的发展,它也将承担越来越多的责任,对他人产生越来越深远的影响,越是这样越要关心数字背后的“人”,以人的福祉为最终出发点,带着一份责任心保护客户隐私、慎重做出结论和建议。

  这本书真是让我爱不释手,作者展现出的独立探索、批判思维在当今社会实属难能可贵,作者深刻认识到证析也是把双刃剑,始终要把对人的关怀放在第一位,这样的人文情怀值得学习。

  现在和未来的社会,人或组织按数据来分类已产生不同的阶级:产生数据的人(无论有意还是无意留下数字化足迹的人)、有办法搜集数据的人、有能力分析数据的人。第三类人或组织数量最少,拥有特权,也拥有一份责任。

  我想,怀抱对世界的感激之心、对规律的敬畏之心、对人的关怀之心、对自我本领不足的知耻之心,积极拥抱这个大数据时代,投身于证析的实践中,学习探索并试图引领,也会成就一段精彩人生吧!