走秀网副总裁宋星：如何让数据说真话

　　数据不等于信息，更不等于真相，搞不好还是纯粹的误导，最好的方式莫过于让数据分析师回归业务部门，民主化管理。

　　■文/宋星，走秀网(微博)副总裁

　　人人都渴望数据，但这可能隐藏着陷阱。拥有数据意味着什么？——Nothing。数据不等于信息，更不等于真相。数据在大多数情况下，要么是没有得到利用，要么干脆就是纯粹的误导！

　　人人都渴望数据，可没人尊重数据。矛盾吗？不，其实这幕天天上演。

　　我们怎么样才能真正建立起称得上“数据驱动”的电子商务组织？为什么数据驱动的组织那么困难？

　　迷局一：谁能决定数据驱动组织

　　决策通常来自于三个不同的方式：感觉、经验和认知。相对而言，由于感觉和经验虽然模糊却得来容易，因此决策者常常不由自主地利用这两种方式作出判断。

　　那些具有卓越感知和经验的操盘手，例如人人景仰的乔布斯，他们的感知和经验甚至可以凌驾于一切之上。而中国今天的商业智慧中绝大多数也是感觉和经验，这说明感觉和经验甚至是决定成败的。

　　因此，如果一个组织确实依赖于感觉和经验，那么，数据驱动本身就并非一个重要的命题。

　　另一个困难在于，CEO或者管理层的态度对推进数据驱动组织的形成，是否具有关键性的作用？事实上，如果CEO或者管理层，不认可数据驱动型的组织，数据驱动无从谈起。而反过来，即便CEO或者管理层支持数据驱动型组织的建立，这一组织也未必能够真正建立起来。

　　数据驱动的组织一定是宏观和微观的结合，即宏观层面上，要提供供管理层使用的策略型数据，不至于让整个组织进退失据；微观层面上必须指导业务执行者的行动，让他们能够进行准确地选择，不用通过不断的“试错”才知晓真正有用的下一步。宏观的确重要，但微观更加致命，尤其是对如今的电子商务组织而言。

　　因此，数据驱动型的组织能否实现，要看需求方。真正的需求方是执行团队。执行团队是依赖于感觉和经验，还是依赖于数据，这才是数据驱动型组织能否实现的关键。如果执行团队渴望数据，利用数据，依赖数据，这个组织的数据驱动文化就很容易实现；CEO和管理层要做的，是建立这样的执行团队。

　　迷局二：数据中央集权太过理想化

　　假设我们的执行团队是一群真正欣赏数据的人，数据驱动型的组织是否就实现了？

　　在封闭系统内，有需求未必就会有供给。你欣赏iPhone5，但你没能力自己做一个；你渴求数据，但你未必能通过自己的力量获得。

　　所以，希望建立数据驱动文化的组织，一开始都把视线集中在建立能力上(当然，首先是建立需求，而非建立能力)。

　　构建能力被称为“使能(enable)”。让这个组织能提供数据，有多种办法，但最常见的办法，是图1所展示的解决方式：

　　数据部门是个Hub(一个多端口的转发器)，这群人解决一个组织大部分的数据需求。当业务部门需要数据的时候，他们提交需求给数据部门，然后数据部门开始抽取、运算和分析，把数据和结果反馈给业务部门。

　　说实话，这真是一种笨办法，类似于无所不包无所不揽的计划经济：

　　这个方法能够让CEO或者管理层非常牢固地控制数据；数据部门可以集中起来工作；节省人力，组织看起来规划清晰。不用在各处安插做数据做分析的人，确实省下一大笔人力和管理成本；相对简单的数据系统。因为数据部门管理数据，诸如权限之类的系统设计，可能就不是那么重要了，反正有人提供数据报表即可。该给哪些部门，不给哪些部门，人工去每次划分确定就好了。数据的模型——也没那么重要，人去分析就行了，不需要太高的自动化，也不需要太强大的BI(商务智能)。

　　但这确实是一种笨办法，如果这样规划数据部门，最可能产生的结局是：数据部门会——疯掉？这不是耸人听闻，如果数据部门要负责所有业务部门的数据，得需要多少人呢？肯定超出你的想象。

　　此外，业务部门不会仅仅满足于数据被提供出来，他们希望数据及时些，更及时些。手工作业，实时太难，追求速度就意味着大量的人力和脑力的消耗。

　　好吧，就算数据部门能够提供实时数据，又能怎么样呢？数据不是策略，数据总得经过分析和处理。数据部门不了解业务，他们能分析好吗？而如果由业务部门自己去分析，实时性不仅得不到保证，数据部门的价值发挥也大打折扣。

　　那么，把图1中的数据部门换成BI系统是否是更先进的方式呢？

　　BI系统的本质是用来取代人手和人脑。这是一个好方法。把人从机械的工作中解放出来，提供给业务部门自动化的报表，而且还能承担一定的思考工作。

　　这也是为什么，一个真正具有数据驱动文化的公司，必须要有一个确实好用的BI系统。或者，较浅层次的，得有一个自动化的报表系统。

　　但BI最大的问题是——机器终究是机器。

　　BI可以解决一些机械的工作，能够建立数据模型帮助人快速得出一些结论。但跟业务相关的细节分析，BI能够帮你发现现象，但无法告诉你原因。

　　此外，BI系统的效用，本身也极大地依赖于人。

　　首先，BI系统的设计，必须与一个公司自身的业务相契合。人才能完成这个让BI与业务需求相契合和匹配的工作。

　　其次，BI系统的建模和规则，全部是人来完成的。

　　最后，BI不可能给你答案，所有的答案，都需要人去寻找，去解答。

　　迷局三：数据误读，比没有数据更可怕

　　传统零售的BI系统和分析团队往往经过了超过10年的进化，因此早已形成体系和一套具体的方法。电子商务虽然也属于零售业，但很显然，这些公司年轻太多，让业务部门拿到数据后，自己去做分析和评估，是困难的。

　　最大的隐患在于，数据分析事实上容易变成一个粗暴简单并不断被“自以为是”的经验所干扰的工作。而因为时间的压力和数据分析经验的缺乏，误读数据，并进而造成这个结论背离事实的情况是时有发生的。更何况，业务部门背负业绩压力，很容易从一开始就主观上倾向于让自己不那么客观。

　　图2和图3的数据实际上是完全一样的，可是，它们在阅读者心理上的感觉却是截然不同的。

　　由图2得出的结论，是利润在近期剧烈的波动，而图3的结论则是利润在近期平稳维持在低位。这两个结论并不能简单说明它们正确与否，而是取决于实际的商业环境。例如，如果你的生意平常一天是1000元以上的利润，那么显然图4给你的结论更有参考意义，你应该探求为什么最近的生意几乎停滞了。

　　但是，如果你的生意一天的确最多不超过100元的利润，那么图2更有价值。而且你可能会觉得，利润数据还不错，这几天还有明显的上涨的趋势。不过，或许你还是不能高兴得太早。图4和图2在利润上的数值是完全一样的，不过增加了另一个数据项：收入(蓝色点)。

　　你可以看到尽管利润上升了，收入上升的趋势更为显著。这意味着，利润增长并没有收入增长得快。换句话说，我们的投资回报率(ROI)下降了。因此利润虽然上涨，但完全不值得我们高兴，反而应该检讨，为什么效率降低了。

　　数据的误读很多时候并非是故意的，而是跟经验有关。这些经验在于两点，第一，对数据的运算和把握。例如，合理建模，合理的数据可视化，以及对工具合理的应用；第二，在于对业务的准确把握——做到看数说话，与实际业务几无偏差。第二点是建立在第一点的基础上的。如果第一点出现了一些问题，或是没有技能，或是没有经验，第二点便会遭殃，即使对于业务有很好的感觉和清晰敏捷的头脑，也会为数据所累。

　　来看另一个真实的例子。

　　Johnny为在美国销售某一个商品而投放Google AdWords的广告。这个商品的利润额在2011年每个月的表现如图5所示：

　　很显然这个商品的生意出了问题，有必要找出原因。

　　利润下降，要么是收入减少，要么是支出增加，要么是二者同时发生了。从支出上看，每个月的支出变化不大，而且实际上，当利润降低的那些月份，支出反而也是略有降低的。很明显，收入下降是造成利润下降的主要原因。收入为什么下降呢？

　　很快，他们找到了一个相当有说服力的数据关系：当SEM关键词的平均排名下降了之后，销售收入也非常明显地下滑。如图6所示。假设一个情景：有一个非常缺乏经验的初级SEM专员，他很可能给出的结论是：收入降低，是因为关键词排名降低，因此需要提升关键词排名，以获得更多收入提升利润。

　　你当然相信这个结论是简单粗暴，并非反映事实。事实是，关键词排名升高，当然会获得更多的点击从而获得更多的销售额，但成本同时也会提高。于是，更有经验一些的SEM专员，会继续坐下来寻找下一个关系，如图7所示。

　　这个图简直是图6的翻版，只是一个是收入，一个是利润，数据的比例尺不同而已。看起来，利润和关键词平均排名的关系和收入与关键词排名的关系也非常一致。现在，我们可以放心大胆地得出结论——提升排名，以获得更多的利润！

　　但结果——利润不仅没有升高，反而更加下降了——甚至某些天是负的，尽管关键词的排名又重新回到了3位左右。

　　之前数据反映了某种似乎确定无疑的关系，但按照这种关系行事，并没有带来预期的效果。我们必须承认，SEM投放是一个复杂的策略过程，并且因为瞬息万变的外部环境(竞争对手的出价)，而造成最优化的出价方式总是动态的。

　　上面的例子，Johnny认为原因很简单，这个商品的关键词投放可能已经遇到了瓶颈，因为外部的环境发生了变化。Johnny查看了其他的数据，例如，CPC(点击广告)数据，Johnny发现在这12个月中，CPC的变化并不大。CPC没有明显变化，而排名在逐渐降低，说明竞争对手在不断增加出价，这样，相同的投入情况下，排名降低，收入减少，利润减少。

　　可是，增加出价后，收入增加，同时成本也上升了。由于竞争环境的影响，要达到以前的排名，所出的价格甚至是之前价格的三四倍，利润空间被压缩得非常厉害。

　　所以，我们认为，这个商品本身的市场环境已经发生了变化，高ROI的好日子过去了。现在的策略，是在微利的情况下生存，尽量更精细化更实时的优化，保证不亏损，并着手开发新的商品。

　　因此，无论是数据误读，还是根本数据就是数据，从来没有转化成有价值的信息，都意味着反面的效果，甚至，还远不如根本就没有数据。

　　反思：数据民主化

　　凯文·凯利在《失控》中告诉我们，上帝创立世界，从没有让世界按照“中央控制”模式运行。如果我们需要一种健康的数据驱动的企业组织，那么我们就需要“数据民主化”，而不是数据集中化。

　　一个组织的数据驱动类似于人的神经系统。大脑负责核心的运转(关键执行)和高级的思维(战略)，各系统(消化系统、循环系统……各经营部门)根据机体的内在和外在环境变化自主运行，形成一个反应灵敏、步调协调的统一组织。因此，数据驱动组织，不仅仅依赖于中央思考部门(数据和策略部门)，同样依赖于各运营部门自身的神经单位。

　　按照这样的思想，理想的数据驱动的组织分为三个层次：中央控制的战略层、拥有自己“神经”的运营层，以及实现这一切的基础设施层。

　　与这种模式相对的模式，则是集中化的模式——高层(例如一个集中的数据部门)拥有数据，然后指挥运营层的执行。这种模式难度太高。

　　而正如迷局三所述，数据民主化之后，中层(运营层)如果没有数据正确解读的能力，可能比数据误读更可怕。因此，为实现数据驱动组织结构，数据民主化不仅仅是让“数据本身”民主，也是让数据能力变得更加民主，即数据资源和数据分析资源的共同民主。

　　因此，要让数据分析师回归业务部门，而不是龟缩在数据部门中。

　　我们需要拆散数据部门的集中结构，让数据分析师分布到各个业务部门中去。他们帮助业务部门运用数据系统、获取数据、处理数据，并与业务人员一起(结合实际业务)更直接更快捷地解读数据，并将结果直接应用于业务。

　　这样，数据部门则只负责两块，即三角形结构中的最高层(竞争环境研究、全局性跨部门的策略研究、战略研究以及绩效跟踪)和最底层(数据仓库、报表和BI，以及对它们的维护)。中间的运营层面，应该是数据分析师和业务部门共同完成的。

　　这或许是最类似于人体组织的“民主化形式”——我们的大脑不是神经系统中唯一的器官，而是能够进行“思考”的器官，也绝不仅仅只是大脑。

来源：和讯科技作者：

免责声明：本文仅代表作者个人观点，与世界朋友网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

[责任编辑：世界朋友]

走秀网副总裁宋星：如何让数据说真话

精华推荐

相关内容

视觉焦点

大家爱看