七年前我在VDMA的一个峰会演讲时谈到智能物流,为了佐证我们国家的总体物流效率不高,用到了如下的一张图。
今年当我再翻到这页PPT时,发现自己掉进了思维陷阱。碰巧最近又翻到了世界银行的一篇文章Logistics Costs and Economic Development,开头便是下面这张图表。
如何从数据中获得有效的信息,单看开篇的图表,你是得不到任何有价值的信息的。
世界银行的这篇文章中阐述道:
There is a relationship between the level of economic development (as measured in terms of GDP per capita), the composition of a national economy, and logistics costs. While logistics costs can amount to 25% of delivered costs in some developing economies, they can go as low as 8% in advanced economies. Many factors can influence this cost structure:
Transportation infrastructures. They influence transport costs, capacity, and reliability. Extensive transport infrastructures are linked with lower logistics costs.
Role of economic sectors. Economies relying on the primary (e.g. agriculture and mining) and secondary (manufacturing) sectors have higher logistics costs than economies relying on the tertiary (services) sector. These variations are linked with the amount of freight in circulation in relation to the total economic output.
理解下来的意思就是以服务业和虚拟经济为主的经济体,衡量整体物流成本是没意义的。而以农业来说,各国所种植的作物分布状况以及单位面积产生的经济价值不一样,带来的自然是物流费用占总成本的巨大差异。零售物流亦是如此,所以,要比较,只能拿相近的经济细分领域和地理分布来看,不然就是耍流氓。不同的物流成本结构因素对这个数值也会影响很大,你看新加坡,作为天底下最大号的一个收费站,自然物流成本占GDP要低很多。同样的,中德之间比较物流占GDP的比例,一样没有什么意义,两者制造业占GDP的比例,国家的幅员和产业集群,都完全不一样。
TED也有一个很有趣的视频,同样很好地阐述了数据分析中容易被误导的例子。
由此可见,原始数据中的不同细节经人为操纵加工进行不同的分组,便会造成数据解读的这些偏差。
这样的例子在制造业中则更为普遍,比如,管理层收到的报表中,明显看到人力成本的下降,便会认为是件好事情,然而背后却是高薪的熟练工人的减少,低薪的临时工的增多,因而带来的产品良率的下降和质量成本的增加。再比如,数据报表中设备效率在当月提升很多,但是,背后的代价却是单一产品的过度生产带来的高库存和滞销。
解决这类问题的方法其实并不能够被简单概括,但是在数字化基础设施架构的时候入手,我们可以尝试找出一些脉络,比如:
- 在运营数字化转型时尽可能地收集保留数据的一些细节
- 在数据归纳和分析时要有足够的弹性和柔性来以多种方式呈现
- 在分析数据图表时,要尽可能地考虑比对不同时间场景下的数据切片
- 不要盲目地与外部数据进行简单地对比,如果要对比,需要能够有较为详尽的数据细节
- 在管理架构上,尽可能地将业务执行者与数据操作者进行权责分离,以避免人为的数据操纵
在企业持续地进行数字化提升并产生巨量数据的同时,如何避免这些数据中的陷阱,让企业运营管理人员能够更好地基于数据与事实进行决策,而不是被误导后做出错误的判断,将会是未来企业面临的一个重要课题。