月度归档:2019 年九月

关于自助式分析的思考

“人人都是数据分析师”,“平民数据科学家”这是我们最近几年经常听到的口号,加上很多先进的商业或开源BI工具的出现,确实很好的提升了大家准备、分析、呈现数据的效率。在这种情况下,很多企业会希望能够做到自助式分析,让业务人员也能更好的获取数据,更高效的进行分析与决策。在我个人的经历中,有在互联网公司从零到一搭建数据平台的经历,有面向企业的数据思维方法论培训的经验,以及最近也在帮朋友公司进行外贸电商项目的实施。所以我也想从自己的角度讲一下对这件事的看法和心得。

先说一下要进行自助式分析的目的,企业的业务人员与管理者希望能更快更好的获取数据,并基于自己的问题与想法的进行分析与探索。这件事的难易程度取决于两个方面:企业的数据平台基础(或能力)与个人的分析技能。

如果给企业的数据平台划分等级:

  • 第0级:没有像样业务报表后台,甚至没有自己的数据库,数据散乱在各种电子表格里。
  • 第1级:有工程师帮忙制作的基础的业务报表后台,可以简单的查询筛选,也可以导出一些数据明细。主要的业务分析基于电子表格。
  • 第2级:开始有面向分析的数据库或数仓,有了一个或多个分析师,开始尝试提炼和整理主要的业务指标,有了更好的BI分析工具,可以更快更好的制作分析报表。但这时分析师的主要工作还是取数为主和为业务部门的个性化需求制作和维护报表。
  • 第3级:能够基于良好维护的数仓进行规范的、深入的分析。形成一套全面的指标体系,基于统一的口径进行取数和分析。能够在良好的数据基础上,进行用户画像、预测、推荐等建模分析,可以明显的看到数据产生的价值和推动。
  • 第4级:公司规模更大,有了更细的分工,甚至开始自己研发各种BI工具,不光是分析师,还有了数据科学家。但这个时候,因为业务更复杂,流程更长,各个部门的协作反而变得更难,甚至会每个部门各自维护和集成自己需要的数据,形成数据集市的问题。

如果要评估业务人员的分析技能(这儿其实有个前提是他们并不是科班出身,所以要求他们:SQL,Python,R 都会其实并不公平):

  • 第0级:既没有好的分析思路也不熟悉常用的电子表格工具,会看一下报表后台的数据,以了解当前的业绩完成情况。
  • 第1级:有了更多的业务理解,能够看懂后台的数据,并能够导出明细数据,在电子表格工具里进行计算和处理。
  • 第2级:熟悉常用的分析框架与模型(如:二八原则,RFM),能够自己做一些分析图表和报告,并推动业务决策。
  • 第3级:开始学习和掌握一些更好的BI分析工具,能够自己写一些简单的SQL查询和为了更好的分析对数据进行处理。

我们不会在一片散沙上建高楼,也不会把锤子放到婴儿手中。要做好自助式分析,对于企业的数据平台基础和业务人员的分析技能都会有一定的要求。前者需要有面向分析的数仓建设和核心指标的整理,后者需要业务人员对于数据的准备和计算有一定的基础或者愿意去学习。

在这个过程中,分析师是关键,他们自己的专业能力是能够在复杂的数据基础上挖掘和输出分析结论的。但在企业中,分析师往往成本高人数少,并不能全面的满足业务部门的需求。这时就需要培训业务部门的同事,从分析的思路到工具的使用。

假设企业的分析报表是围绕Tableau来建设的,可以按这样的方式来推广自助分析:

  • 在每个业务部门挑选1-2个动手能力强,愿意学习的同事重点培养。
  • 基础的SQL查询和Tableau Desktop使用培训。
  • 给业务部门的同事开放少量的经过整理的SQL表的查询权限,并辅以文档说明。
  • 简单的Tableau报表需求,做一个字段逻辑清楚的版本就好,个性化的图表配置交给业务部门同事自己做。
  • 在这个过程中,逐步介绍一些深入的用法,如:Tableau 的集,表计算,并和业务部门的同事一起围绕问题进行探索,这样的好处是可以互相学习彼此的:分析技能与业务经验。
  • 围绕数仓和重要的业务指标调整讨论,可以邀请业务部门的同事旁听,这样也可更好的让他们了解最新的进展。

在这里面要注意的是因为业务部门同事会缺少统计学知识,以及对复杂的业务指标计算理解会有偏差,所以一些重要的分析结论还是需要分析师帮忙检查确认,才能正式的发布出去。

每个企业的组织架构和业务模式会有不同,有的倾向于所有的事情都自己搞定。有的会找外部的咨询公司或BI服务商来做,如果费用充足,项目管理能力好,也可以解决数仓和分析报表的需求。但如果都依赖外部资源,也会导致受制于人,以及自己的能力还是得不到提高。所以推荐的做法是,可以把其中的一些工作分出去,如:数据的集成,ETL,数据字典的整理。这部分工作需要更多的专业技能,同时完成后,维护的工作量比较小。以及在这个过程中,也花一些钱请服务商培训自己的人,以学会一些基本的报表制作和分析能力。

感谢 @Terence Zhang 的补充,除了常见的从数仓建设开始的自助分析推广,还有一种场景是麦肯锡,PWC这样的咨询公司的用法,咨询顾问们服务于不同的项目和客户,数据是分散的,没有集中的数仓和Tableau Server。他们会把Tableau当做效率工具和Excel的替代,更快更好的对数据进行准备与计算,以完成相关的分析报告。

关于自助分析这件事,我觉得这是一件非常实践性的活动:意愿,思路,能力缺一不可。“条条大路通罗马”,也希望各位分析师朋友或相关部门的负责人,能够从这篇文章中获得一些提示与思考,更好的推动企业的数字化转型与自助分析能力。

演讲汇报场景的 Tableau or PPT ?

PPT 非常适合演讲汇报的场景,通过页面的切换,内容重点的呈现、标注、强调,更好的引导听众来听懂演讲者想表达的内容。常见的做法是,在PPT中会写一下背景介绍,状态与阶段,产品或业务说明,以及非常重要的数据截图,可能是表格也可以是图表。这部分内容往往是通过Excel,Tableau这样的工具来制作。

截图的好处是方便分发(作为PPT的一部分)和加上个性化的标注说明。缺点是,这儿的图表是静态的,收到的人既没法筛选互动也没法基于图表的明细数据做进一步的分析。对于这个问题,比较好的做法是:

  • 阅读为主,就通过Tableau的故事的方式进行报告的设计,辅以文字说明。
  • 需要更好的演讲效果,可以截图到PPT,但在对应的页面里,说明这个报表所在的Tableau Server页面地址,这样如果看的人需要筛选互动,可以自己去看。
  • PPT + 讲解时切换到Tableau报表的方式,这时还可以带着问题进行一些筛选互动,这样都能兼顾到。

当我们知道某个Tableau报表是要面向演讲汇报的,那么在开始制作时,就需要考虑和准备更多:

  • 报表应该更简洁一些,文字标题的文字要大,行列的轴可以更缩略些。
  • 在标题和说明里,辅以更多的文字。
  • 用好Tableau内置的区间、参考线、趋势线、标签功能,让图表说明更为丰富。
  • 通过故事或仪表板来组织好各个工作表的呈现顺序和位置,这样在讲的时候,可以更有逻辑和条理。

在讲的时候,需要先介绍背景和主要指标的定义,之后再切换到Tableau报表。在这个过程中,有个小技巧,可以用好操作系统的屏幕放大功能,让听众更清楚的看到当前在讲的部分。以及这样的讲解过程,也是一个推广企业内自助分析的好机会,告诉大家能够拿到的不只是静态的截图,而是动态的分析呈现。