作者归档:admin

Make over monday – 每周动手实践的Tableau社区网站

DraggedImage

学习一项新技能的最好办法就是动手实践,在这个过程中,如果能与高手们一起练习并交流就更好了。

http://www.makeovermonday.co.uk/ 就是这样一个每周提供数据、背景知识,以及大家一起练习交流的网站。

参与这个活动的流程是这样的:

  1. 每个周日,网站的主持人会放出一份新的练习:http://www.makeovermonday.co.uk/data/
  2. 你根据自己的理解,制作Tableau报表,并发布到:https://public.tableau.com/s/上。
  3. 然后把自己的报表链接发布到Twitter上:链接 + 截图 + #MakeoverMonday,最后一个是活动的话题标签。

这样大家就可以通过:https://twitter.com/hashtag/MakeoverMonday 看到近期的报表作品了,就像这样:

DraggedImage-1

最近一期的主题是:

Have Apple Lost Their Edge With iPhone?

关于iPhone的销量在2016年不再持续增长的问题。

提供的数据是这样的:

DraggedImage-2

是的,这一期的数据结构非常的简单:年度,季度,以百万为单位的销量。

简单的数据就应该简单的呈现,不是吗?

以下的作品有的简约,有的却在简单的数据中,发现了更多。

简约型

DraggedImage-3

大苹果与危险的下降趋势。

俏皮型

DraggedImage-4

下降后,诺基亚拍手称快。

报表地址在这儿:

https://public.tableau.com/profile/ugleymatt#!/vizhome/MakeOverMondayS2-E2/Nokia

原理是,绿色背景的折线图嵌入在背景图片中。

DraggedImage-5

卡通风格

DraggedImage-6

乔布斯和库克谁的贡献更大。

清楚直观型

DraggedImage-7

下降的原因是从第2季度起,不如上一年。

更多的背景数据

DraggedImage-8

iPhone的销量与新品推出有直接的关系,加上了每一款新品的发布时间后,可以帮助我们更好的看到历史上哪一款iPhone对销量的提升更大。

小结

一年有365天,共52周,新的一年刚刚开始。即使没有购买Desktop,只要有免费的Public(https://public.tableau.com/zh-cn/s/download/),可以马上开始新一年的可视化之旅了。

大家也可以关注:#MMDataCamp 话题,来自华人社区的参与者们。

https://trimydata.com/2017/01/11/people-who-viz-together/

DraggedImage-9

Practice always make it better!

Tableau新手上路

Tableau的学习既简单又复杂。

简单是因为:

  1. 界面操作直观
  2. 资料案例丰富

复杂是因为:

  1. Tableau是一个侧重于实践的工具,需要有实际的场景与需求
  2. 作为可视化工具,上游是不同的数据源,下游输出是各个部门看数据的需求
  3. 需要掌握很多相关的知识:数据库,可视化,统计学,业务分析
  4. 在直观的工具界面下,隐藏着很多复杂的概念和原理,如:表计算,LOD

这篇文章主要是帮助第一次接触的Tableau的新人找到适合自己的入门练习和相关的资料。

产品介绍

什么是Tableau?

一款数据可视化工具,帮助你更好的查看和理解你的数据。

主要的优点:

  • 支持多种数据源
  • 高度定制、细致、美观的报表设计
  • 多平台,不同方式的报表查看
  • 查看的过程同时也是分析讨论的过程(支持筛选、互动、导出)
  • 不光是图表,也可以看到图表之下的明细数据

主要的产品

  • Tableau Desktop (桌面客户端,快速的设计和发布报表)
  • Tableau Online (基于云端的在线的报表查看平台)
  • Tableau Server (私有部署的报表查看平台)
  • Tableau Reader (本地查看文件形式的报表)
  • Tableau Public (桌面客户端,快速设计和发布报表)

下载安装与激活Desktop

http://www.tableau.com/products/desktop

  1. 安装后,用购买的序列号激活。
  2. 如果要更换电脑,需要先在:帮助菜单的管理产品密钥里,先选中当前的序列号,再停用。

学习与使用

首次使用

Get Started Tutorial里除了一步一步的操作说明,还会有一些扩展的问题,也可以尝试解决。

需要注意的概念

参考在线帮助里的:Tableau 概念内容(http://onlinehelp.tableau.com/current/pro/desktop/zh-cn/help.htm#concepts.html%3FTocPath%3D%25E5%2585%25A5%25E9%2597%25A8%25E6%258C%2587%25E5%258D%2597%7CTableau%2520%25E6%25A6%2582%25E5%25BF%25B5%7C_____0

包括以下的内容:

  • 数据类型
  • 字段类型
  • 数据字段
  • 聚合

适合上手的例子数据与报表

  • 安装后,自带的3个报表案例,如:超市的例子
  • 网上的开放数据
  • 公司内已有的业务报表(关注数据源,指标的定义,查看报表设计),尝试在已有的报表基础上,通过提问题的方式,尝试做修改

相关资料

图书推荐

进阶的资料

获取Google Analytics明细数据的方法与思路

我们在用Google Analytics进行网站分析的过程中,很多时候需要按用户ID,时间获取用户的访问明细,这样可以更好的和内部的CRM或订单系统对接。在GA后台导出或通过API获取数据是没法完成这一任务的,因为这儿得到的是聚合的数据,如按城市、来源的访问量、停留时间、跳出率等。

方案1:购买Google Analytics企业版

购买GA企业版,然后明细数据可以同步到谷歌的Big Query数据仓库,可以很方便的查询以及和已有系统做集成。这儿的主要成本是Google Analytics企业版,一年要10几万美元的费用,相比之下,Big Query会很便宜,因为是按存储量和查询收费。

在Big Query的示例数据库里有一个GA明细数据的例子,表结构和字段都很清晰,在GA的官方帮助里,也有查询的示例。

https://support.google.com/analytics/answer/3416091?hl=zh-Hans&ref_topic=3416089

方案2:使用开源的Piwik分析工具

Piwik 是一个开源的流量分析工具,PHP + Mysql,可以很方便的私有部署。使用Piwik最大的好处是统计代码的部署,维度指标的定义和GA非常类似,分析师可以很快的上手。这儿的成本主要在:服务器的部署,从Mysql数据库同步数据,以及数据处理的成本。如果想快速上手,也可以考虑Piwik Pro,会按照数据量收费。

方案3:前端Hack的方式

即在GA提交数据请求或打点的同时,把这儿请求的明细额外提交一份到自己的Web服务器,当然这种方式也还是需要额外的服务器部署和数据处理的成本。

总结

GA在免费流量工具里是非常好的产品,方便易用,和自家的广告系统也结合的很好。不过在需要获取明细或数据仓库的方案时,还是需要额外的成本。推荐的方式是免费的GA和私有部署的流量系统一起跑,这样既方便在GA后台看数据,也方便自己拥有明细数据做数据集成。


微信专栏开通了

这个博客开通于2012年6月,写到现在一共有45篇文章了,记录了在数据分析方面的经验与心得。中间经历了3份工作,认识了很多同行与朋友,关注的方向也从网站数据分析逐步转向:移动,用户行为,Tableau,Pandas,Aws,数据仓库等更广泛的内容。

当我们回顾自己的收获和成长时,除了做过的项目和产品,认识的人以外,我觉得还应该加上:有多少尝试与改变,尝试新的事情带来更多的思考与实践,也推动自己的成长。当然有一件事是应该是应该坚持与不变的,那就是:不断的思考与分享。

这个专栏会继续记录我在数据分析方面的思考实践,希望与大家共同成长,谢谢。

我的微信专栏:

wechat

 

Tableau online邮件订阅问题排查

Tableau online 有时候会出现邮件订阅出错的情况,原因有很多,可能是自己邮箱或数据库的问题,也有可能是online的问题,如:执行超时,出错,系统维护等,为了方便大家定位问题和与客服沟通,整理了如下检查步骤:

  1. 检查邮箱空间是否已满
  2. 检查数据库的日志信息,在邮件订阅的时段是否有:数据库连接数高或出错的情况
  3. 检查报表的订阅设置,看上次执行时间和下次执行时间之间是否有断档
  4. 检查online后台的:status -> Background Tasks for Non Extracts日志报表,看这段时间是否有出错的Task。

通过以上检查来确定是:自己的问题还是online后台的问题。

来自官方的初步的故障排除方法:

  1. 删除有故障的视图订阅设置
  2. 删除已经发布在Tableau Online站点的有故障的工作簿(请注意在删除前确认本地有保存副本文件)
  3. 重新发布工作簿与数据源(如果此工作簿有使用发布的数据源)
  4. 针对新发布的工作簿重新创建一个视图订阅

如果需要深入的问题排查,联系客服时,还需要提供以下信息:

  • online站点地址
  • Tableau Online使用的用户名
  • 用于接收发生了故障的订阅视图的邮箱地址

BTW:听说tableau的中文支持都在澳大利亚,如果问题搞不定,才会转到西雅图 :)

如何更方便的访问tableau online常用报表

在tableau online后台,会按照:项目,工作簿,视图的层次组织管理报表数据。

  • 项目可以看着是目录,方便组织管理多个工作簿文件。
  • 工作簿与Excel的工作簿类似,每个工作簿会包含多个工作表。
  • online里的视图也就是你具体查看的报表内容,可以为:工作表,仪表板或故事等。

虽然这样的组织很科学合理,但报表多了后,查找访问还是会不方便,以查看收入数据为例,我们的操作顺序是:

  1. 打开:销售数据项目。
  2. 打开:收入汇总工作簿,这时会列出该工作簿下的多个视图。
  3. 找到并打开:年度汇总视图,查看截止到当日的收入数据。
  4. 发现本月的收入比预期的要好,想了解是哪个销售团队带动了本月销售额,于是找到并打开:团队销售额明细视图。

这儿用了:找到并打开这样的说法,是因为一个工作簿的视图往往会比较多,不容易找到。

解决的方法是这样的:

  1. 常用视图,汇总视图在配置时往前放,这样打开工作簿时,默认看前几个即可。
  2. 通过加星收藏功能来标注重要的视图,这样既方便一眼看到,也方便在所有视图列表筛选,即:只看加星的视图。另外这儿的收藏功能也可以应用到工作簿。
  3. 浏览器的收藏夹大法,建一个:my-report目录,下面按业务划分建多个子目录,然后手工打开常用视图,依次添加。虽然繁琐些,但顺序和名称都可以自定义。

收藏夹大法有很多好处,除了方便定位打开,还可以在收藏夹目录上选择打开所有书签,这样你上班时,先打开所有书签,然后去倒杯咖啡,回来时,依次查看即可。

配合chrome的:reload-all-tabs插件,还可以一键刷新所有页面。

最后也建议,一些只用于仪表板子内容的视图,可以上传时不选中,这样也可以让工作簿更简洁。

 

tableau online 登录页加载慢的问题与解决方案

非翻墙情况下,访问tableau online登录页时,会出现加载慢,以及无法记住登录密码的问题。用chrome开发者工具检查内容加载,发现有两个资源的请求有问题:

  1. https://ajax.googleapis.com/ajax/libs/jquery/1.10.1/jquery.min.js
  2. https://cloud.webtype.com/css/7549ee6e-3df6-49b9-8c06-298835f90264.css

前者用到了google的cdn服务来加载jQuery脚本文件,后者是一个在线的样式字体服务。

对于这儿的css文件,可以在hosts文件里,简单禁掉:

127.0.0.1 cloud.webtype.com

如何修改,见:

对于jQuery脚本文件,直接禁掉,会影响记住密码,解决的方法是用一个chrome的插件来自动替换为中科大的文件服务器,插件名叫:Replace Google CDN。

搞定登录问题后,访问online的报表文件,其实还是蛮快的,这儿的问题,已经反馈给tableau的中国区团队,问题解决前,大家可以先用这儿的方法对付一下。

 

更规范的数据分析团队 – 使用专用的公司邮箱发送GA定期报告

我们在日常的数据分析,报表配置工作中,经常会用自己的个人邮箱在GA后台配置:定期邮件报告。

但这样做会产生几个问题:

  1. 人员权限收回时,已配置的定期发送邮件会失效
  2. 用户收邮件时,光看发件人,不方便区分是:专题分析还是定期邮件报告
  3. 公司有多个分析师的情况下,没法知道:配置了哪些定期邮件报告,以及发送给了哪些人

继续阅读

使用Google在线表格汇总计算Google analytics数据

介绍

数据导出与汇总分析的需求

我们在日常工作中,除了访问GA后台看各种固定报表外,还需要导出数据以方便报表分析,常见的需求有:

  • 从不同的视图汇总合并数据,如:iOS + Android
  • 一次性导出大量的明细数据,如:近3个月的订单号明细
  • 在同一个汇总报表上,显示不同时间范围的趋势数据

手工访问GA后台会比较繁琐,通过API查询,又需要开发人员的支持,都有局限性。

现在GA开发组又提供了一种新的方式来解决这个问题:Google在线表格 + GA Plugin

继续阅读