网站会通过页面的查询参数来传递信息,例如:城市ID,排序方式,第几页,这些参数很详细也有利于后继的计算处理,例如:哪一种排序方式用的最多,价格还是距离?
但有时候这儿的查询参数对于我们的分析又会造成干扰,因为GA对于每个不同Url的页面都会有个唯一身份浏览量的指标,即使只是查询参数不同,也会看着不同的页面。
假设我们想知道今天的100次访问中,有多少访问了酒店列表页(至于用户是否做了排序,翻页我们并不关心),在GA的所有页面报表里,我们会看到这样的数据:
网页 | 浏览量 | 唯一身份浏览量 |
---|---|---|
/home | 123 | 100 |
/Hotel/List?sort=price | 30 | 18 |
/Hotel/List?sort=distance | 25 | 12 |
这时,直接 18 + 12 有可能会偏大,即如果有用户先按price排序,又按distance排序,这时2个不同查询参数的/Hotel/List页面的唯一身份浏览量都会分别加1。
如果一定要知道准确的酒店列表访问数,可以通过高级细分来做,条件是:访问的页面包含/Hotel/List,这样可以解决问题,但过于麻烦。
其实简单的方式是有的,新建一个视图,同时添加两个新的过滤器:
名称:去掉查询参数
- 过滤器类型:自定义 -> 搜索和替换
- 过滤字段:请求URI
- 搜索字符串:(.+?)?.+
- 替换字符串:1
名称:去掉网页标题
- 过滤器类型:自定义 -> 搜索和替换
- 过滤字段:网页标题
- 搜索字符串:.*
- 替换字符串:
需要去掉网页标题的原因是:GA是按页面Url + 网页标题的组合来计算唯一身份浏览量的。
(注意,至少保留一个没有添加任何过滤器的视图,以便完整的收集原始数据。)
添加完成后,我们再在所有页面报表里,就会看到这样的数据:
网页 | 浏览量 | 唯一身份浏览量 |
---|---|---|
/home | 123 | 100 |
/Hotel/List | 55 | 20 |
这样就可以清楚的看到用户在各个页面的访问情况了,在看访问路径时,也会清楚很多,避免不同的url参数干扰。
在很多商业分析工具里,都会推荐给页面分组和命名,这样的好处是方便按层次和页面类型来计算访问人次和路径分析。在我们这儿的例子里,通过简单的过滤查询参数,也达到了类似的目的,大家可以试一下。
可惜谷歌现在国内基本上不去了,对百度这个适用吗