流量来源和会话记录方案(Google analytics版)

Google analytics 记录会话来源cookie的有效期为180天,至少需要记录5个值:
utmcsr:即utm_source,一般记录会话的来源站点,如baidu.com,sina.com等。直接来源计为:utmcsr=(direct);
utmccn:即utm_campaign,记录来源活动,如CPC的广告计划、edm的任务id等。无来源活动的会话可记为:utmccn=(referral)|utmccn=(direct)|utmccn=(organic) 等来源信息;
utmcmd:即utm_medium,记录通过何种媒介访问网站,如cpc、cps、referral、organic。我们也可以标识一些重要媒介:edm、cctalk、weixin等。无来源媒介记为:utmcmd=(none);
utmctr:即utm_term,记录搜索关键词。非搜索来源的会话,此处不做记录;
utmcct:即utm_content,记录来源的具体内容,如cpc广告的广告词、referer的引荐路径等。若无来源具体内容,则此处不做记录。

会话的划分主要有两个因素决定:时间和来源。

时间:两次浏览间隔时间超过预设的会话最低间隔时间(一般为30分钟)会产生新会话,跨天也会强制切割会话,生成新会话。对应会话来源,若utmcmd为(none),则不更新来源,即沿用上次会话来源作为本次会话的来源。

来源:只要utmcsr、utmccn、utmcmd、utmctr、utmcct其中一个发生了变化,就会产生新会话。也就是说,这里存在由来源决定会话的逻辑。这意味着,会话间隔30分钟内(非跨天)情况下,仍然可能产生新会话,于是我们的关键是何种情况下,要更新来源的cookie。我们可以规定通过某些媒介的来源访问,访问间隔30分钟内,仍然是会更新来源的,如utmcmd=cpc|cps|organic 等,这样当用户在短时间内点击多个不同的广告或搜索进入网站,是会更新来源,同时产生新会话。
(注意:若utmcsr、utmccn、utmcmd、utmctr、utmcct均未发生变化,短时间内也是不产生新会话的)
关于自我引荐:理论上是不应该存在自我引荐的,所以自我引荐的来源可以忽略,即自我引荐可类似直接访问来处理(不更新来源)。
对应来源类型,并未有一具体的cookie值来记录。这时根据来源信息由我们自定义划分:
1、utmcmd=cpc或utmcmd=cps 等,可划分为付费广告
2、utmcmd=organic ,可划分为自然搜索
3、utmcmd=edm ,可划分为edm
4、utmcmd=referral且utmcsr包括facebook.com,weibo.com,renren.com等,可划分为社交网络
5、utmcmd=referral且非社交网络,可划为引荐来源
6、utmcmd=(none) 则为直接来源

和piwik的方案相比,会发生的主要变化:
1、会话数增多,因为30分钟内的来源变更是会产生新会话的
2、直接来源大幅减少,因为无媒介的访问是不会更新来源cookie值的,这样会沿用上次的会话来源
3、无自我引荐,来源的定义上是不应该有自我引荐的,这算是bug的修复吧
4、重要的来源信息不会被覆盖,利于多渠道路径的分析

于2015-01-26

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注