中国网站用户访问特征评估体系-2010年
网站用户访问特征评估体系 iResearch Website User Behavior E valuation System 2010年 ,网站用户访问特征评估体系
网站用户访问特征评估体系 iResearch Website User Behavior E valuation System 2010年
,网站用户访问特征评估体系 2010年 i R e s e a r c h W e b s i t e U s e r B e h a v i o r E v a l u a t i o n S y s t e m
目 录
I. 评估体系简介 ....................................................................................................................... 3
II. 评估体系指标定义 ............................................................................................................... 3
III. 评估体系详细说明............................................................................................................... 4
1. 什么是好的评估指标体系 . ............................................................................................ 4
2. 4大基本评估指标,以及和其他日均指标间的关系 ...................................................... 5
3. 网民回访模型和1个回访评估参数 .............................................................................. 7
4. 目标用户集中度指数TGI . ...........................................................................................10
5. 完整的网站用户访问特征评估体系 ............................................................................12
5.1. 六大指标的统计和计算方法定义 .....................................................................12
5.2. 媒体类型评估实例 ...........................................................................................13
法律声明 ................................................................................................................................14
Copyright © iResearch Inc. 2010
,网站用户访问特征评估体系 2010年 i R e s e a r c h W e b s i t e U s e r B e h a v i o r E v a l u a t i o n S y s t e m
图 表 目 录
图2- 1 iResearch-艾瑞风向标媒体评估日均指标的因素关系 ................................................. 5
图2- 2 iResearch-艾瑞风向标媒体评估日均指标的非因果关系 . ............................................. 6
图3- 1 iResearch-艾瑞风向标媒体访客累加模式图 . ............................................................... 7
图3- 2 iResearch-艾瑞风向标媒体访客累加指数的数据验证 ................................................. 8
图5- 1 iResearch-艾瑞风向标媒体类别雷达图 .....................................................................13
表3- 1 iUserTracker-2009年47周主要网站回访比例 ............................................................ 9
表3- 2 iUserTracker-2009年47周主要网站目标用户TGI . ...................................................10
Copyright © iResearch Inc. 2010
,网站用户访问特征评估体系 2010年 i R e s e a r c h W e b s i t e U s e r B e h a v i o r E v a l u a t i o n S y s t e m
I. 评估体系简介
如何衡量一个网站的用户访问特性,一直是行业内热烈讨论的问题,而由于指标众多;媒体,代理商,各家用法不同,所以至今尚无一套完整的评估体系。本文将从第三方的角度,提出一套相对完整和科学的网站用户访问特征评估体系。上一期网民风向标中已经运用了一些标准话的评估指标,这里会将这套体系更加完善,全面化。
考虑到评估方法的科学和公正,该体系主要处理网站覆盖人数,流量,停留时间等可由第三方样本监测得到,并且可以标准化,指标化的网站用户访问属性。另外一些网站分析中使用的来源去向,路径分析等数据和指标并不在该评估体系范围内。
本文最后的结论是一个包含6个指标的网站特征评估指标体系。包括4个已有的基本指标,1个回访模型参数,1个目标人群集中度参数。还有基于这个指标体系的应用。
II. 评估体系指标定义
日均覆盖人数(Unique Visitors Per Day)
该月中,该网站平均每天的独立访问用户数,用户重复访问不重复统计
日均覆盖人数=当周每日的网站覆盖人数的平均值
日均回访比例 (Revisit rate)
该天访客中,平均属于本周老访客的比例(也等与1-新访客比例)
日均回访比例=(7-周覆盖人数 / 日均覆盖人数) / 6
人均单日访问次数(Visits Per User Per Visiting Day)
平均每个用户,平均每日访问该网站日访问该网站的次数
人均单日访问次数=Average(该用户该周访问该网站的次数/该用户该周访问该网站的天数)
人均单次浏览页面数(PV Per User Per Visit)
平均每个用户,平均每次访问该网站的浏览页面数量
人均单次浏览页面数=Average(该用户该周该网站浏览页面数/该用户该周访问该网站的次数)
人均单页有效浏览时间(Effective Viewing Duration Per User Per page)
平均每个用户在浏览该网站每个页面时的有效浏览时间
人均单页有效浏览时间=Average(该用户某时间段内该网站总浏览时间/该用户该时间段内该网站总浏览页面数)
注:单页打开时间小于3秒不计,单页停留5分钟以上,则视为用户脱机,不计其后的时间,直到新的网络行为发生
目标受众集中度(Target group index)
TGI = 某网站所有访问者中目标用户的比例 / 总体网民中目标用户的比例
Copyright © iResearch Inc. 2010
,本页已使用福昕阅读器进行编辑。网站用户访问特征评估体系 2010年 i R e s e a r c h W e b s i t e U s e r B e h a v i o r E v a l u a t i o n S y s t e m 福昕软件(C)2005-2010,版权所有,仅供试用。
III. 评估体系详细说明
1. 什么是好的评估指标体系
从数学的角度看,要用最少的参数,建立最准确有效的模型;从统计学的角度看,要用最少的变量,反映样本最多的数据特征;所以这里,我们也将用最少的数据指标,准确和全面的反应网站的用户访问特征。通俗的将,就是定义各个网站的“德智体美劳”。
因此衍生出以下两个具体原则需要遵守: 1. 体系中的各指标间不相关,或弱相关
2. 体系中的各指标组合,换算,可以得出现有常用体系中的所有指标
以上两个原则和主成份分析,因子分析的原则是一致的。这些通用的统计方法,从纯粹的数据角度出发,找出几个不相关的统计指标,并以此来解释原有数据。这种方法存在下述一些缺陷:
1. 2.
3.
所以本文所属的评估体系,并不是从数学解释出发,而是从指标间的因果关系,和网民行为的内在模式出发。建立稳定,准确的,有效的,反应网民访问各个网站不同特征的指标体系。 证明过程中用到的都是基本的统计学和数学知识,大家可以在标准的统计学教材内找到解释,这里不另作标注。证明和举例使用的都是iUserTracker 2009年47周,11月23日-11月29日的数据。
Copyright © iResearch Inc. 2010
,本页已使用福昕阅读器进行编辑。网站用户访问特征评估体系 2010年 i R e s e a r c h W e b s i t e U s e r B e h a v i o r E v a l u a t i o n S y s t e m 福昕软件(C)2005-2010,版权所有,仅供试用。
2. 4大基本评估指标,以及和其他日均指标间的关系
目前市场上常用指标的有月度指标、周度指标和日度指标。日度指标则用一段时间的日均指标来代替。作为基本的评估指标,首先选取4个日均和人均的网站访问指标:
1. 2.
3.
4.
这4个基本指标和其他常用指标间存在因果关系,如下图:
图2- 1 iResearch-艾瑞风向标媒体评估日均指标的因素关系
如图,一共有9个常用的日均和人均指标,其中选出的4个相对基本的指标用黄色圈表示。这4个指标间交叉相乘,恰能很好的得出其他的5个日均指标。而且这4个指标间互不相关。
1) 日均覆盖 × 人均单日访问次数 => 日均访问次数 cor=1
2) 人均单次浏览页面 × 日均访问次数 => 日均访问页面 cor=1
3) 人均单页浏览时间 × 日均访问页面 => 日均浏览时间 cor=1
Copyright © iResearch Inc. 2010
,网站用户访问特征评估体系 2010年 i R e s e a r c h W e b s i t e U s e r B e h a v i o r E v a l u a t i o n S y s t e m
以上3个推演的逻辑非常简单,而且很多第三方网络数据提供商实际就是根据这样的公式来计算人均指标的,所以他们的相关系数都接近1。
4) 人均单日访问次数 × 人均单次浏览页面 => 人均单日浏览页面 cor=0.91
5) 人均单日浏览页面 × 人均单页浏览时间 => 人均单日浏览时间 cor=0.86
以上2个推演的逻辑也很简单,且从极高的相关系数看,也可认为逻辑成立。如果将该模型作为事件背后的规律,那么我们来看一下这个规律在现实中如何表现
图2- 2 iResearch-艾瑞风向标媒体评估日均指标的非因果关系
如图,我们可以看到4个基本指标间(黄色的圈)高度不相关,而最下面的3个日均指标都高度相关。原因就是每个日均指标都严重受到日均覆盖的影响。所以在评估媒体特征的时候,如果同时选择了多个日均指标,将对结果没有太大的意义。而只有选择4个基本指标(黄色的圈),才能有效的区分出不同媒体的特性。
这里有兴趣的读者可以从累计方差的角度进一步验证这4个指标。本文篇幅有限,且因为指标间的因果关系已经很明确,就不附加证明了。
Copyright © iResearch Inc. 2010
,网站用户访问特征评估体系 2010年 i R e s e a r c h W e b s i t e U s e r B e h a v i o r E v a l u a t i o n S y s t e m
3. 网民回访模型和1个回访评估参数
上面的部分已经把日均和人均指标间的问题解决了,剩下的就是如何从日均指标推演出周度,月度指标。因为目前大多的媒体行为都以周为单位,所以这里主要解决周度数据的推演。关于月度数据,有兴趣的读者可以自行扩展。
图3- 1 iResearch-艾瑞风向标媒体访客累加模式图
如图3-1,是一周内网民连续访问同一个网站的滚动模型。第一天访问了该网站的网民中,有一部分第二天继续回访,也有一部分不再访问。而第二天访问该网站的网民中,有一部分来自第一天的老网民,也一部分是本周还没来过的新网民。所以图中用参数α表示后来的网站访问中,本周老访客的比例。
以一周7天计,且假设每天的用户行为一致,设以下变量:
每一天的:网民覆盖人数n ,人均访问次数c ,人均浏览页面p ,人均浏览时间t
每一周的:网民覆盖人数N ,人均访问次数C ,人均浏览页面P ,人均浏览时间T
在图中滚动比例α确定的情况下,经过7天的迭代,得到:
6) N = (7-6α)n
7) C = 7nc / N = 7c / (7-6α)
8) P = 7p / (7-6α)
9) T = 7t / (7-6α)
其中公式7)也等效为人均周访问天数
我们将N/n,C/c,P/p,T/t称为他们各自的周累加指数,即:
10) 单日的指标×周累加指数=周度指标
Copyright © iResearch Inc. 2010
,网站用户访问特征评估体系 2010年 i R e s e a r c h W e b s i t e U s e r B e h a v i o r E v a l u a t i o n S y s t e m
可以看出,除了周覆盖累加指数和其他的累加指数呈反比关系,其他各累加指数间都是线性关系。iUserTracker 的数据证明了这一现象,从而也证明了这个模型的有效性。见下图:
图3- 2 iResearch-艾瑞风向标媒体访客累加指数的数据验证
Copyright © iResearch Inc. 2010
,网站用户访问特征评估体系 2010年
i R e s e a r c h W e b s i t e U s e r B e h a v i o r E v a l u a t i o n S y s t e m
在模型得以初步证明以后,我们可以根据公式6)-9)获得4个滚动系数。经检验,这4种方法获得系数基本一致。为了方便处理,我们以周覆盖累加指数计算出的滚动系数α为准,得到以下数据表格:(其中日回访比例就是模型中的滚动比例)
表中覆盖人数最多的几个大网站,他们的日回访比例都呈现显著的差异,所以这个日回访比例(滚动比例)能够有效的描述以前未被发现的一个网站特征。将这个根据周覆盖累加指数计算的日回访比例回代到其他的累加指数中,结果同样非常准确。
Copyright © iResearch Inc. 2010