最后为了区分同期的其他用户,将是否参与其他用户也做了分组,同时做对比差分。
(说明:实验中,各层的流量是正交的,简单理解,例如,A层的分流采用用户ID的倒数第1位,B层的分流采用用户ID的倒数第2位,在用户ID随机的情况下,倒数第1位和倒数第2位是没有关系的,也称作相互独立,我们称作正交。当然,AB Test实验系统真实的分流逻辑,是采用了复杂的hash函数、正交表,能够保证正交性。)
这样分层后,我们可以按照如下的方式量化贡献:
-
计算长期的整体贡献:实验填充层-填充层填充组 VS 贯穿层2-贯穿层填充
-
每个小迭代对整个系统的贡献:实验层中的实验组 VS 对照组
-
周期内,系统全部迭代与上个周期的比较:实验填充层 VS 贯穿层1
类似与上面这种层次设计,在推荐系统中较为常见,在某一些产品或系统中,贯穿层不能够完全没有策略,那么采用去年或上个季度的策略,代表着基准值,从而量化新一个周期的增量贡献
多层域AB实验法——准确量化短期和长期贡献
以我负责的模块为例,老板们会关心
-
长期以来贡献了多少DAU?
-
每次产品迭代,提高了多少?
-
严谨一点,我们采用了AB实验的方式核算,最终可能会发现一个问题:短期迭代贡献,不等于长期贡献,为什么呢?(本文重点讲述AB实验,对于1+1≠2话题,详细请看本人的文章《数据分析中,为什么1+1不等于2?》)
-
有的时候,迭代A和迭代B,有着相互放大的作用,这个时候就会 1+1 > 2
-
还有的时候,迭代A和迭代B,本质上是在做相同的事情,这个时候就会 1+1 < 2
有些场景,我们的业务需要和去年或上个季度的自身对比,同时业务还不断在多个方面运用AB Test迭代
这个时候,我们准确量化一个长期产品模块的贡献,就需要一个【贯穿】所有活动的对照组,在AB实验系统中通俗称作贯穿层