亚洲女同成aV人片在线观看|亚洲www啪成人一区二区麻豆|亚洲国产中日韩精品综合|亚洲国产成人精品一级片|亚洲无码在线视频免费

您的當前位置: 首頁(yè) > 新聞中心

關(guān)于增長(cháng)AB測試(分享5個(gè)實(shí)際使用AB測試中的關(guān)鍵事項)

發(fā)布時(shí)間:2026-05-05 10:56:14 瀏覽:526 次

增長(cháng)??工作中,關(guān)于個(gè)實(shí)AB測試可以說(shuō)是增長(cháng)被奉為圭臬的方法,也是測試B測產(chǎn)品/運營(yíng)同學(xué)們???信手拈來(lái)的工具。工作對AB測試接觸使用較多,分享但也有了更多的際使鍵事經(jīng)驗教訓以及學(xué)習思考。

這次分享5個(gè)實(shí)際使用AB測試中的試中關(guān)鍵事項,一起來(lái)交流避??坑。關(guān)于個(gè)實(shí)

一、增長(cháng)樣本規模預估

AB測試(shi)中,測試B測對照組和實(shí)驗組的分享樣本量越大,實(shí)驗時(shí)ヽ(′ー`)ノ間越長(cháng),際使鍵事實(shí)驗結果就更加準確。試中

這可以說(shuō)是關(guān)于??個(gè)實(shí)常識性的判斷,(′▽?zhuān)?但是增長(cháng)實(shí)際上這是由統計顯著(zhù)性決定(′▽?zhuān)?的:

統計顯著(zhù)性是指對照組和??實(shí)驗組的數據差異有多大可能是真實(shí)存在的,而不是測試ヽ(′?`)ノB測隨機誤差導致的。

所以周期更久、樣本量更多的AB測試更有(/ω\)說(shuō)服力,但是實(shí)際工作中(′?`),產(chǎn)品或活動(dòng)的迭代速度快,這就要求AB測試的實(shí)驗周期不能過(guò)長(cháng),所以在A(yíng)B測試前對樣本規模進(jìn)行預估至關(guān)重要。

計算樣本量的方法有些復雜,對于丟棄高數、概率論多年的打工人來(lái)說(shuō),還是建議求助于數據分析同學(xué)。推薦一個(gè)在線(xiàn)樣本預估計算器:


在這個(gè)樣本數量計算器中(zhong),輸入原始版本轉化率(已知),再輸入優(yōu)化版本的轉化率(預期),同時(shí)設置統計顯著(zhù)性水平,一般達到95%以上即是顯著(zhù)差異。這樣就可以快速得(T_T)到一個(gè)樣本數量結果。

如上圖,如果原始版轉化率是10%,優(yōu)化的新版??本轉化率預期ヽ(′▽?zhuān)?/是12%,在進(jìn)行AB測試時(shí),每組用戶(hù)??樣本數據達到2900以上時(shí),才能說(shuō)明這個(gè)新版本轉化率的是顯著(zhù)差異,是可信的。

在計算完預估的樣本數量之后,還有一個(gè)重要工作就是預估實(shí)驗周期。

如果可信的A(????)B測試每組實(shí)驗需要2900個(gè)樣本量,但是我們的產(chǎn)品每天只有200的日活用戶(hù),分成兩組后每組只有100用戶(hù),則2900/1??00=29天ヽ(′▽?zhuān)?ノ,意味著(zhù)AB測試實(shí)驗需要29天后才可達到需要的樣本量。

這個(gè)時(shí)候就要評估這個(gè)周期是否是可接受的,如果周期過(guò)長(cháng),則說(shuō)明這個(gè)AB測試在現階ヽ(′?`)ノ段進(jìn)行是不合適的。

二、測試結果分析

樣本規模預估是在A(yíng)B測試前進(jìn)行,因為優(yōu)化版本的轉(zhuan)化數據是預估??的,所以樣本量和實(shí)驗周期都是預估數據,幫助我們在A(yíng)B測試前對測試樣本和周期有個(gè)初步判斷。

在實(shí)際的AB測試實(shí)驗結束后??,我們還需要ヽ(′ー`)ノ對實(shí)際的結果數據進(jìn)行統計顯著(zhù)性檢驗,保證對照組和實(shí)驗組的數據差異是顯著(zhù)可信的。同樣有(you)一個(gè)在線(xiàn)工具:

在這個(gè)工具中,我??們輸入AB兩(liang)組的實(shí)際數據,就可(′▽?zhuān)?以清楚看到兩者轉化率的差異,以及試驗(yan)結果的統計顯著(zhù)性結果。

以上圖為例,雖然B組的轉化率比A組高,但是因為樣本量較小,試驗結果沒(méi)有達到顯著(zhù)的(de)統計學(xué)差異,所以??我們不能得出B組優(yōu)化比A組更好的結論。

這個(gè)時(shí)候有兩種選擇,一是繼續實(shí)驗,積累更多的實(shí)驗數據后進(jìn)ヽ(′ー`)ノ行分析,二是放棄實(shí)驗,得出此??次優(yōu)化沒(méi)有明顯提升的結論。

也不是說(shuō)繼續實(shí)驗一定會(huì )得??出顯著(zhù)性差異┐(′?`)┌,如果樣本量繼續增大(da),但是轉化率差異減小,就意味著(zhù)需要更多的樣ヽ(′▽?zhuān)?ノ本量,這種情況往往說(shuō)明兩個(gè)版本的差異確實(shí)不大,但是也需(′?_?`)要根據實(shí)際情況判斷是否需要停止AB測試。

三、反向相關(guān)指標

在進(jìn)行AB測試時(shí),一般情況下會(huì )有一個(gè)核心指標來(lái)判斷實(shí)驗結果,同時(shí)會(huì )有一些支持或輔助指標來(lái)更好地監測實(shí)驗和分析結果。但是不能忽略的是一些反向指標。

什么是反向指標?反向指??標就是AB測試實(shí)驗中可能會(huì )負面影響的指標。

舉一個(gè)簡(jiǎn)單的例子:

AB實(shí)驗為了提升ヽ(′ー`)ノ新用戶(hù)注冊率,于是在新版本中過(guò)度包裝(′?_?`)了新人權益,雖然提ヽ(′?`)ノ升了新用(yong)戶(hù)注??冊率,但是因為用戶(hù)預期管理不足,新用戶(hù)注冊后發(fā)現實(shí)際的新人權益大打折扣,對產(chǎn)品產(chǎn)生不滿(mǎn)的情緒,導致新用戶(hù)首單轉化率降低。

新用戶(hù)首單轉化率??在這個(gè)實(shí)驗中就是一個(gè)值得關(guān)注的反向指標。

AB測試為了實(shí)驗的速度和效果,往往會(huì )關(guān)注少部分關(guān)鍵流程節??點(diǎn)和核心指標,但是忽略反向指標,卻有得不償失的風(fēng)險。

四、辛普森悖論

辛普森悖論是指:某些條件下的兩組數據,分別討論時(shí)都會(huì )滿(mǎn)足某種性質(zhì),可是一旦合并考慮,卻可能導??致相反的結論。這個(gè)理論由(′_`)英國統計學(xué)家辛普森提出。

還是舉一個(gè)簡(jiǎn)單的例子,在對新用戶(hù)首??購流程的AB測試實(shí)驗中:

次日,A組轉化率是15%(150/1000),B組轉化率是16%(160/1000);

兩日分別看,B??組的轉化率都高于A(yíng)組(zu)。

但是合計起來(lái)看,A組轉化率是14.5%(160/1100),B組轉化率14%(280/2000);

這樣合計數據A(T_T)組的??轉化率卻高于B組。所以在分析時(shí)就無(wú)法直接判斷實(shí)驗結果。

辛普??森悖論的存在,對AB測試提出了更多的要求,用戶(hù)樣本的合理選擇、樣本量的監控調整、全面的數(╯°□°)╯︵ ┻━┻據分ヽ(′ー`)ノ析等。

例子中導致分日和合計數據結論相反的原因就是首日A組和B組樣本量差別較大。

五、分層實(shí)驗

對于大體量的產(chǎn)品和完善的增長(cháng)團隊,會(huì )存在(?????)多個(gè)AB測試同時(shí)(′▽?zhuān)?進(jìn)??行的(′?_?`)情況,這就需要考慮分層實(shí)驗。

分層實(shí)驗是指,將多個(gè)(′_ゝ`)實(shí)驗建立起分層結構,每一層實(shí)驗使用過(guò)的流(◎_◎;)量,下一層的實(shí)驗可以繼續用。有些不是很好理解,繼續舉個(gè)例子:

以電商產(chǎn)品的新人流程為例,ヽ(′ー`)ノ新用戶(hù)下載打開(kāi)APP后,首頁(yè)有新人禮包的入口,點(diǎn)擊進(jìn)入后可以查看新人權益和優(yōu)惠商品,新用戶(hù)查看新人商品后完成下單,這就是新用戶(hù)轉化的基本路(lu)徑。

為了優(yōu)化現有的新人轉化流程,從新人禮包的首頁(yè)展示、落地頁(yè)展示、新人商??品詳情頁(yè)同時(shí)進(jìn)行了多個(gè)AB實(shí)驗。

在首頁(yè)展示上,同時(shí)進(jìn)行了按鈕顏色和引導文案的AB實(shí)驗,為了保證變量的唯一性,按鈕顏色實(shí)驗中,包括文案等其他內容完全是一致的,文案實(shí)驗中,包括按鈕顏色等其他內容也是完全一致的。這就需要把100%的流量分成2部分,假設為各50%,即50%用戶(hù)進(jìn)行按鈕顏色實(shí)驗(25%看到紅色按鈕,25%看到黃色按鈕,兩組文案一致),其余50%用戶(hù)進(jìn)行文案實(shí)驗(25%看到“領(lǐng)取權益”文案,25%看到“1元下單”文案,兩組按鈕顏色一致)。

進(jìn)入到新人頁(yè)面之后,對權益展示的方式又進(jìn)行了AB實(shí)驗,從第一層(首頁(yè))來(lái)的??流量(??100%)都進(jìn)行權益展示的AB實(shí)驗,來(lái)自第一層100%的??流量剛進(jìn)行了按鈕顏色和文案的實(shí)驗,為了避免上層(╬?益?)實(shí)驗對權益展示實(shí)驗的影響,從上層來(lái)的流量要隨機分配到權益展示實(shí)驗的AB兩組(′ω`),這(zhe)就是分層實(shí)(shi)驗中的流量正交,均勻分配上層流量。

分層實(shí)驗在??實(shí)際工作中不多見(jiàn),但是成熟的產(chǎn)品必須要考慮這種情況的存在,才能更高??效地更科學(xué)的同時(shí)進(jìn)行多個(gè)AB實(shí)驗。各團隊間也要保持溝通,避免單打獨斗進(jìn)行實(shí)驗,卻不知被???對方的實(shí)驗影響了結果,得出不恰當(dang)的結論。

以上,就是關(guān)于A(yíng)B測試的5個(gè)階段性分享,后面的(de)工作中,AB測試還會(huì )繼續做,新的問(wèn)題(???)還會(huì )出現。

版權聲明(′▽?zhuān)?):本文內容由互聯(lián)網(wǎng)用戶(hù)自發(fā)貢獻,該文觀(guān)點(diǎn)僅代表作者本??人。本站僅提供信息存儲空間服務(wù),不擁有所有權,不承擔相關(guān)法律責任。如發(fā)現本站有涉嫌抄襲侵權/違法違規的內容, 請發(fā)送郵件至 18174(╬?益?)[email protected] 舉報,一經(jīng)查實(shí),本站將立刻刪除。

搜索

亚洲女同成aV人片在线观看|亚洲www啪成人一区二区麻豆|亚洲国产中日韩精品综合|亚洲国产成人精品一级片|亚洲无码在线视频免费 盐亭县| 禄劝| 通辽市| 太仓市| 长汀县| 德惠市| 温宿县| 蓬溪县| 伊金霍洛旗| 蕲春县| 大丰市| 宝坻区| 云浮市| 盘山县| 宾川县| 长兴县| 噶尔县| 海林市| 封开县| 广灵县| 仙游县| 梁平县| 屏东市| 南京市| 韶关市| 碌曲县| 阳信县| 江安县| 特克斯县| 东丽区| 科尔| 璧山县| 炉霍县| 衡南县| 淅川县| 栖霞市| 广丰县| 三门县| 伊宁市| 勐海县| 临澧县| http://444 http://444 http://444 http://444 http://444 http://444