我在字節(jié)看到的AB實(shí)驗(yàn)
“A/B測(cè)試不一定是最好的評(píng)估方法。它不是萬(wàn)能的,但不會(huì)A/B測(cè)試肯定是不行的。”
4月20日,首個(gè)火山引擎技術(shù)開放日在北京方恒時(shí)尚中心舉辦,字節(jié)跳動(dòng)副總裁楊震原以《聊聊數(shù)據(jù)驅(qū)動(dòng)和用A/B測(cè)試解決問題》為題,分享了他對(duì)于A/B測(cè)試的理解。
楊震原稱,A/B測(cè)試是字節(jié)跳動(dòng)一項(xiàng)非?;A(chǔ)的工具,從公司成立之初就在使用,支撐了抖音、今日頭條等產(chǎn)品的增長(zhǎng)迭代。目前,字節(jié)跳動(dòng)A/B測(cè)試每日新增1500+實(shí)驗(yàn),服務(wù)于400多項(xiàng)大大小小的業(yè)務(wù),累計(jì)做了70多萬(wàn)次實(shí)驗(yàn)。這項(xiàng)工具已經(jīng)實(shí)現(xiàn)產(chǎn)品化,通過火山引擎向企業(yè)客戶開放。
A/B測(cè)試廣泛應(yīng)用于字節(jié)跳動(dòng)方方面面,包括產(chǎn)品命名、交互設(shè)計(jì)、推薦算法等。但楊震原表示,這項(xiàng)工具也存在很多應(yīng)用局限,比如獨(dú)立性、置信度、長(zhǎng)短期等問題。
楊震原透露,抖音產(chǎn)品名字,其實(shí)是綜合了A/B測(cè)試和人為判斷的結(jié)果,“‘抖音’這個(gè)名字在測(cè)試結(jié)果中排名第二。但大家覺得,這個(gè)名字更符合認(rèn)知,更能體現(xiàn)它的形態(tài),所以還是選了它。”


好的目標(biāo)層次合理、可衡量

什么是靠譜的評(píng)估方法?


字節(jié)跳動(dòng)的A/B測(cè)試實(shí)踐


A/B測(cè)試不是萬(wàn)能的



抖音的名字是怎么來(lái)的?

