T檢驗、F檢驗和卡方檢驗
T檢驗、F檢驗、卡方檢驗是統(tǒng)計學(xué)中常見的假設(shè)檢驗,今天記錄下這幾個假設(shè)檢驗的原理和應(yīng)用場景。
| 檢驗方法 | 應(yīng)用場景 |
|---|---|
| T檢驗 | 比較兩個樣本均值是否有差異 |
| F檢驗 | 比較兩個及兩個以上樣本均值是否有差異 |
| 卡方檢驗 | 比較兩組或者多組之間的分類型變量是否差異 |
T檢驗
T檢驗又稱學(xué)生T檢驗,用于統(tǒng)計量服從正態(tài)分布,總體方差未知且樣本量較?。╪<30)情況下,用來比較兩個均值差異是否顯著。可分為配對樣本T檢驗、單樣本T檢驗和兩獨立樣本T檢驗 3 種類型。
配對樣本T檢驗
用于檢驗兩個配對樣本均值的差是否等于零。如比較一個受試者在不同治療方式后的指標(biāo)差異,或不能在同一個受試者上開展實驗,把接受 A 治療的人和接受 B 治療的人配對,通常會基于年齡、性別或其他我們認(rèn)為重要的變量進行配對,配對的目的是使 A 組和 B 組的人盡可能相同。
單樣本T檢驗
檢驗單個樣本的均值是否與已知的總體均值相等,比如:某大學(xué)生的身高是否大于全國平均身高。
兩獨立樣本T檢驗
檢驗兩獨立樣本的均值是否相等,如 A/B Test,不同的按鈕顏色,對于訪問量是否有顯著差異。
F檢驗
方差分析就是對試驗數(shù)據(jù)進行分析,檢驗方差相等的多個因素均值是否相等,來判斷各因素對試驗指標(biāo)的影響是否顯著。其原理是從差異的源頭入手,一類是組內(nèi)隨機差異造成的,一類是不同組的組間差異造成的??刹鸾鉃榭偲椒胶蚐ST = 組內(nèi)殘差平方和 SSE(不可解釋的差異) + 組間因素平方和 SSTR(可解釋的差異),F(xiàn)統(tǒng)計量是組間均方與組內(nèi)均方的比值。其計算公式如下:
組間因素平均平方和 MSTR,K-1 代表自由度,K 代表有多少組:

組內(nèi)殘差平均平方和 MSE,n 代表觀測值的個數(shù):

根據(jù)求得的F統(tǒng)計量,查F表,如果大于臨界值則拒絕原假設(shè),就意味著差異的主要來源是由于組與組的不同而造成的,即組間具有顯著性的差異。相反,如果F值小于臨界值則接受原假設(shè),說明組內(nèi)的均方 MSE 比較大,差異的主要來源并不是組與組的不同,而是組內(nèi)隨機變化的結(jié)果,組間無顯著性差異。
卡方檢驗
卡方檢驗主要是統(tǒng)計樣本的實際觀測值與理論推斷值之間的偏離程度,來判斷變量之間是否有相關(guān)關(guān)系。適用于比較兩組或者多組之間的分類型變量之間是否有顯著的差異??ǚ街涤嬎愎饺缦拢?img data-ratio="0.36363636363636365" src="https://filescdn.proginn.com/9fddeaa15752724e44d6942fe233f6eb/2fca36f3d396191d4c487bb4d3308bff.webp" data-type="png" data-w="484" style="display: block;margin-right: auto;margin-left: auto;border-radius: 4px;margin-bottom: 25px;">
根據(jù)自由度((行-1)*(列-1)),結(jié)合我們定義的置信水平,查卡方分布臨界表,卡方值大于臨界值,則拒絕原假設(shè),可判斷有顯著差異。詳細案例介紹大家可參考這篇文章《卡方檢驗的理解》。另外更正一下,《卡方檢驗的理解》這篇文章中最后的自由度的乘號寫成了減號。
