大香蕉欧美伊人,人人摸人人看人人草,男生操男生的视频,玖玖视频在线观看,二次元被到爽羞羞网站,操逼视频软件,免费看一级大黄,逼逼插

看數(shù)據(jù)分布，一看直方圖，一看各種統(tǒng)計(jì)指標(biāo)。具體看哪個(gè)指標(biāo)，依然是老話：看場(chǎng)景。

統(tǒng)計(jì)指標(biāo)有哪些：

【變異程度】：衡量數(shù)據(jù)的離散程度

1、極差：最大值-最小值

僅使用兩個(gè)觀測(cè)值度量變異程度，極其容易受到異常值的影響，一般不使用

2、四分位數(shù)間距IQR：IQR= Q3 - Q1 是中間50%數(shù)的極差

3、方差：使用所有數(shù)據(jù)對(duì)變異程度的一種度量

s^2 = \Sigma(x_i - \bar{x}) \div (n-1)

協(xié)方差是衡量?jī)蓚€(gè)指標(biāo)變化方向的一致性

4、標(biāo)準(zhǔn)差：方差的平方根，和原始單位一致，衡量平均距離平均值的距離。如果有異常數(shù)值的話，會(huì)增大標(biāo)準(zhǔn)差

5、標(biāo)準(zhǔn)差系數(shù)：標(biāo)準(zhǔn)差/平均數(shù)

可以用來比較不同單位不同量級(jí)的變量變異程度

【數(shù)據(jù)分布】偏度、峰度

【z分?jǐn)?shù)】對(duì)相對(duì)位置的度量??

?????????????????????????????

z = (x_i - \bar{x}) \div s

【異常值檢測(cè)】異常大或者異常小的數(shù)據(jù)，我們稱之為異常值

可以使用標(biāo)準(zhǔn)化數(shù)值z(mì)來，或者使用分位數(shù)來判斷異常值?

【分位數(shù)】箱線圖? 常用來分組對(duì)比數(shù)據(jù)分布情況

【抽樣】從總體中抽取有限樣本對(duì)總體進(jìn)行估計(jì)

由于是從總體中進(jìn)行隨機(jī)抽樣，所以如果進(jìn)行多次重復(fù)抽樣，那么得到的樣本肯定有所不同，但是他們中間又有重疊和關(guān)聯(lián)

每一次隨機(jī)抽樣，都能夠得到一個(gè)?

\bar{x}

，所以它本身也就是一個(gè)變量，也就有所謂的均值、標(biāo)準(zhǔn)差、方差

【中心極限定理】從總體中抽取n個(gè)隨機(jī)樣本，當(dāng)樣本容量很大的時(shí)候，樣本均值? $\bar{x}$ ?的抽樣分布服從正態(tài)分布

一般來說n=30的時(shí)候，分布就較能夠符合正態(tài)分布了

\bar{x}

?的標(biāo)準(zhǔn)差，我們一般稱之為標(biāo)準(zhǔn)誤差，樣本數(shù)量越大，相對(duì)的誤差也就越小

因?yàn)槲覀儾荒苤竿S機(jī)抽出來的樣本均值就是總體均值，我們給到的是一個(gè)概率和范圍，也稱之為區(qū)間估計(jì)

中心極限定理是置信區(qū)間/置信度的核心，深刻理解抽樣分布和中心極限定理是后續(xù)的基石

【置信區(qū)間：點(diǎn)估計(jì) +/-?邊際誤差】在預(yù)測(cè)以及AB中應(yīng)用廣泛

【假設(shè)檢驗(yàn)】運(yùn)用在AB測(cè)試，模型的顯著性檢驗(yàn)，相關(guān)系數(shù)的顯著性檢驗(yàn)等領(lǐng)域

【第一類錯(cuò)誤】如果原假設(shè)為真，而被我們拒絕了（新功能并沒有比原功能更好，卻被我們誤以為新功能更好）的錯(cuò)誤，叫做第一類錯(cuò)誤。犯第一類錯(cuò)誤的概率叫做顯著性水平，一般我們會(huì)取0.05,0.1。
【第二類錯(cuò)誤】如果備則假設(shè)為假，而被我們拒絕了（新功能比原功能更好，卻沒有被發(fā)現(xiàn)）的錯(cuò)誤，叫做第二類錯(cuò)誤。犯第二種錯(cuò)誤的概率一般取0.2，反過來一般我們稱之為統(tǒng)計(jì)功效 power = 1-? $\beta$ ?

為了保證第一類錯(cuò)誤和第二類錯(cuò)誤控制在一定的水平，需要保證樣本量大于某個(gè)閾值，AB測(cè)試樣本量計(jì)算的原理

【獨(dú)立兩樣本t檢驗(yàn)】?jī)蓚€(gè)獨(dú)立隨機(jī)抽取的樣本分布的均值/比例區(qū)別

兩個(gè)獨(dú)立隨機(jī)樣本的均值差距越遠(yuǎn)，越有可能不同，兩個(gè)樣本的方差越小，越有可能不同

((\bar{x_1} - \bar{x_2}) - D_0) \div (\sqrt {s_1^2/n1} + \sqrt {s_2^2/n2})

【卡方檢驗(yàn)】用于多分類變量的比例檢驗(yàn)，計(jì)算期望和實(shí)際的距離

有個(gè)非常通俗易懂的文章可以看看：

https://zhuanlan.zhihu.com/p/69888032

【方差分析】用來衡量多組樣本是否均值相等

F =?組間（處理）方差/組內(nèi)方差（誤差） = SSTR/SSE

線性回歸整體的顯著性用的也是F檢驗(yàn)，F(xiàn)=被解釋的方差/殘差?

以上回顧的內(nèi)容，都是非常基礎(chǔ)的內(nèi)容，但是在面試過程中發(fā)現(xiàn)，真的能掌握的人比例還不多，并且還都是名校畢業(yè)的孩子。越是基礎(chǔ)越是重要，更具有普適性。

·················END·················

數(shù)據(jù)分布和各種檢驗(yàn)