統(tǒng)計(jì)學(xué)知識(shí)大梳理
日期 : 2021年03月28日
正文共 :6495字
目標(biāo)一:構(gòu)建出可以讓人理解的知識(shí)架構(gòu),讓讀者對(duì)這個(gè)知識(shí)體系一覽無余 目標(biāo)二:盡l量闡述每個(gè)知識(shí)在數(shù)據(jù)分析工作中的使用場(chǎng)景及邊界條件 目標(biāo)三:為讀者搭建從“理論”到“實(shí)踐"的橋梁






Q1:第一四分位數(shù) (Q1),又稱“較小四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字。 Q2:第二四分位數(shù) (Q2),又稱“中位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字。 Q3:第三四分位數(shù) (Q3),又稱“較大四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字。



事件:有概率可言的一件事情,一個(gè)事情可能會(huì)發(fā)生很多結(jié)果,結(jié)果和結(jié)果之間要完全窮盡,相互獨(dú)立。 概率:每一種結(jié)果發(fā)生的可能性。所有結(jié)果的可能性相加等于1,也就是必然?。?! 概率分布:我們把事件和事件所對(duì)應(yīng)的概率組織起來,就是這個(gè)事件的概率分布。




離散數(shù)據(jù): 一個(gè)粒兒,一個(gè)粒兒的數(shù)據(jù)就是離散型數(shù)據(jù)。 連續(xù)數(shù)據(jù): 一個(gè)串兒,一個(gè)串兒的數(shù)據(jù)就是連續(xù)型數(shù)據(jù)。


step1 --- 確定分布和范圍 ,求出均值和方差 step2 --- 利用標(biāo)準(zhǔn)分將正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布 (還記得 第一部分的標(biāo)準(zhǔn)分嗎?) step3 ---查表找概率

對(duì)立事件:如果一個(gè)事件,A’包含所有A不包含的可能性,那么我們稱A’和A是互為對(duì)立事件 窮盡事件:如何A和B為窮盡事件,那么A和B的并集為1 互斥事件:如何A和B為互斥事件,那么A和B沒有任何交集 獨(dú)立事件:如果A件事的結(jié)果不會(huì)影響B(tài)事件結(jié)果的概率分布那么A和B互為獨(dú)立事件。




總體:你研究的所有事件的集合 樣本:總體中選取相對(duì)較小的集合,用于做出關(guān)于總體本身的結(jié)論 偏倚:樣本不能代表目標(biāo)總體,說明該樣本存在偏倚 簡(jiǎn)單隨機(jī)抽樣: 隨機(jī)抽取單位形成樣本。 分成抽樣: 總體分成幾組或者幾層,對(duì)每一層執(zhí)行簡(jiǎn)單隨機(jī)抽樣 系統(tǒng)抽樣:選取一個(gè)參數(shù)K,每到第K個(gè)抽樣單位,抽樣一次。







卡方分布的應(yīng)用場(chǎng)景 用途1:用于檢驗(yàn)擬合優(yōu)度。也就是檢驗(yàn)一組給定的數(shù)據(jù)與指定分布的吻合程度; 用途2:檢驗(yàn)兩個(gè)變量的獨(dú)立性。通過卡方分布可以檢查變量之間是否存在某種關(guān)聯(lián):


第一類錯(cuò)誤: 拒絕了一個(gè)正確的假設(shè),錯(cuò)殺了一個(gè)好人 第二類錯(cuò)誤:接收了一個(gè)錯(cuò)誤的假設(shè),放過了一個(gè)壞人



— THE END —

評(píng)論
圖片
表情
