? ? ?

? ?? ? ? ? ? ? ? ? ? ? ?? ? ? ? ? ? ? ? ? ? ???? ? ? ? ? ? ? ? ??? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?攝于 學(xué)校
我的研究生三年過(guò)的比較充實(shí);研一和絕大多數(shù)學(xué)生一樣在學(xué)校學(xué)R語(yǔ)言、統(tǒng)計(jì)學(xué)、預(yù)測(cè)、評(píng)價(jià)模型等理論知識(shí)。研一過(guò)完的暑假,我便去了帝都開(kāi)啟實(shí)習(xí),先后在創(chuàng)業(yè)公司和某大廠做數(shù)據(jù)分析相關(guān)工作。關(guān)于如何平衡實(shí)習(xí)和發(fā)論文,某乎上有很多回答可以借鑒,我只想說(shuō)一點(diǎn),靠運(yùn)氣還有一點(diǎn)點(diǎn)規(guī)劃,如果你想研二就開(kāi)始實(shí)習(xí)(后面拿到大廠實(shí)習(xí)就很easy了),那么研一你的論文初稿就得出來(lái),不然你拿什么去找老師申請(qǐng)實(shí)習(xí),當(dāng)然并不是說(shuō)你有論文,你就可以出去實(shí)習(xí)啦,還得靠一點(diǎn)運(yùn)氣,取決于你的導(dǎo)師是否允許你出去。
今天剛拿到學(xué)校郵寄的行李和畢業(yè)證書(shū),心生感慨……
開(kāi)始正文ing
OX01?如何繪制直方圖
如何繪制直方圖?其實(shí),我想說(shuō)的是如何處理數(shù)據(jù)。
想了解一下全部發(fā)貨物品的單價(jià)的分布情況,每10元作為一個(gè)區(qū)間?
最終結(jié)果如下:
下面分享兩種數(shù)據(jù)處理方法:excel和SQL。3、數(shù)據(jù)分析加載項(xiàng)具體參考:https://www.jianshu.com/p/a8d13b6d52d8?其實(shí),我們可以直接寫SQL從數(shù)據(jù)庫(kù)中取出符合直方圖要求的數(shù)據(jù),具體代碼如下:

邏輯:內(nèi)/左連接行數(shù)不可能增加,字段可以增加;唯一可增加 行數(shù)的就是 全連接。這里輔助表full_join_num就是幫助控制行輸出的!

這張圖,平均單店?duì)I收=sum(實(shí)收金額)/count(distinct 店鋪ID)咋一看,沒(méi)問(wèn)題,細(xì)細(xì)想來(lái):2、1成立的前提,所有的店鋪都是某年1月1號(hào)成立并開(kāi)始營(yíng)收,顯然這并不可能!實(shí)際上,店鋪都是分布在一年中的任何一天開(kāi)始營(yíng)業(yè),為了避免極端值的影響(比如一年最后一天開(kāi)始營(yíng)業(yè)),我們一般想到:對(duì)于任何一家店鋪而言,sum(實(shí)收金額)/date_diff(now(),[成立日期])。那么對(duì)于n家店鋪,[sum(s1)/m1+sum(s2)/m2+……+sum(sn)/mn]/n= ? ?這種由單個(gè)到總體的邏輯,容易理解,卻很難實(shí)現(xiàn)!單店?duì)I收= sum()/count(distinct 店鋪ID)單日營(yíng)收=sum()/營(yíng)業(yè)天數(shù) =sum()/count(distinct 統(tǒng)計(jì)日期)。統(tǒng)計(jì)日期:只要門店有營(yíng)業(yè)額,那么當(dāng)天就錄入統(tǒng)計(jì)日期,所以同一店鋪,出現(xiàn)統(tǒng)計(jì)日期的次數(shù),就是營(yíng)業(yè)天數(shù)!是不是很簡(jiǎn)單,具體計(jì)算公式如下:單日單店?duì)I收= sum)()/count(distinct (concat(店鋪ID,統(tǒng)計(jì)日期)))!--?The?End--
原創(chuàng)不易,您的轉(zhuǎn)發(fā)與在看,就是我堅(jiān)持的動(dòng)力!