Python電商數(shù)據(jù)分析案例|如何分析競爭對手?
大家好,我是寶器!
導(dǎo)讀: 本篇中將繼續(xù)從微觀市場方面,從產(chǎn)品結(jié)構(gòu)、產(chǎn)品輿情及產(chǎn)品流量三個方面深入探討拜耳產(chǎn)品的競品分析。
??點擊關(guān)注|設(shè)為星標(biāo)|干貨速遞??

電商分析基礎(chǔ)知識
電子商務(wù)和傳統(tǒng)零售數(shù)據(jù)分析的區(qū)別
傳統(tǒng)零售是利用二八法則生存,電商是靠長尾理論積累銷售。 電商是大數(shù)據(jù),傳統(tǒng)零售是小數(shù)據(jù)。 傳統(tǒng)零售是"物流",零售過程就是商品的流動。電子商務(wù)是"信息流",顧客通過搜索、比價、評論、分享產(chǎn)生信息,達(dá)到購買的目的。 傳統(tǒng)零售注重體驗感,購物有時候也是社交的一部分,現(xiàn)在的購物中心基本是吃喝玩樂一體化設(shè)計。電商注重服務(wù)和效率,雖然也有吃喝玩樂的產(chǎn)品,但卻不能方便及時享受。 傳統(tǒng)零售是做加法,電子商務(wù)是做乘法。傳統(tǒng)零售通過一家店一家店的開發(fā)來擴(kuò)充自己的影響力,電商則通過資金的投入迅速搶占市場。 成本結(jié)構(gòu)不同,傳統(tǒng)零售的主要成本是租房與人工成本,電商的主要成本是物流和營銷成本。
電商數(shù)據(jù)分析需要的數(shù)據(jù)
電商需要的數(shù)據(jù)復(fù)雜,數(shù)據(jù)來源渠道也多樣化,當(dāng)然數(shù)據(jù)質(zhì)量也是有好有壞的。
營銷數(shù)據(jù)
包括營銷費用、覆蓋用戶數(shù)、達(dá)到用戶數(shù)、打開或點擊用戶數(shù)。流量數(shù)據(jù)
包括瀏覽量、訪客數(shù)、登陸時間、在線時長等基礎(chǔ)數(shù)據(jù)。會員數(shù)據(jù)
包括會員的姓名、出生日期、真實性別、網(wǎng)絡(luò)性別、地址、手機(jī)號、微博號、微信號等基礎(chǔ)數(shù)據(jù)。交易及服務(wù)數(shù)據(jù)
包括交易金額、交易數(shù)量、交易人數(shù)、交易商品、交易場所、交易時間。供應(yīng)鏈服務(wù)等數(shù)據(jù)。行業(yè)數(shù)據(jù)
淘寶的數(shù)據(jù)魔方提供行業(yè)品牌的關(guān)鍵字搜索、店鋪排名、銷售、會員等數(shù)據(jù)查詢。
產(chǎn)品結(jié)構(gòu)分析
波士頓矩陣

波士頓矩陣又稱市場增長率-相對市場份額矩陣、波士頓咨詢集團(tuán)法、四象限分析法、產(chǎn)品系列結(jié)構(gòu)管理法等。
適用于一般產(chǎn)品,不適合引流產(chǎn)品。
明星產(chǎn)品:高市場占有率,高業(yè)務(wù)增長率 金牛產(chǎn)品:高市場占有率,低業(yè)務(wù)增長率 問題產(chǎn)品:低市場占有率,高業(yè)務(wù)增長率 瘦狗產(chǎn)品:低市場占有率,低業(yè)務(wù)增長率
波士頓矩陣的應(yīng)用
(1)評價各項業(yè)務(wù)的前景。BCG是用市場增長率這一指標(biāo)來表示發(fā)展前景的。這一步的數(shù)據(jù)可以從企業(yè)的經(jīng)營分析系統(tǒng)中提取。
(2)評價各項業(yè)務(wù)的競爭地位。BCG是用“相對市場份額”這個指標(biāo)來表示競爭力的。這一步需要做市場調(diào)查才能得到相對準(zhǔn)確的數(shù)據(jù)。計算公式是把一單位的收益除以其最大競爭對手的收益。
(3)表明各項業(yè)務(wù)在BCG矩陣圖上的位置。具體方法是以業(yè)務(wù)在二維坐標(biāo)上的坐標(biāo)點為圓心畫一個圓圈,圓圈的大小來表示企業(yè)每項業(yè)務(wù)的銷售額。
(4)確定縱坐標(biāo)“市場增長率”的一個標(biāo)準(zhǔn)線,從而將“市場增長率”劃分為高、低兩個區(qū)域。
比較科學(xué)的方法有兩種:
把該行業(yè)市場的平均增長率作為分界線 把多種產(chǎn)品的市場增長率(加權(quán))平均值作為界分點
需要說明的是,高市場增長定義為銷售額至少達(dá)到10%的年增長率(扣除通貨膨脹因素后)。
(5)確定橫坐標(biāo)“相對市場份額”的一個標(biāo)準(zhǔn)線,從而將“相對市場份額”劃分為高、低兩個區(qū)域。
拜耳產(chǎn)品結(jié)構(gòu)分析
首先獲取拜耳全店商品交易數(shù)據(jù),數(shù)據(jù)樣例如下圖所示。
baier_02 = pd.read_excel('./baier/電商案例數(shù)據(jù)/拜耳店鋪數(shù)據(jù)/拜耳全店商品交易數(shù)據(jù).xlsx')
baier_02.head()

以單個商品為聚合,分別對交易增長幅度求平均,支付轉(zhuǎn)化指數(shù)求平局,交易金額求和,這些只需要一行代碼就能搞定。
下一步將單個商品的交易金額除以全部商品的交易總金額,得到單個商品的交易金額占比。
baier_str = baier_02.groupby('商品').agg({'交易增長幅度':np.mean,
'支付轉(zhuǎn)化指數(shù)':np.mean,
'交易金額':np.sum})
baier_str['交易金額占比'] = baier_str.交易金額/baier_str.交易金額.sum()*100
baier_str.head()

對上述表進(jìn)行描述性統(tǒng)計,查看下是否有缺失值、異常值等"臟"數(shù)據(jù)或不合理的數(shù)據(jù)。從結(jié)果看,交易增長幅度最大值(紅色框框)為1030,很明顯是個異常值,我們將其刪除,
baier_str.describe()

刪除異常值
baier_str = baier_str[baier_str.交易增長幅度!=1030.00]
明星產(chǎn)品
高銷售額占比,高銷售增長率
它是指處于高增長率、高市場占有率象限內(nèi)的產(chǎn)品群,這類產(chǎn)品可能成為企業(yè)的現(xiàn)金牛產(chǎn)品,需要加大投資以支持其迅速發(fā)展。
采用的發(fā)展戰(zhàn)略是:積極擴(kuò)大經(jīng)濟(jì)規(guī)模和市場機(jī)會,以長遠(yuǎn)利益為目標(biāo),提高市場占有率,加強(qiáng)競爭地位。發(fā)展戰(zhàn)略以及明星產(chǎn)品的管理與組織最好采用事業(yè)部形式,由對生產(chǎn)技術(shù)和銷售兩方面都很內(nèi)行的經(jīng)營者負(fù)責(zé)。
明星產(chǎn)品=baier_str.where((baier_str.交易增長幅度>=baier_str.交易增長幅度.mean()
)&(baier_str.交易金額>=baier_str.交易金額.mean())).dropna()
明星產(chǎn)品

金牛產(chǎn)品
高銷售額占比,低銷售增長率
現(xiàn)金牛產(chǎn)品(cash cow),又稱厚利產(chǎn)品。它是指處于低增長率、高市場占有率象限內(nèi)的產(chǎn)品群,已進(jìn)入成熟期。其財務(wù)特點是銷售量大,產(chǎn)品利潤率高、負(fù)債比率低,可以為企業(yè)提供資金,而且由于增長率低,也無需增大投資。因而成為企業(yè)回收資金,支持其它產(chǎn)品,尤其明星產(chǎn)品投資的后盾。
把設(shè)備投資和其它投資盡量壓縮; 采用榨油式方法,爭取在短時間內(nèi)獲取更多利潤,為其它產(chǎn)品提供資金。
對于這一象限內(nèi)的銷售增長率仍有所增長的產(chǎn)品,應(yīng)進(jìn)一步進(jìn)行市場細(xì)分,維持現(xiàn)存市場增長率或延緩其下降速度。
金牛產(chǎn)品 = baier_str.where((baier_str.交易增長幅度<=baier_str.交易增長幅度.mean()
)&(baier_str.交易金額>=baier_str.交易金額.mean())).dropna()
金牛產(chǎn)品

問題產(chǎn)品
低銷售額占比,高銷售增長率
問題產(chǎn)品(question marks)。它是處于高增長率、低市場占有率象限內(nèi)的產(chǎn)品群。前者說明市場機(jī)會大,前景好,而后者則說明在市場營銷上存在問題。
其財務(wù)特點是利潤率較低,所需資金不足,負(fù)債比率高。例如在產(chǎn)品生命周期中處于引進(jìn)期、因種種原因未能開拓市場局面的新產(chǎn)品即屬此類問題的產(chǎn)品。
對問題產(chǎn)品應(yīng)采取選擇性投資戰(zhàn)略。因此,對問題產(chǎn)品的改進(jìn)與扶持方案一般均列入企業(yè)長期計劃中。
問題產(chǎn)品=baier_str.where((baier_str.交易增長幅度>=baier_str.交易增長幅度.mean()
)&(baier_str.交易金額<=baier_str.交易金額.mean())).dropna()
問題產(chǎn)品

瘦狗產(chǎn)品
低銷售額占比,低銷售增長率
瘦狗產(chǎn)品(dogs),也稱衰退類產(chǎn)品。它是處在低增長率、低市場占有率象限內(nèi)的產(chǎn)品群。其財務(wù)特點是利潤率低、處于保本或虧損狀態(tài),負(fù)債比率高,無法為企業(yè)帶來收益。
對這類產(chǎn)品應(yīng)采用撤退戰(zhàn)略:
首先應(yīng)減少批量,逐漸撤退,對那些銷售增長率和市場占有率均極低的產(chǎn)品應(yīng)立即淘汰。 其次是將剩余資源向其它產(chǎn)品轉(zhuǎn)移。 第三是整頓產(chǎn)品系列,最好將瘦狗產(chǎn)品與其它事業(yè)部合并,統(tǒng)一管理。
瘦狗產(chǎn)品 = baier_str.where((baier_str.交易增長幅度<=baier_str.交易增長幅度.mean()
)&(baier_str.交易金額<=baier_str.交易金額.mean())).dropna()
瘦狗產(chǎn)品

從以上結(jié)果,可以得到如下幾點信息。
拜耳低明顯產(chǎn)品不明顯,增長緩慢的一個原因 潛力款產(chǎn)品較多,要考慮是否應(yīng)該投入更多的營銷資源去保持增長幅度,使得其轉(zhuǎn)化為明顯產(chǎn)品或金牛產(chǎn)品 潛力款產(chǎn)品較多,要考慮是否應(yīng)該投入營銷資源去保持增長幅度,使得其轉(zhuǎn)化為明顯產(chǎn)品或金牛產(chǎn)品 瘦狗產(chǎn)品:產(chǎn)品容量、外觀設(shè)計問題,或是產(chǎn)品標(biāo)題問題
波斯頓矩陣可視化
為了方便大家查看,可視化代碼如下,代碼比較簡單,一個循環(huán)繪制四個字圖。
ax = plt.figure(figsize=(8,8))
a = [問題產(chǎn)品,明星產(chǎn)品,瘦狗產(chǎn)品,金牛產(chǎn)品]
b = ['問題產(chǎn)品','明星產(chǎn)品','瘦狗產(chǎn)品','金牛產(chǎn)品']
c = ['b','y','r','k']
for i in range(len(a)):
ax.add_subplot(2,2,i+1)
plt.scatter(a[i].交易金額,a[i].交易增長幅度,c = c[i])
plt.title(b[i])
if i==0:
plt.ylim(baier_str.交易增長幅度.mean()-1,baier_str.交易增長幅度.max()+5)
plt.xlim(baier_str.交易金額.min()-100000,baier_str.交易金額.mean()+10000)
elif i==1:
plt.ylim(baier_str.交易增長幅度.mean()-1,baier_str.交易增長幅度.max()+5)
plt.xlim(baier_str.交易金額.mean()-10000,baier_str.交易金額.max()+2000000)
elif i==2:
plt.ylim(baier_str.交易增長幅度.min()-0.01,baier_str.交易增長幅度.mean()+0.01)
plt.xlim(baier_str.交易金額.min()-100000,baier_str.交易金額.mean()+10000)
elif i==3:
plt.ylim(baier_str.交易增長幅度.min()-0.01,baier_str.交易增長幅度.mean()+0.01)
plt.xlim(baier_str.交易金額.mean()-10000,baier_str.交易金額.max()+2000000)

科凌產(chǎn)品結(jié)構(gòu)分析
通過對競爭對手產(chǎn)品結(jié)構(gòu)分析,尤其是對手大流量產(chǎn)品,可以找出下一步市場增長點,拓展業(yè)務(wù),減少推廣風(fēng)險。
對自家產(chǎn)品有相對增長減緩對產(chǎn)品,防止其他結(jié)構(gòu)點品牌對自家產(chǎn)品對沖擊。
同樣讀取數(shù)據(jù),對銷售數(shù)據(jù)進(jìn)行處理,處理邏輯跟拜耳產(chǎn)品處理邏輯一樣。結(jié)果如下所示。
keling_02 = pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/商品交易數(shù)據(jù)/科凌蟲控全店商品交易數(shù)據(jù).xlsx')
keling_str = keling_02.groupby('商品').agg({'交易增長幅度':np.mean,
'支付轉(zhuǎn)化指數(shù)':np.mean,
'交易金額':np.sum})
keling_str['交易金額占比'] = keling_str.交易金額/keling_str.交易金額.sum()*100
keling_str

同樣的方法分別計算明星產(chǎn)品,金牛產(chǎn)品,問題產(chǎn)品和瘦狗產(chǎn)品。
明星產(chǎn)品=keling_str.where((keling_str.交易增長幅度>=keling_str.交易增長幅度.mean()
)&(keling_str.交易金額>=keling_str.交易金額.mean())).dropna()
金牛產(chǎn)品=keling_str.where((keling_str.交易增長幅度<keling_str.交易增長幅度.mean()
)&(keling_str.交易金額>=keling_str.交易金額.mean())).dropna()
由此可見:
競爭產(chǎn)品:滅蟑螂21966057元,已造成威脅 拜耳未涉及產(chǎn)品:滅鼠、除螨產(chǎn)品也已達(dá)到兩百多萬
問題產(chǎn)品=keling_str.where((keling_str.交易增長幅度>=keling_str.交易增長幅度.mean()
)&(keling_str.交易金額<keling_str.交易金額.mean())).dropna()
瘦狗產(chǎn)品=keling_str.where((keling_str.交易增長幅度<keling_str.交易增長幅度.mean()
)&(keling_str.交易金額<keling_str.交易金額.mean())).dropna()
波斯頓矩陣可視化

科凌產(chǎn)品結(jié)構(gòu)分析:
金牛產(chǎn)品明顯,滅蟑產(chǎn)品對銷售額與拜耳主營業(yè)務(wù)差距不是非常大。 科凌產(chǎn)品多樣化,特別是滅鼠和除螨,拜耳還沒有涉及大兩大業(yè)務(wù)現(xiàn)金牛產(chǎn)品屬性也很明顯。 除螨產(chǎn)品增長迅速,滿足了二級市場的第三大產(chǎn)品需求。
安速產(chǎn)品結(jié)構(gòu)分析
最后一個安速產(chǎn)品,處理邏輯一致,就不過多闡述。
ansu_02 = pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/商品交易數(shù)據(jù)/安速全店商品交易數(shù)據(jù).xlsx')
ansu_02

ansu_str = ansu_02.groupby('商品').agg({'交易增長幅度':np.mean,
'支付轉(zhuǎn)化指數(shù)':np.mean,
'交易金額':np.sum})
ansu_str['交易金額占比'] = ansu_str.交易金額/ansu_str.交易金額.sum()*100
計算波斯頓矩陣中各個產(chǎn)品分布值及可視化
明星產(chǎn)品=ansu_str.where((ansu_str.交易增長幅度>=ansu_str.交易增長幅度.mean()
)&(ansu_str.交易金額>=ansu_str.交易金額.mean())).dropna()
金牛產(chǎn)品=ansu_str.where((ansu_str.交易增長幅度<ansu_str.交易增長幅度.mean()
)&(ansu_str.交易金額>=ansu_str.交易金額.mean())).dropna()
問題產(chǎn)品=ansu_str.where((ansu_str.交易增長幅度>=ansu_str.交易增長幅度.mean()
)&(ansu_str.交易金額<ansu_str.交易金額.mean())).dropna()
瘦狗產(chǎn)品=ansu_str.where((ansu_str.交易增長幅度<ansu_str.交易增長幅度.mean()
)&(ansu_str.交易金額<ansu_str.交易金額.mean())).dropna()

安速產(chǎn)品分析部分結(jié)果如下:
現(xiàn)金牛產(chǎn)品多,覆蓋廣 主營業(yè)務(wù)與拜耳構(gòu)成沖突 安速現(xiàn)金牛和潛力產(chǎn)品覆蓋了二級市場,跳蚤產(chǎn)品支付熱度明顯
產(chǎn)品輿情分析
輿情分析就是根據(jù)特定問題的需要,對針對這個問題的輿情進(jìn)行深層次的思維加工和分析研究,得到相關(guān)結(jié)論的過程。而本次案例輿情分析是透過用戶對某商品的評論信息進(jìn)行輿情分析。
評論是對內(nèi)容互動的基本形式,參與評論的用戶越多證明該內(nèi)容能吸引用戶互動的價值越大。當(dāng)然,評論多并不一定意味著內(nèi)容本身的質(zhì) 量或價值度高,很多內(nèi)容可能通過打擦邊球甚至做有爭議內(nèi)容來增加用戶的評論。
本次輿情分析,是對各個產(chǎn)品對評論內(nèi)容通過一系列方法,包括通過語句分詞,詞頻統(tǒng)計及繪制詞云圖等進(jìn)行分析。
拜耳輿情分析
首先讀取產(chǎn)品評論數(shù)據(jù)表,獲取其評論字段數(shù)據(jù)。
baier_03 = pd.read_excel('./baier/電商案例數(shù)據(jù)/拜耳店鋪數(shù)據(jù)/德國拜耳產(chǎn)品評論數(shù)據(jù).xlsx')
baier_03.head()

baier_03 = baier_03.評論
baier_03
0 剛收到,家里廚房突然出現(xiàn)小強(qiáng)了,看了這個評價挺多挺好,銷量也大,趕緊定了三盒,一定要管用啊一...
1 朋友推薦的說之前用的挺管用的。在放藥的前幾天就沒怎么見蟑螂了,然后出去玩之前把家里角角落落全...
2 真心坑人??!??還沒到24小時就凝固了!小強(qiáng)依然活躍????????
3 盆友推薦的,說特別好用,效果杠杠的,看雙十一做活動,就買啦,效果應(yīng)該不錯吧,不過尸體都是家里...
4 我是買到假貨嗎?那么貴的蟑螂藥居然還有,還是蟑螂已經(jīng)百毒不侵了?
...
1395 此用戶沒有填寫評論!
1396 有點貴,已經(jīng)用了,期待效果
1397 物流挺快的客服也很貼心好評
1398 看起來不錯,暫時沒發(fā)現(xiàn)蟑螂
1399 買二送一,期待效果呀,這個是同事推薦并且指定的產(chǎn)品,希望好用以后就再來吧…&h...
Name: 評論, Length: 1400, dtype: object
刪除沒有價值的信息
很多時候,我們購買某些產(chǎn)品,但懶得去評論,此時系統(tǒng)到了一定的時間,會給你自動打上標(biāo)簽:'此用戶沒有填寫評論!',這部分信息對于我們分析是沒有用的,因此需要將其刪除。
此用戶沒有填寫評論!
baier_03 = baier_03[baier_03 != '此用戶沒有填寫評論!']
baier_03
0 剛收到,家里廚房突然出現(xiàn)小強(qiáng)了,看了這個評價挺多挺好,銷量也大,趕緊定了三盒,一定要管用啊一...
1 朋友推薦的說之前用的挺管用的。在放藥的前幾天就沒怎么見蟑螂了,然后出去玩之前把家里角角落落全...
2 真心坑人啊!??還沒到24小時就凝固了!小強(qiáng)依然活躍????????
3 盆友推薦的,說特別好用,效果杠杠的,看雙十一做活動,就買啦,效果應(yīng)該不錯吧,不過尸體都是家里...
4 我是買到假貨嗎?那么貴的蟑螂藥居然還有,還是蟑螂已經(jīng)百毒不侵了?
...
1394 試用一個星期,德國小蠊的數(shù)量有明顯減少。按照了說明去點藥,用藥一個星期之后零星能找到蟑螂尸體...
1396 有點貴,已經(jīng)用了,期待效果
1397 物流挺快的客服也很貼心好評
1398 看起來不錯,暫時沒發(fā)現(xiàn)蟑螂
1399 買二送一,期待效果呀,這個是同事推薦并且指定的產(chǎn)品,希望好用以后就再來吧…&h...
Name: 評論, Length: 1300, dtype: object
同樣也會出現(xiàn)這樣的情況,商家為鼓勵消費者評價,會給個評價小紅包,買家又懶得評價,就會復(fù)制別人的評論。因此難免會出現(xiàn)重復(fù)值,這里我們也需要添加去除重復(fù)評論的操作。
刪除重復(fù)評論
baier_03.drop_duplicates(inplace=True)
baier_03.reset_index(drop=True,inplace=True)

詞頻分析
主要分為詞頻統(tǒng)計和繪制詞云圖兩種常用的詞頻分析方法。
首先導(dǎo)入需要用到的模塊。
from wordcloud import WordCloud, STOPWORDS
import jieba
import matplotlib.pyplot as plt
再對上面得到的語句列表進(jìn)行結(jié)巴分詞處理。
text = ''
for i in baier_03:
text += ' '.join(jieba.lcut(i))
text

詞云圖
這里我定義了一個詞云圖函數(shù),其中包括自定義停用詞,分詞,去除停用詞,配置詞云的基本參數(shù),用分好的詞進(jìn)行詞云圖生成等等一系列操作。大家也可以將下面代碼復(fù)制出來做個筆記,以后用到的話,直接拿來即用,方便省事。
def Wordcloud(x):
res=x
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import jieba
stopwords = set()
content = [line.strip() for line in open('stopwords.txt','r').readlines()]
stopwords.update(content)
text=""
for i in res:
text=text+" ".join(jieba.lcut(i))
#配置詞云的基本參數(shù)
my_cloud=WordCloud(
background_color='white',
stopwords=stopwords,#也可用自帶的停留詞
font_path='/System/Library/Fonts/STHeiti Medium.ttc',
width=1000,
height=500)
#用分好的詞進(jìn)行詞云圖生成
my_cloud.generate(text)
#顯示詞云
plt.rcParams['figure.figsize']=(14,8)
plt.imshow(my_cloud)
plt.axis('off')
plt.show()
Wordcloud(baier_03)

主題特征提取
本案例的主題特征提取其實就是提取用戶評論中關(guān)鍵字。
關(guān)鍵字提取是從文本中提取跟內(nèi)容最相關(guān)的詞語,關(guān)鍵字抽取的結(jié)果常用于文檔檢索、文章標(biāo)簽編輯等,也經(jīng)常用在文本聚類、文本分 類、關(guān)鍵字摘要等方面。
關(guān)鍵字模型能生成簡短的關(guān)于文檔內(nèi)容的指示性信息,將文檔的主要內(nèi)容或核心關(guān)鍵字呈現(xiàn)給用戶,以決定是否要閱讀文檔的原文,這樣 能夠節(jié)省大量的瀏覽時間并提高信息關(guān)鍵信息的展示能力。
文章關(guān)鍵字模型抽取應(yīng)用場景:帖子、新聞、資訊、評論、問答 的標(biāo)簽、內(nèi)容和meta信息的產(chǎn)生。
文章關(guān)鍵字模型抽取常用方法:通過詞頻統(tǒng)計、TF-IDF模型獲得文本的主要關(guān)鍵字。
這里我們使用的是jieba分詞中的主題特征提取函數(shù)jieba.analyse.extract_tags。具體代碼如下。
import jieba.analyse
with open('./baier/文本/stopwords.txt') as f:
stopwords = f.read()
c=''
for i in baier_03:
text_01=jieba.lcut(i)
for word in text_01:
if word in stopwords:
continue
elif word=='hellip':
continue
else:
c+=' '+word
top15 = jieba.analyse.extract_tags(c,topK=15,withWeight=True)
top15
我們?nèi)≈黝}評分最高的前15個作為本次分析的對象。
[('蟑螂', 0.53339416054279),
('效果', 0.32093429997410744),
('好評', 0.18237001476358497),
('雙十', 0.13505752082213712),
('不錯', 0.1224331453720733),
('小強(qiáng)', 0.11686764891551786),
('滿意', 0.08728920885818746),
('濕巾', 0.0839275253212345),
('追評', 0.0675780074015135),
('收到', 0.0657725962627024),
('沒用', 0.06424569614348834),
('劃算', 0.05729263019878829),
('好用', 0.057249479004923415),
('尸體', 0.05667847597855945),
('濕紙巾', 0.05449755096973013)]
為了更加方便分析結(jié)果。我們將上面15個主題進(jìn)行可視化分析。簡單地繪制了如下橫向柱狀圖。
plt.figure(figsize=(8,6))
top15 = pd.DataFrame(top15)
plt.barh(top15.iloc[:,0],top15.iloc[:,1])

科凌輿情分析
keling_03 = pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/評論輿情數(shù)據(jù)/科林蟲控.xlsx')
keling_03.head()

from text_analy import clean
text_02=clean(keling_03)
text_02

詞頻分析
Wordcloud(text_02)

主題特征提取
stopwords = pd.read_table('./baier/文本/stopwords.txt'
,quoting=3,names=['stopword'])
from theam_extract_02 import extract
extract(text_02,stopwords)

科凌滅蟑產(chǎn)品好評居多,但是差評比拜耳稍微多點。
安速輿情分析
ansu_03 = pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/評論輿情數(shù)據(jù)/安速.xlsx')
from text_analy import clean
text_03=clean(ansu_03)
Wordcloud(text_03)

stopwords = pd.read_table('./baier/文本/stopwords.txt'
,quoting=3,names=['stopword'])
from theam_extract_02 import extract
extract(text_03,stopwords)

安速滅蟑產(chǎn)品負(fù)面評論極少,滅蟑產(chǎn)品優(yōu)化方面可以考察安速。
產(chǎn)品流量分析
流量(Traffic)是企業(yè)獲得用戶的第一步,對于大多數(shù)需要“自力更生”企業(yè)而 言,流量幾乎是企業(yè)運(yùn)營的命脈之一,沒有流量就沒有一切。流量數(shù)據(jù)化運(yùn)營要解決的本質(zhì)問題是 如何通過數(shù)據(jù)獲得更多流量以及有效流量,然后完成最大化的營銷轉(zhuǎn)化目標(biāo)。
這里列舉八大流量分析工具:
這里介紹一些 市場上主流的流量分析工具,它們可以提供流量數(shù)據(jù)的跟蹤、采集、配 置、處理、分析和整合功能,其中有免費也有付費的。
Adobe Analytics Webtrekk Suite Webtrends Google Analytics IBM Coremetrics 百度統(tǒng)計 Flurry 友盟
無流量不電商,沒有流量大電商就猶如線下在荒郊野外開了一個購物中心,雖然硬件都不錯,但是沒人光顧。流量大來源需要細(xì)分,細(xì)分包括多地理屬性的細(xì)分、渠道來源的細(xì)分、時間屬性的細(xì)分、推廣內(nèi)容的細(xì)分等,其中流量來源渠道是其中的重點,也算最復(fù)雜的一部分。
細(xì)分完后的流量可以通過數(shù)據(jù)對比找到流量的主要來源,接下來要做的就是實時監(jiān)控主要渠道流量的對比和趨勢變化。對比可以和競爭對手對比,和類目流量對比等。
本案例流量分析,主要細(xì)分各個品牌官方旗艦店流量來源渠道及交易指數(shù),通過橫向比較各個流量來源的交易指數(shù)大小,及縱向比較不同品牌商各流量渠道交易指數(shù),從而完成競品分析的一部分。
拜耳流量分析
baier_04 = pd.read_excel('./baier/電商案例數(shù)據(jù)/拜耳店鋪數(shù)據(jù)/拜耳官方旗艦店流量渠道.xlsx')
del baier_04['交易指數(shù).1']
baier_04.set_index('流量來源',inplace=True)
baier_04.head()

top10 = baier_04.sort_values('交易指數(shù)',ascending=False)[:10]
top10.plot(kind='barh',figsize=(10,6))

科凌流量分析
kelin=pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/流量渠道數(shù)據(jù)/科凌蟲控旗艦店流量渠道.xlsx')
kelin['交易占比']=kelin.交易指數(shù)/kelin.交易指數(shù).sum()*100
top10=kelin.sort_values('交易指數(shù)',ascending=False).reset_index(drop=True).iloc[0:10,:]
top10.index=top10['流量來源']
top10.drop(['流量來源','交易占比'],axis=1,inplace=True)
top10.plot(kind='barh');

安速流量分析
ansu=pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/流量渠道數(shù)據(jù)/安速家居旗艦店流量渠道.xlsx')
ansu['交易占比']=ansu.交易指數(shù)/ansu.交易指數(shù).sum()*100
top10=ansu.sort_values('交易指數(shù)',ascending=False).reset_index(drop=True).iloc[0:10,:]
top10.index=top10['流量來源']
top10.drop(['流量來源','交易占比'],axis=1,inplace=True)
top10.plot(kind='barh');

主要的競爭對手都不太注重淘內(nèi)流量服務(wù)購買,拜耳可以通過直通車等付費流量渠道來增加產(chǎn)品曝光。

推薦閱讀
歡迎長按掃碼關(guān)注「數(shù)據(jù)管道」
