1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        Python電商數(shù)據(jù)分析案例|如何分析競爭對手?

        共 18520字,需瀏覽 38分鐘

         ·

        2021-08-05 17:45

        大家好,我是寶器!

        導(dǎo)讀: 本篇中將繼續(xù)從微觀市場方面,從產(chǎn)品結(jié)構(gòu)、產(chǎn)品輿情及產(chǎn)品流量三個方面深入探討拜耳產(chǎn)品的競品分析。

        ??點擊關(guān)注|設(shè)為星標(biāo)|干貨速遞??



        電商分析基礎(chǔ)知識

        電子商務(wù)和傳統(tǒng)零售數(shù)據(jù)分析的區(qū)別

        • 傳統(tǒng)零售是利用二八法則生存,電商是靠長尾理論積累銷售。
        • 電商是大數(shù)據(jù),傳統(tǒng)零售是小數(shù)據(jù)。
        • 傳統(tǒng)零售是"物流",零售過程就是商品的流動。電子商務(wù)是"信息流",顧客通過搜索、比價、評論、分享產(chǎn)生信息,達(dá)到購買的目的。
        • 傳統(tǒng)零售注重體驗感,購物有時候也是社交的一部分,現(xiàn)在的購物中心基本是吃喝玩樂一體化設(shè)計。電商注重服務(wù)和效率,雖然也有吃喝玩樂的產(chǎn)品,但卻不能方便及時享受。
        • 傳統(tǒng)零售是做加法,電子商務(wù)是做乘法。傳統(tǒng)零售通過一家店一家店的開發(fā)來擴(kuò)充自己的影響力,電商則通過資金的投入迅速搶占市場。
        • 成本結(jié)構(gòu)不同,傳統(tǒng)零售的主要成本是租房與人工成本,電商的主要成本是物流和營銷成本。

        電商數(shù)據(jù)分析需要的數(shù)據(jù)

        電商需要的數(shù)據(jù)復(fù)雜,數(shù)據(jù)來源渠道也多樣化,當(dāng)然數(shù)據(jù)質(zhì)量也是有好有壞的。

        • 營銷數(shù)據(jù)
          包括營銷費用、覆蓋用戶數(shù)、達(dá)到用戶數(shù)、打開或點擊用戶數(shù)。
        • 流量數(shù)據(jù)
          包括瀏覽量、訪客數(shù)、登陸時間、在線時長等基礎(chǔ)數(shù)據(jù)。
        • 會員數(shù)據(jù)
          包括會員的姓名、出生日期、真實性別、網(wǎng)絡(luò)性別、地址、手機(jī)號、微博號、微信號等基礎(chǔ)數(shù)據(jù)。
        • 交易及服務(wù)數(shù)據(jù)
          包括交易金額、交易數(shù)量、交易人數(shù)、交易商品、交易場所、交易時間。供應(yīng)鏈服務(wù)等數(shù)據(jù)。
        • 行業(yè)數(shù)據(jù)
          淘寶的數(shù)據(jù)魔方提供行業(yè)品牌的關(guān)鍵字搜索、店鋪排名、銷售、會員等數(shù)據(jù)查詢。

        產(chǎn)品結(jié)構(gòu)分析

        波士頓矩陣

        波士頓矩陣又稱市場增長率-相對市場份額矩陣、波士頓咨詢集團(tuán)法、四象限分析法、產(chǎn)品系列結(jié)構(gòu)管理法等。

        適用于一般產(chǎn)品,不適合引流產(chǎn)品。

        • 明星產(chǎn)品:高市場占有率,高業(yè)務(wù)增長率
        • 金牛產(chǎn)品:高市場占有率,低業(yè)務(wù)增長率
        • 問題產(chǎn)品:低市場占有率,高業(yè)務(wù)增長率
        • 瘦狗產(chǎn)品:低市場占有率,低業(yè)務(wù)增長率

        波士頓矩陣的應(yīng)用

        (1)評價各項業(yè)務(wù)的前景。BCG是用市場增長率這一指標(biāo)來表示發(fā)展前景的。這一步的數(shù)據(jù)可以從企業(yè)的經(jīng)營分析系統(tǒng)中提取。

        (2)評價各項業(yè)務(wù)的競爭地位。BCG是用“相對市場份額”這個指標(biāo)來表示競爭力的。這一步需要做市場調(diào)查才能得到相對準(zhǔn)確的數(shù)據(jù)。計算公式是把一單位的收益除以其最大競爭對手的收益。

        (3)表明各項業(yè)務(wù)在BCG矩陣圖上的位置。具體方法是以業(yè)務(wù)在二維坐標(biāo)上的坐標(biāo)點為圓心畫一個圓圈,圓圈的大小來表示企業(yè)每項業(yè)務(wù)的銷售額。

        (4)確定縱坐標(biāo)“市場增長率”的一個標(biāo)準(zhǔn)線,從而將“市場增長率”劃分為高、低兩個區(qū)域。
        比較科學(xué)的方法有兩種:

        1. 把該行業(yè)市場的平均增長率作為分界線
        2. 把多種產(chǎn)品的市場增長率(加權(quán))平均值作為界分點

        需要說明的是,高市場增長定義為銷售額至少達(dá)到10%的年增長率(扣除通貨膨脹因素后)。

        (5)確定橫坐標(biāo)“相對市場份額”的一個標(biāo)準(zhǔn)線,從而將“相對市場份額”劃分為高、低兩個區(qū)域。

        拜耳產(chǎn)品結(jié)構(gòu)分析

        首先獲取拜耳全店商品交易數(shù)據(jù),數(shù)據(jù)樣例如下圖所示。

        baier_02 = pd.read_excel('./baier/電商案例數(shù)據(jù)/拜耳店鋪數(shù)據(jù)/拜耳全店商品交易數(shù)據(jù).xlsx')
        baier_02.head()

        以單個商品為聚合,分別對交易增長幅度求平均,支付轉(zhuǎn)化指數(shù)求平局,交易金額求和,這些只需要一行代碼就能搞定。

        下一步將單個商品的交易金額除以全部商品的交易總金額,得到單個商品的交易金額占比。

        baier_str = baier_02.groupby('商品').agg({'交易增長幅度':np.mean,
                                                '支付轉(zhuǎn)化指數(shù)':np.mean,
                                                '交易金額':np.sum})
        baier_str['交易金額占比'] = baier_str.交易金額/baier_str.交易金額.sum()*100
        baier_str.head()

        對上述表進(jìn)行描述性統(tǒng)計,查看下是否有缺失值、異常值等"臟"數(shù)據(jù)或不合理的數(shù)據(jù)。從結(jié)果看,交易增長幅度最大值(紅色框框)為1030,很明顯是個異常值,我們將其刪除,

        baier_str.describe()

        刪除異常值

        baier_str = baier_str[baier_str.交易增長幅度!=1030.00]

        明星產(chǎn)品

        高銷售額占比,高銷售增長率

        它是指處于高增長率、高市場占有率象限內(nèi)的產(chǎn)品群,這類產(chǎn)品可能成為企業(yè)的現(xiàn)金牛產(chǎn)品,需要加大投資以支持其迅速發(fā)展。

        采用的發(fā)展戰(zhàn)略是:積極擴(kuò)大經(jīng)濟(jì)規(guī)模和市場機(jī)會,以長遠(yuǎn)利益為目標(biāo),提高市場占有率,加強(qiáng)競爭地位。發(fā)展戰(zhàn)略以及明星產(chǎn)品的管理與組織最好采用事業(yè)部形式,由對生產(chǎn)技術(shù)和銷售兩方面都很內(nèi)行的經(jīng)營者負(fù)責(zé)。

        明星產(chǎn)品=baier_str.where((baier_str.交易增長幅度>=baier_str.交易增長幅度.mean()
                             )&(baier_str.交易金額>=baier_str.交易金額.mean())).dropna()
        明星產(chǎn)品

        金牛產(chǎn)品

        高銷售額占比,低銷售增長率

        現(xiàn)金牛產(chǎn)品(cash cow),又稱厚利產(chǎn)品。它是指處于低增長率、高市場占有率象限內(nèi)的產(chǎn)品群,已進(jìn)入成熟期。其財務(wù)特點是銷售量大,產(chǎn)品利潤率高、負(fù)債比率低,可以為企業(yè)提供資金,而且由于增長率低,也無需增大投資。因而成為企業(yè)回收資金,支持其它產(chǎn)品,尤其明星產(chǎn)品投資的后盾。

        • 把設(shè)備投資和其它投資盡量壓縮;
        • 采用榨油式方法,爭取在短時間內(nèi)獲取更多利潤,為其它產(chǎn)品提供資金。

        對于這一象限內(nèi)的銷售增長率仍有所增長的產(chǎn)品,應(yīng)進(jìn)一步進(jìn)行市場細(xì)分,維持現(xiàn)存市場增長率或延緩其下降速度。

        金牛產(chǎn)品 = baier_str.where((baier_str.交易增長幅度<=baier_str.交易增長幅度.mean()
                               )&(baier_str.交易金額>=baier_str.交易金額.mean())).dropna()
        金牛產(chǎn)品

        問題產(chǎn)品

        低銷售額占比,高銷售增長率

        問題產(chǎn)品(question marks)。它是處于高增長率、低市場占有率象限內(nèi)的產(chǎn)品群。前者說明市場機(jī)會大,前景好,而后者則說明在市場營銷上存在問題。

        其財務(wù)特點是利潤率較低,所需資金不足,負(fù)債比率高。例如在產(chǎn)品生命周期中處于引進(jìn)期、因種種原因未能開拓市場局面的新產(chǎn)品即屬此類問題的產(chǎn)品。

        對問題產(chǎn)品應(yīng)采取選擇性投資戰(zhàn)略。因此,對問題產(chǎn)品的改進(jìn)與扶持方案一般均列入企業(yè)長期計劃中。

        問題產(chǎn)品=baier_str.where((baier_str.交易增長幅度>=baier_str.交易增長幅度.mean()
                             )&(baier_str.交易金額<=baier_str.交易金額.mean())).dropna()
        問題產(chǎn)品

        瘦狗產(chǎn)品

        低銷售額占比,低銷售增長率

        瘦狗產(chǎn)品(dogs),也稱衰退類產(chǎn)品。它是處在低增長率、低市場占有率象限內(nèi)的產(chǎn)品群。其財務(wù)特點是利潤率低、處于保本或虧損狀態(tài),負(fù)債比率高,無法為企業(yè)帶來收益。

        對這類產(chǎn)品應(yīng)采用撤退戰(zhàn)略:

        • 首先應(yīng)減少批量,逐漸撤退,對那些銷售增長率和市場占有率均極低的產(chǎn)品應(yīng)立即淘汰。
        • 其次是將剩余資源向其它產(chǎn)品轉(zhuǎn)移。
        • 第三是整頓產(chǎn)品系列,最好將瘦狗產(chǎn)品與其它事業(yè)部合并,統(tǒng)一管理。
        瘦狗產(chǎn)品 = baier_str.where((baier_str.交易增長幅度<=baier_str.交易增長幅度.mean()
                               )&(baier_str.交易金額<=baier_str.交易金額.mean())).dropna()
        瘦狗產(chǎn)品

        從以上結(jié)果,可以得到如下幾點信息。

        • 拜耳低明顯產(chǎn)品不明顯,增長緩慢的一個原因
        • 潛力款產(chǎn)品較多,要考慮是否應(yīng)該投入更多的營銷資源去保持增長幅度,使得其轉(zhuǎn)化為明顯產(chǎn)品或金牛產(chǎn)品
        • 潛力款產(chǎn)品較多,要考慮是否應(yīng)該投入營銷資源去保持增長幅度,使得其轉(zhuǎn)化為明顯產(chǎn)品或金牛產(chǎn)品
        • 瘦狗產(chǎn)品:產(chǎn)品容量、外觀設(shè)計問題,或是產(chǎn)品標(biāo)題問題

        波斯頓矩陣可視化

        為了方便大家查看,可視化代碼如下,代碼比較簡單,一個循環(huán)繪制四個字圖。

        ax = plt.figure(figsize=(8,8))
        a = [問題產(chǎn)品,明星產(chǎn)品,瘦狗產(chǎn)品,金牛產(chǎn)品]
        b = ['問題產(chǎn)品','明星產(chǎn)品','瘦狗產(chǎn)品','金牛產(chǎn)品']
        c = ['b','y','r','k']
        for i in range(len(a)):
            ax.add_subplot(2,2,i+1)
            plt.scatter(a[i].交易金額,a[i].交易增長幅度,c = c[i])
            plt.title(b[i])
            if i==0:
                plt.ylim(baier_str.交易增長幅度.mean()-1,baier_str.交易增長幅度.max()+5)
                plt.xlim(baier_str.交易金額.min()-100000,baier_str.交易金額.mean()+10000)
            elif i==1:
                plt.ylim(baier_str.交易增長幅度.mean()-1,baier_str.交易增長幅度.max()+5)
                plt.xlim(baier_str.交易金額.mean()-10000,baier_str.交易金額.max()+2000000)
            elif i==2:
                plt.ylim(baier_str.交易增長幅度.min()-0.01,baier_str.交易增長幅度.mean()+0.01)
                plt.xlim(baier_str.交易金額.min()-100000,baier_str.交易金額.mean()+10000)
            elif i==3:
                plt.ylim(baier_str.交易增長幅度.min()-0.01,baier_str.交易增長幅度.mean()+0.01)
                plt.xlim(baier_str.交易金額.mean()-10000,baier_str.交易金額.max()+2000000)

        科凌產(chǎn)品結(jié)構(gòu)分析

        通過對競爭對手產(chǎn)品結(jié)構(gòu)分析,尤其是對手大流量產(chǎn)品,可以找出下一步市場增長點,拓展業(yè)務(wù),減少推廣風(fēng)險。

        對自家產(chǎn)品有相對增長減緩對產(chǎn)品,防止其他結(jié)構(gòu)點品牌對自家產(chǎn)品對沖擊。

        同樣讀取數(shù)據(jù),對銷售數(shù)據(jù)進(jìn)行處理,處理邏輯跟拜耳產(chǎn)品處理邏輯一樣。結(jié)果如下所示。

        keling_02 = pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/商品交易數(shù)據(jù)/科凌蟲控全店商品交易數(shù)據(jù).xlsx')
        keling_str = keling_02.groupby('商品').agg({'交易增長幅度':np.mean,
                                                  '支付轉(zhuǎn)化指數(shù)':np.mean,
                                                  '交易金額':np.sum})
        keling_str['交易金額占比'] = keling_str.交易金額/keling_str.交易金額.sum()*100
        keling_str

        同樣的方法分別計算明星產(chǎn)品,金牛產(chǎn)品,問題產(chǎn)品和瘦狗產(chǎn)品。

        明星產(chǎn)品=keling_str.where((keling_str.交易增長幅度>=keling_str.交易增長幅度.mean()
                              )&(keling_str.交易金額>=keling_str.交易金額.mean())).dropna()
        金牛產(chǎn)品=keling_str.where((keling_str.交易增長幅度<keling_str.交易增長幅度.mean()
                              )&(keling_str.交易金額>=keling_str.交易金額.mean())).dropna()

        由此可見:

        • 競爭產(chǎn)品:滅蟑螂21966057元,已造成威脅
        • 拜耳未涉及產(chǎn)品:滅鼠、除螨產(chǎn)品也已達(dá)到兩百多萬
        問題產(chǎn)品=keling_str.where((keling_str.交易增長幅度>=keling_str.交易增長幅度.mean()
                              )&(keling_str.交易金額<keling_str.交易金額.mean())).dropna()
        瘦狗產(chǎn)品=keling_str.where((keling_str.交易增長幅度<keling_str.交易增長幅度.mean()
                              )&(keling_str.交易金額<keling_str.交易金額.mean())).dropna()

        波斯頓矩陣可視化

        科凌產(chǎn)品結(jié)構(gòu)分析:

        • 金牛產(chǎn)品明顯,滅蟑產(chǎn)品對銷售額與拜耳主營業(yè)務(wù)差距不是非常大。
        • 科凌產(chǎn)品多樣化,特別是滅鼠和除螨,拜耳還沒有涉及大兩大業(yè)務(wù)現(xiàn)金牛產(chǎn)品屬性也很明顯。
        • 除螨產(chǎn)品增長迅速,滿足了二級市場的第三大產(chǎn)品需求。

        安速產(chǎn)品結(jié)構(gòu)分析

        最后一個安速產(chǎn)品,處理邏輯一致,就不過多闡述。

        ansu_02 = pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/商品交易數(shù)據(jù)/安速全店商品交易數(shù)據(jù).xlsx')
        ansu_02
        ansu_str = ansu_02.groupby('商品').agg({'交易增長幅度':np.mean,
                                              '支付轉(zhuǎn)化指數(shù)':np.mean,
                                              '交易金額':np.sum})
        ansu_str['交易金額占比'] = ansu_str.交易金額/ansu_str.交易金額.sum()*100

        計算波斯頓矩陣中各個產(chǎn)品分布值及可視化

        明星產(chǎn)品=ansu_str.where((ansu_str.交易增長幅度>=ansu_str.交易增長幅度.mean()
                            )&(ansu_str.交易金額>=ansu_str.交易金額.mean())).dropna()
        金牛產(chǎn)品=ansu_str.where((ansu_str.交易增長幅度<ansu_str.交易增長幅度.mean()
                            )&(ansu_str.交易金額>=ansu_str.交易金額.mean())).dropna()
        問題產(chǎn)品=ansu_str.where((ansu_str.交易增長幅度>=ansu_str.交易增長幅度.mean()
                            )&(ansu_str.交易金額<ansu_str.交易金額.mean())).dropna()
        瘦狗產(chǎn)品=ansu_str.where((ansu_str.交易增長幅度<ansu_str.交易增長幅度.mean()
                            )&(ansu_str.交易金額<ansu_str.交易金額.mean())).dropna()

        安速產(chǎn)品分析部分結(jié)果如下:

        • 現(xiàn)金牛產(chǎn)品多,覆蓋廣
        • 主營業(yè)務(wù)與拜耳構(gòu)成沖突
        • 安速現(xiàn)金牛和潛力產(chǎn)品覆蓋了二級市場,跳蚤產(chǎn)品支付熱度明顯

        產(chǎn)品輿情分析

        輿情分析就是根據(jù)特定問題的需要,對針對這個問題的輿情進(jìn)行深層次的思維加工和分析研究,得到相關(guān)結(jié)論的過程。而本次案例輿情分析是透過用戶對某商品的評論信息進(jìn)行輿情分析。

        評論是對內(nèi)容互動的基本形式,參與評論的用戶越多證明該內(nèi)容能吸引用戶互動的價值越大。當(dāng)然,評論多并不一定意味著內(nèi)容本身的質(zhì) 量或價值度高,很多內(nèi)容可能通過打擦邊球甚至做有爭議內(nèi)容來增加用戶的評論。

        本次輿情分析,是對各個產(chǎn)品對評論內(nèi)容通過一系列方法,包括通過語句分詞,詞頻統(tǒng)計及繪制詞云圖等進(jìn)行分析。

        拜耳輿情分析

        首先讀取產(chǎn)品評論數(shù)據(jù)表,獲取其評論字段數(shù)據(jù)。

        baier_03 = pd.read_excel('./baier/電商案例數(shù)據(jù)/拜耳店鋪數(shù)據(jù)/德國拜耳產(chǎn)品評論數(shù)據(jù).xlsx')
        baier_03.head()
        baier_03 = baier_03.評論
        baier_03
        0       剛收到,家里廚房突然出現(xiàn)小強(qiáng)了,看了這個評價挺多挺好,銷量也大,趕緊定了三盒,一定要管用啊一...
        1 朋友推薦的說之前用的挺管用的。在放藥的前幾天就沒怎么見蟑螂了,然后出去玩之前把家里角角落落全...
        2 真心坑人??!??還沒到24小時就凝固了!小強(qiáng)依然活躍????????
        3 盆友推薦的,說特別好用,效果杠杠的,看雙十一做活動,就買啦,效果應(yīng)該不錯吧,不過尸體都是家里...
        4 我是買到假貨嗎?那么貴的蟑螂藥居然還有,還是蟑螂已經(jīng)百毒不侵了?
        ...
        1395 此用戶沒有填寫評論!
        1396 有點貴,已經(jīng)用了,期待效果
        1397 物流挺快的客服也很貼心好評
        1398 看起來不錯,暫時沒發(fā)現(xiàn)蟑螂
        1399 買二送一,期待效果呀,這個是同事推薦并且指定的產(chǎn)品,希望好用以后就再來吧&hellip;&h...
        Name: 評論, Length: 1400, dtype: object

        刪除沒有價值的信息

        很多時候,我們購買某些產(chǎn)品,但懶得去評論,此時系統(tǒng)到了一定的時間,會給你自動打上標(biāo)簽:'此用戶沒有填寫評論!',這部分信息對于我們分析是沒有用的,因此需要將其刪除。

        • 此用戶沒有填寫評論!
        baier_03 = baier_03[baier_03 != '此用戶沒有填寫評論!']
        baier_03
        0       剛收到,家里廚房突然出現(xiàn)小強(qiáng)了,看了這個評價挺多挺好,銷量也大,趕緊定了三盒,一定要管用啊一...
        1 朋友推薦的說之前用的挺管用的。在放藥的前幾天就沒怎么見蟑螂了,然后出去玩之前把家里角角落落全...
        2 真心坑人啊!??還沒到24小時就凝固了!小強(qiáng)依然活躍????????
        3 盆友推薦的,說特別好用,效果杠杠的,看雙十一做活動,就買啦,效果應(yīng)該不錯吧,不過尸體都是家里...
        4 我是買到假貨嗎?那么貴的蟑螂藥居然還有,還是蟑螂已經(jīng)百毒不侵了?
        ...
        1394 試用一個星期,德國小蠊的數(shù)量有明顯減少。按照了說明去點藥,用藥一個星期之后零星能找到蟑螂尸體...
        1396 有點貴,已經(jīng)用了,期待效果
        1397 物流挺快的客服也很貼心好評
        1398 看起來不錯,暫時沒發(fā)現(xiàn)蟑螂
        1399 買二送一,期待效果呀,這個是同事推薦并且指定的產(chǎn)品,希望好用以后就再來吧&hellip;&h...
        Name: 評論, Length: 1300, dtype: object

        同樣也會出現(xiàn)這樣的情況,商家為鼓勵消費者評價,會給個評價小紅包,買家又懶得評價,就會復(fù)制別人的評論。因此難免會出現(xiàn)重復(fù)值,這里我們也需要添加去除重復(fù)評論的操作。

        刪除重復(fù)評論

        baier_03.drop_duplicates(inplace=True)
        baier_03.reset_index(drop=True,inplace=True)

        詞頻分析

        主要分為詞頻統(tǒng)計和繪制詞云圖兩種常用的詞頻分析方法。

        首先導(dǎo)入需要用到的模塊。

        from wordcloud import WordCloud, STOPWORDS
        import jieba
        import matplotlib.pyplot as plt

        再對上面得到的語句列表進(jìn)行結(jié)巴分詞處理。

        text = ''
        for i in baier_03:
            text += ' '.join(jieba.lcut(i))
        text

        詞云圖

        這里我定義了一個詞云圖函數(shù),其中包括自定義停用詞,分詞,去除停用詞,配置詞云的基本參數(shù),用分好的詞進(jìn)行詞云圖生成等等一系列操作。大家也可以將下面代碼復(fù)制出來做個筆記,以后用到的話,直接拿來即用,方便省事。

        def Wordcloud(x):

            res=x
            from wordcloud import WordCloud
            import matplotlib.pyplot as plt
            import jieba
            
            stopwords = set()
            content = [line.strip() for line in open('stopwords.txt','r').readlines()]
            stopwords.update(content)

            text=""
            for i in res:
                text=text+" ".join(jieba.lcut(i))

            #配置詞云的基本參數(shù)
            my_cloud=WordCloud(
                                background_color='white',
                                stopwords=stopwords,#也可用自帶的停留詞
                                font_path='/System/Library/Fonts/STHeiti Medium.ttc',
                                width=1000,
                                height=500)

            #用分好的詞進(jìn)行詞云圖生成
            my_cloud.generate(text)
            #顯示詞云
            plt.rcParams['figure.figsize']=(14,8)
            plt.imshow(my_cloud)
            plt.axis('off')
            plt.show()
            
        Wordcloud(baier_03)

        主題特征提取

        本案例的主題特征提取其實就是提取用戶評論中關(guān)鍵字。

        關(guān)鍵字提取是從文本中提取跟內(nèi)容最相關(guān)的詞語,關(guān)鍵字抽取的結(jié)果常用于文檔檢索、文章標(biāo)簽編輯等,也經(jīng)常用在文本聚類、文本分 類、關(guān)鍵字摘要等方面。

        關(guān)鍵字模型能生成簡短的關(guān)于文檔內(nèi)容的指示性信息,將文檔的主要內(nèi)容或核心關(guān)鍵字呈現(xiàn)給用戶,以決定是否要閱讀文檔的原文,這樣 能夠節(jié)省大量的瀏覽時間并提高信息關(guān)鍵信息的展示能力。

        文章關(guān)鍵字模型抽取應(yīng)用場景:帖子、新聞、資訊、評論、問答 的標(biāo)簽、內(nèi)容和meta信息的產(chǎn)生。

        文章關(guān)鍵字模型抽取常用方法:通過詞頻統(tǒng)計、TF-IDF模型獲得文本的主要關(guān)鍵字。

        這里我們使用的是jieba分詞中的主題特征提取函數(shù)jieba.analyse.extract_tags。具體代碼如下。

        import jieba.analyse
        with open('./baier/文本/stopwords.txt'as f:
            stopwords = f.read()
        c=''

        for i in baier_03:
            text_01=jieba.lcut(i)
            for word in text_01:
                if word in stopwords:
                    continue
                elif word=='hellip':
                    continue
                else:
                    c+=' '+word

        top15 = jieba.analyse.extract_tags(c,topK=15,withWeight=True)
        top15

        我們?nèi)≈黝}評分最高的前15個作為本次分析的對象。

        [('蟑螂', 0.53339416054279),
        ('效果', 0.32093429997410744),
        ('好評', 0.18237001476358497),
        ('雙十', 0.13505752082213712),
        ('不錯', 0.1224331453720733),
        ('小強(qiáng)', 0.11686764891551786),
        ('滿意', 0.08728920885818746),
        ('濕巾', 0.0839275253212345),
        ('追評', 0.0675780074015135),
        ('收到', 0.0657725962627024),
        ('沒用', 0.06424569614348834),
        ('劃算', 0.05729263019878829),
        ('好用', 0.057249479004923415),
        ('尸體', 0.05667847597855945),
        ('濕紙巾', 0.05449755096973013)]

        為了更加方便分析結(jié)果。我們將上面15個主題進(jìn)行可視化分析。簡單地繪制了如下橫向柱狀圖。

        plt.figure(figsize=(8,6))
        top15 = pd.DataFrame(top15)
        plt.barh(top15.iloc[:,0],top15.iloc[:,1])

        科凌輿情分析

        keling_03 = pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/評論輿情數(shù)據(jù)/科林蟲控.xlsx')
        keling_03.head()
        from text_analy import clean
        text_02=clean(keling_03)
        text_02

        詞頻分析

        Wordcloud(text_02)

        主題特征提取

        stopwords = pd.read_table('./baier/文本/stopwords.txt'
                                 ,quoting=3,names=['stopword'])
        from theam_extract_02 import extract
        extract(text_02,stopwords)

        科凌滅蟑產(chǎn)品好評居多,但是差評比拜耳稍微多點。

        安速輿情分析

        ansu_03 = pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/評論輿情數(shù)據(jù)/安速.xlsx')
        from text_analy import clean
        text_03=clean(ansu_03)
        Wordcloud(text_03)
        stopwords = pd.read_table('./baier/文本/stopwords.txt'
                                 ,quoting=3,names=['stopword'])
        from theam_extract_02 import extract
        extract(text_03,stopwords)

        安速滅蟑產(chǎn)品負(fù)面評論極少,滅蟑產(chǎn)品優(yōu)化方面可以考察安速。

        產(chǎn)品流量分析

        流量(Traffic)是企業(yè)獲得用戶的第一步,對于大多數(shù)需要“自力更生”企業(yè)而 言,流量幾乎是企業(yè)運(yùn)營的命脈之一,沒有流量就沒有一切。流量數(shù)據(jù)化運(yùn)營要解決的本質(zhì)問題是 如何通過數(shù)據(jù)獲得更多流量以及有效流量,然后完成最大化的營銷轉(zhuǎn)化目標(biāo)。

        這里列舉八大流量分析工具:

        這里介紹一些 市場上主流的流量分析工具,它們可以提供流量數(shù)據(jù)的跟蹤、采集、配 置、處理、分析和整合功能,其中有免費也有付費的。

        • Adobe Analytics
        • Webtrekk Suite
        • Webtrends
        • Google Analytics
        • IBM Coremetrics
        • 百度統(tǒng)計
        • Flurry
        • 友盟

        無流量不電商,沒有流量大電商就猶如線下在荒郊野外開了一個購物中心,雖然硬件都不錯,但是沒人光顧。流量大來源需要細(xì)分,細(xì)分包括多地理屬性的細(xì)分、渠道來源的細(xì)分、時間屬性的細(xì)分、推廣內(nèi)容的細(xì)分等,其中流量來源渠道是其中的重點,也算最復(fù)雜的一部分。

        細(xì)分完后的流量可以通過數(shù)據(jù)對比找到流量的主要來源,接下來要做的就是實時監(jiān)控主要渠道流量的對比和趨勢變化。對比可以和競爭對手對比,和類目流量對比等。

        本案例流量分析,主要細(xì)分各個品牌官方旗艦店流量來源渠道及交易指數(shù),通過橫向比較各個流量來源的交易指數(shù)大小,及縱向比較不同品牌商各流量渠道交易指數(shù),從而完成競品分析的一部分。

        拜耳流量分析

        baier_04 = pd.read_excel('./baier/電商案例數(shù)據(jù)/拜耳店鋪數(shù)據(jù)/拜耳官方旗艦店流量渠道.xlsx')
        del baier_04['交易指數(shù).1']
        baier_04.set_index('流量來源',inplace=True)
        baier_04.head()
        top10 = baier_04.sort_values('交易指數(shù)',ascending=False)[:10]
        top10.plot(kind='barh',figsize=(10,6))

        科凌流量分析

        kelin=pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/流量渠道數(shù)據(jù)/科凌蟲控旗艦店流量渠道.xlsx')
        kelin['交易占比']=kelin.交易指數(shù)/kelin.交易指數(shù).sum()*100
        top10=kelin.sort_values('交易指數(shù)',ascending=False).reset_index(drop=True).iloc[0:10,:]
        top10.index=top10['流量來源']
        top10.drop(['流量來源','交易占比'],axis=1,inplace=True)
        top10.plot(kind='barh');

        安速流量分析

        ansu=pd.read_excel('./baier/電商案例數(shù)據(jù)/競爭數(shù)據(jù)/流量渠道數(shù)據(jù)/安速家居旗艦店流量渠道.xlsx')

        ansu['交易占比']=ansu.交易指數(shù)/ansu.交易指數(shù).sum()*100
        top10=ansu.sort_values('交易指數(shù)',ascending=False).reset_index(drop=True).iloc[0:10,:]
        top10.index=top10['流量來源']
        top10.drop(['流量來源','交易占比'],axis=1,inplace=True)
        top10.plot(kind='barh');

        主要的競爭對手都不太注重淘內(nèi)流量服務(wù)購買,拜耳可以通過直通車等付費流量渠道來增加產(chǎn)品曝光。

        ·················END·················

        推薦閱讀

        1. 我在字節(jié)做了哪些事

        2. 寫給所有數(shù)據(jù)人。

        3. 從留存率業(yè)務(wù)案例談0-1的數(shù)據(jù)指標(biāo)體系

        4. 數(shù)據(jù)分析師的一周

        5. 超級菜鳥如何入門數(shù)據(jù)分析?


        歡迎長按掃碼關(guān)注「數(shù)據(jù)管道」


        瀏覽 81
        點贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            国产丰满精品伦一区二区三级视频 | 国产性猛交XXXX免费看久久 | 啊┅┅快┅┅用力啊岳视频 | 成人A片免费看 | 成人性爱在线 | 97精品久久久 | 免费黄色日本 | www.色.com | 国产熟妇 码视频户外直播 | 大黑鸡巴视频 |