本文主要是以香水產品為例,介紹首席增長官常用的:數(shù)據(jù)采集、數(shù)據(jù)分析、數(shù)據(jù)挖掘的過程和常用的算法模型。
一、香水數(shù)據(jù)處理
數(shù)據(jù)來源于某電商網(wǎng)站的香水產品的數(shù)據(jù),包括了香水產品的商品名稱、產品毛重、商品場地、包裝、香調、凈含量、分類、適用性別、適用場所、價格,以及評價數(shù)這幾個維度,總共1009條數(shù)據(jù):
從上圖可以看出,這部分數(shù)據(jù)存在一定數(shù)量的缺失值,還存在例如“性別適合場所”、“評價”兩個不規(guī)范的數(shù)據(jù)維度,需要對這部分數(shù)據(jù)做規(guī)范化處理。
針對“評價”,這個維度的數(shù)據(jù)包含中文和數(shù)字的混合,末尾還有一個“+”,“+”很容易通過excel來替換掉,但是將“萬”轉化成準確的數(shù)值結果采用excel比較難做到,因此采用python來處理來處理;
“適用場所”字段包含多個場所,要先算出所有記錄的場所合集,這部分也用python來實現(xiàn)。最終分解成“旅行”、“其他”、“約會”、“情趣”等8個字段,其類型是0、1類型,若該香水產品有對應的適用場所,則設置為1,否則設置為0;
接下來還需要對香水的價格和評價數(shù)據(jù)做離散化處理,將價格等間距分為6個等級,分別是低、較低、中等、較高、高、非常高;同樣的,也需要要評價數(shù)做同樣處理,分為7個等級;
最后還需要將中國大陸、廣東、浙江義烏等國內地址統(tǒng)一替換成中國,并且增加“適用場景數(shù)量”字段,統(tǒng)計不同香水適合的場所,最終如下圖:
二、香水數(shù)據(jù)分析
對香水產品的價格做描述分析,約92.43的產品價格在900元一下,最大值為2212元,在樣本中可以查詢到對應產品為香奈兒/機遇/黃色邂逅女士香水50/100ml/持久淡香精EDP EDP100ml。
產品的評論說在一定程度上代表了產品的銷量,因此此處用產品的評論量來代替產品的銷量。對所有產品的銷量做統(tǒng)計分析,發(fā)現(xiàn)香水產品的銷量兩級分化明顯,有58.47%的產品銷量不足1000,有約10%的產品銷量大于10000,其中最大值為100000以上,為菲拉格慕香水:
在過濾掉存在的缺失值后,可以得到商品場地的分布圖,在下圖中法國占據(jù)了絕對比例,約為49%,德國和西班牙的香水種類比較少,分別為3.89%和3.97%。
由于商品的評價數(shù)跨越范圍比較大,且商品銷量的兩級分化嚴重,如果直接用評價數(shù)來繪制箱型圖做分析,會產品大量的離群點。因此對商品的評價數(shù)以2為底做對數(shù)處理,再按照各個字段對“評價對數(shù)值”做分析。
下圖是用箱型圖描述各個產地香水銷量分布,與其他國家的香水產品相比,西班牙和英國的香水產品銷量明顯偏低,其他國家并沒太大的差別。
下圖是各包裝香水銷量箱型圖,可以看出組合香水的整體銷量要高于其他包裝的香水,因為組合裝的香水往往比較齊全,并且比較優(yōu)惠,對價格敏感的消費者有較大的吸引力。而限量版香水的銷量明顯要低于其他包裝的香水,主要原因是由于限量版香水的發(fā)行量少而且價格較高。其他品包裝的香水銷量并沒有明顯的差別。
將不同香調的香水銷量做分析,可以看出花果香調和混合香調的香水產品整體的銷量要略高于其他香調的香水,而東方香調和其他香調的香水整理銷量偏低。東方女性使用香水的習慣教西方女性保守,味道偏好輕盈簡單的清淡味道,因此花果香調的香水賣得最好。木質香調等較濃郁的香水遮蓋體味功能強,比較適合西方人。
在凈含量方面,包裝較小的產品銷量比較高,包括1-15ml、16-30ml、31-100ml。包裝小的產品便攜性強,而且我國大部分的香水使用者使用需求并不如歐美國家的消費者高,因此偏好小包裝的香水。而101-200ml以及200ml以上規(guī)格的香水,不方便攜帶,而且如果不及時使用完畢,會有變質等問題。
按照分類分析,淡香水EDT和濃香水EDP的銷量好,主要是淡香水味道清淡,符合東方女性的消費特征;濃香水主要是針對年紀較大的商務女性和中年女性,也有一定的市場。
接下來對影響香水銷量的因素做決策樹分析,對香水的適用場所做關聯(lián)分析,對香水總體做聚類分析,具體如下面的流程圖所示:
三、影響香水銷量的因素分析
這部分的主要目的是分析各個因素對銷量的影響程度。需要對這部分的數(shù)據(jù)做過濾篩選,剔除出缺失值,并且過濾掉包括商品名稱、適用場所、價格、評價等維度,針對商品產地、包裝、香調、凈含量、分類、性別、適用場景數(shù)量、價格等級、銷量等級這幾個維度做分析。
這部分采用C5.0決策樹算法分析,挖掘影響香水產品銷量等級的因素??梢缘玫较聢D。在影響產品銷量的因素中,適用場景是最重要的,其次是商品場地、香調和分類,包裝、凈含量、價格等級、性別影響比較小。
通過決策樹分析,可以得到一些結論(這部分就省略了,留在給小密圈的伙伴分享了,哈哈大笑)。
四、香水適用場所關聯(lián)分析
這部分是需要對香水適用場所做關聯(lián)分析,需要對數(shù)據(jù)做預處理,這里我們根據(jù)之前的處理生成了不同的8個字段,將含有該類型適用場景的值設置為1,否則設置為0,同時需要對不需要參與分析的字段做過濾處理,最終得到:
進行關聯(lián)分析的時候,采用Apriori算法,將最低條件支持度設置為75%,最小規(guī)則置信度設置為95%,最終得到12條關聯(lián)規(guī)則,如下圖:
五、香水聚類分析:
對香水產品做聚類分析,將商品產地、包裝、香調、凈含量、分類、性別、使用場景數(shù)量、價格等級、銷量等級作為聚類分析對象,如下圖:
經(jīng)過初步的測試,這里將聚類的模型的聚類數(shù)設置為5,因為如果設置為4類,那么最終得到的聚類質量較差,而且其中預測變量重要性最高的是香調,但得到的類別區(qū)分度不高,差異不明顯。
當聚類數(shù)設置為6或者更高時,雖然聚類質量有所增加,但并不明顯,區(qū)分過細,容易出現(xiàn)過擬合的情況,結果也沒有意義。
如上圖所示,預測變量最重要性依次是分類、香調、凈含量、產地、性別、包裝和適用場景數(shù)量。其中,分類是聚類的主要依據(jù),而適用場景數(shù)量則是對結果影響最小的因素。
本次聚類的之類相對比較良好,平均silhouette為0.2。經(jīng)過對數(shù)據(jù)的分析可知,在進行聚類時,數(shù)據(jù)分布不均,例如,同一種分類的香水,可能含有不同的凈含量、也可能來自不同的地方。因此本次聚類分析中涉及的香水大致可以分為5類。
六、初步的營銷建議(此處省略很多字)
綜合上述分析,對于希望提升銷量的商家來說,在銷售的香水產品的選擇上,需要選擇消費者歡迎,總體銷量好的產品:
1、制定價格方面,商家可以將產品價格定位在大眾消費品的水平上,并保持正常利潤空間,更多考慮運用價格策略擴大產品銷路,吸引更多消費者。具體來說,淡香水EDT的銷量與價格呈現(xiàn)負相關,而濃香水EDP的銷量與價格呈正相關,說明濃香水的買家比較重視品質,對價格不敏感,而淡香水EDT的買家對價格敏感,因此對于不同類型的產品要有具體的價格策略……;
2、產品分類方面,香水的產地、香調、凈含量都會對銷售產生很大的影響,因此選擇正確的類型的香水是提升銷量非常重要的方面,法國、意大利是世界上最重要的香水奢侈品產地,有著巨大的影響力……
3、銷售策略方面。由于消費者在購買香水的時候體現(xiàn)了明顯的價格敏感性,價格低的香水產品銷量更好。另外,目前我國香水消費中很大一部分你還是作為禮品,因此,可以制定一個短期促銷策略,降低價格……
文:全棧全網(wǎng)營銷
相關文章推薦:
《3年時間,從0增長到200億,他的套路都在這里!》
《新晉網(wǎng)藍luckin coffee的裂變營銷》
《重新定義新用戶,看CGO如何破解新用戶增長難題?》
更多精彩,關注:增長黑客(GrowthHK.cn)
增長黑客(Growth Hacker)是依靠技術和數(shù)據(jù)來達成各種營銷目標的新型團隊角色。從單線思維者時常忽略的角度和高度,梳理整合產品發(fā)展的因素,實現(xiàn)低成本甚至零成本帶來的有效增長…
本文經(jīng)授權發(fā)布,不代表增長黑客立場,如若轉載,請注明出處:http://m.allfloridahomeinspectors.com/cgo/9861.html