用戶畫像標簽體系建設指南

01

什么是用戶畫像

用戶畫像是指根據(jù)用戶的屬性、用戶偏好、生活習慣、用戶行為等信息而抽象出來的標簽化用戶模型。

通俗說就是給用戶打標簽,而標簽是通過對用戶信息分析而來的高度精煉的特征標識。通過打標簽可以利用一些高度概括、容易理解的特征來描述用戶,可以讓人更容易理解用戶,并且可以方便計算機處理。

用戶畫像標簽體系建設指南

用戶畫像是對現(xiàn)實世界中用戶的建模,用戶畫像應該包含目標,方式,組織,標準,驗證這5個方面。

目標:指的是描述人,認識人,了解人,理解人。

方式:又分為非形式化手段,如使用文字、語言、圖像、視頻等方式描述人;形式化手段,即使用數(shù)據(jù)的方式來刻畫人物的畫像。

組織:指的是結(jié)構(gòu)化、非結(jié)構(gòu)化的組織形式。

標準:指的是使用常識、共識、知識體系的漸進過程來刻畫人物,認識了解用戶。

驗證:依據(jù)側(cè)重說明了用戶畫像應該來源事實、經(jīng)得起推理和檢驗。

用戶畫像標簽體系建設指南

在產(chǎn)品早期和發(fā)展期,會較多地借助用戶畫像,幫助產(chǎn)品人員理解用戶的需求,想象用戶使用的場景,產(chǎn)品設計從為所有人做產(chǎn)品變成為三四個人做產(chǎn)品,間接的降低復雜度。

用戶畫像使用的標簽是網(wǎng)絡標簽的一種深化應用方式,是某一種用戶特征的符號表示,是我們觀察、認識和描述用戶的一個角度,用戶標簽是基于用戶的特征數(shù)據(jù)、行為數(shù)據(jù)和消費數(shù)據(jù)進行統(tǒng)計計算得到的,包含了用戶的各個維度。

而所謂的用戶畫像就是可以用用戶標簽的集合來表示的,作為一種勾畫目標用戶、聯(lián)系用戶訴求與設計方向的有效工具。

用戶畫像,即用戶信息標簽化,就是企業(yè)通過收集與分析消費者社會屬性、生活習慣、消費行為等主要信息的數(shù)據(jù)之后,完美地抽象出一個用戶的商業(yè)全貌作是企業(yè)應用大數(shù)據(jù)技術(shù)的基本方式。

用戶畫像為企業(yè)提供了足夠的信息基礎,能夠幫助企業(yè)快速找到精準用戶群體以及用戶需求等更為廣泛的反饋信息。

02

用戶標簽的分類

1、按照標簽的變化頻率,可分為靜態(tài)標簽和動態(tài)標簽。

靜態(tài)標簽是指用戶與生俱來的屬性信息,或者是很少發(fā)生變化的信息,比如用戶的姓名、性別、出身日期,又例如用戶學歷、職業(yè)等,雖然有可能發(fā)生變動,但這個變動頻率是相對比較低或者很少發(fā)生變化的。

動態(tài)標簽是指非常經(jīng)常發(fā)生變動的、非常不穩(wěn)定的特征和行為,例如“一段時間內(nèi)經(jīng)常去的商場、購買的商品品類”這類的標簽的變動可能是按天,甚至是按小時計算的。

2、按照標簽的指代和評估指標的不同,可分為定性標簽和定量標簽。

定性標簽指不能直接量化而需通過其他途徑實現(xiàn)量化的標簽,其標簽的值是用文字來描述的,例如“用戶愛好的運動”為“跑步、游泳”,“用戶的在職狀態(tài)”為“未婚”等。定量標簽指可以準確數(shù)量定義、精確衡量并能設定量化指標的標簽,其標簽的值是常用數(shù)值或數(shù)值范圍來描述的。

定量標簽并不能直觀的說明用戶的某種特性,但是我們可以通過對大量用戶的數(shù)值進行統(tǒng)計比較后,得到某些信息。例如“用戶的年齡結(jié)構(gòu)”為“20-25歲”、“單次購買平均金額”為“300元”,“購買的總金額”為“20萬元”……,當我們獲得以上信息是否就可以將該用戶劃分為高價值客戶呢?

3、按照標簽的來源渠道和生成方式不同,可以分為基礎標簽、業(yè)務標簽、智能標簽。

基礎標簽主要是指對用戶基礎特征的描述,比如:姓名、性別、年齡、身高、體重等。

業(yè)務標簽是在基礎標簽之上依據(jù)相關業(yè)務的業(yè)務經(jīng)驗并結(jié)合統(tǒng)計方法生成的標簽,比如:用戶忠誠度、用戶購買力等標簽就是根據(jù)用戶的登錄次數(shù)、在線時間、單位時間活躍次數(shù)、購買次數(shù)、單次購買金額、總購買金額等指標計算出來的。業(yè)務標簽可以將經(jīng)營固化為知識,為更多的人使用。

智能標簽是利用人工智能技術(shù)基于機器學習算法,通過大量的數(shù)據(jù)計算而實現(xiàn)的自動化、推薦式的進行打標簽,比如今日頭條的推薦引擎就是通過智能標簽體系給用戶推送其感興趣的內(nèi)容的。

4、按照標簽體系分級分層的方式,可以分為一級標簽、二級標簽、三級標簽等,每一個層級的標簽相當于一個業(yè)務維度的切面。在標簽應用中按照不同的業(yè)務場景進行標簽組合,形成相應用戶畫像。

5、按照數(shù)據(jù)提取和處理的維度,可以將標簽分為事實標簽,模型標簽,預測標簽。這種用戶標簽的分類方式更多是面向技術(shù)人員使用,幫助他們設計合理的數(shù)據(jù)處理單元。

事實標簽。既定事實,直接從原始數(shù)據(jù)中提取,描述用戶的自然屬性、產(chǎn)品屬性、消費屬性等,事實標簽其本身不需要模型與算法,實現(xiàn)簡單,但規(guī)模需要不斷基于業(yè)務補充與豐富,比如:姓名、購買的產(chǎn)品品類、所在小區(qū)等。

模型標簽。對用戶屬性及行為等屬性的抽象和聚類,通過剖析用戶的基礎數(shù)據(jù)為用戶貼上相應的總結(jié)概括性標簽及指數(shù),標簽代表用戶的興趣、偏好、需求等,指數(shù)代表用戶的興趣程度、需求程度、購買概率等。

預測標簽。參考已有事實數(shù)據(jù),基于用戶的屬性、行為、位置和特征,通過機器學習、深度學習以及神經(jīng)網(wǎng)絡等算法進行用戶行為預測,針對這些行為預測配合營銷策略、規(guī)則進行打標簽,實現(xiàn)營銷適時、適機、適景推送給用戶

。例如試用了某產(chǎn)品A后預測可能還想買產(chǎn)品B并推送購買鏈接給該用戶。

03

用戶畫像標簽體系的建立

1、什么是標簽體系

用戶畫像是對現(xiàn)實用戶做的一個數(shù)學模型,在整個數(shù)學模型中,核心是怎么描述業(yè)務知識體系,而這個業(yè)務知識體系就是本體論,本體論很復雜,我們找到一個特別樸素的實現(xiàn),就是標簽。

標簽是某一種用戶特征的符號表示。是一種內(nèi)容組織方式,是一種關聯(lián)性很強的關鍵字,能方便的幫助我們找到合適的內(nèi)容及內(nèi)容分類。(注:簡單說,就是你把用戶分到多少個類別里面去,這些類是什么,彼此之間有什么關系,就構(gòu)成了標簽體系)

標簽解決的是描述(或命名)問題,但在實際應用中,還需要解決數(shù)據(jù)之間的關聯(lián),所以通常將標簽作為一個體系來設計,以解決數(shù)據(jù)之間的關聯(lián)問題。

一般來說,將能關聯(lián)到具體用戶數(shù)據(jù)的標簽,稱為葉子標簽。對葉子標簽進行分類匯總的標簽,稱為父標簽。父標簽和葉子標簽共同構(gòu)成標簽體系,但兩者是相對概念。例如:下表中,地市、型號在標簽體系中相對于省份、品牌,是葉子標簽。

用戶畫像標簽體系建設指南

用戶畫像標簽體系創(chuàng)建后一般要包含以下幾個方面的內(nèi)容

(1)標簽分類

用戶畫像標簽可以分為基礎屬性標簽和行為屬性標簽。

用戶畫像標簽體系建設指南

由于基于一個目標的畫像,其標簽是在動態(tài)擴展的,所以其標簽體系也沒有統(tǒng)一的模板,在大分類上,與自身的業(yè)務特征有很大的關聯(lián),在整體思路上可以從橫縱兩個維度展開思考:橫向是產(chǎn)品內(nèi)數(shù)據(jù)和產(chǎn)品外數(shù)據(jù),縱向是線上數(shù)據(jù)和線下數(shù)據(jù)。而正中間則是永恒不變的“人物基礎屬性”。

如果說其他的分類因企業(yè)特征而定,那么只有人物特征屬性(至于名字叫什么不重要,關鍵是內(nèi)涵)是各家企業(yè)不能缺失的板塊。

所謂人物基礎屬性指的是:用戶客觀的屬性而非用戶自我表達的屬性,也就是描述用戶真實人口屬性的標簽。

所謂非“自我表達”,舉例來說,某產(chǎn)品內(nèi)個人信息有性別一項,用戶填寫為“女”,而通過用戶上傳的身份證號,以及用戶照片,用戶購買的產(chǎn)品,甚至用戶打來的客服電話,都發(fā)現(xiàn)該用戶性別是“男性”。那么在人物基礎屬性中的性別,應該標識的是“男性”,但是用戶信息標簽部分,自我描述的性別則可能標注為女性。

(2)標簽級別(標簽的體系結(jié)構(gòu))

分級有兩個層面的含義,其一是:指標到最低層級的涵蓋的層級;其二是指:指標的運算層級。其一非常好理解,這里重點說運算層級。

標簽從運算層級角度可以分為三層:事實標簽、模型標簽、預測標簽。

事實標簽:是通過對于原始數(shù)據(jù)庫的數(shù)據(jù)進行統(tǒng)計分析而來的,比如用戶投訴次數(shù),是基于用戶一段時間內(nèi)實際投訴的行為做的統(tǒng)計。

模型標簽:模型標簽是以事實標簽為基礎,通過構(gòu)建事實標簽與業(yè)務問題之間的模型,進行模型分析得到。比如,結(jié)合用戶實際投訴次數(shù)、用戶購買品類、用戶支付的金額等,進行用戶投訴傾向類型的識別,方便客服進行分類處理。

預測標簽:則是在模型的基礎上做預測,比如針對投訴傾向類型結(jié)構(gòu)的變化,預測平臺輿情風險指數(shù)。

用戶畫像標簽體系建設指南

(3)標簽命名&賦值

我們用一張圖來說明一下命名和賦值的差別,只要在構(gòu)建用戶標簽的過程種,有意識的區(qū)別標簽命名和賦值足矣,不再贅述。

用戶畫像標簽體系建設指南

(4)標簽屬性

標簽屬性可以理解為針對標簽進行的再標注,這一環(huán)節(jié)的工作主要目的是幫助內(nèi)部理解標簽賦值的來源,進而理解指標的含義。如圖所示,可以總結(jié)為5種來源:

1、固有屬性:是指這些指標的賦值體現(xiàn)的是用戶生而有之或者事實存在的,不以外界條件或者自身認知的改變而改變的屬性。比如:性別、年齡、是否生育等。

2、推導屬性:由其他屬性推導而來的屬性,比如星座,我們可以通過用戶的生日推導,比如用戶的品類偏好,則可以通過日常購買來推導。

3、行為屬性:產(chǎn)品內(nèi)外實際發(fā)生的行為被記錄后形成的賦值,比如用戶的登陸時間,頁面停留時長等。

4、態(tài)度屬性:用戶自我表達的態(tài)度和意愿。比如說我們通過一份問卷向用戶詢問一些問題,并形成標簽,如詢問用戶:是否愿意結(jié)婚,是否喜歡某個品牌等。當然在大數(shù)據(jù)的需求背景下,利用問卷收集用戶標簽的方法效率顯得過低,更多的是利用產(chǎn)品中相關的模塊做了用戶態(tài)度信息收集。

5、測試屬性:測試屬性是指來自用戶的態(tài)度表達,但并不是用戶直接表達的內(nèi)容,而是通過分析用戶的表達,結(jié)構(gòu)化處理后,得出的測試結(jié)論。比如,用戶填答了一系列的態(tài)度問卷,推導出用戶的價值觀類型等。

值得注意的是,一種標簽的屬性可以是多重的,比如:個人星座這個標簽,既是固有屬性,也是推導屬性,它首先不以個人的意志為轉(zhuǎn)移,同時可以通過身份證號推導而來。

即便你成功了建立用戶畫像的標簽體系,也不意味著你就開啟了用戶畫像的成功之路,因為有很大的可能是這些標簽根本無法獲得,或者說無法賦值。

標簽無法賦值的原因有:數(shù)據(jù)無法采集(沒有有效的渠道和方法采集到準確的數(shù)據(jù),比如用戶身份證號)、數(shù)據(jù)庫不能打通、建模失?。A測指標無法獲得賦值)等等。

2、標簽體系結(jié)構(gòu)

標簽體系可以歸納出如下的層級結(jié)構(gòu)。

用戶畫像標簽體系建設指南

(1)原始輸入層

主要指用戶的歷史數(shù)據(jù)信息,如會員信息、消費信息、網(wǎng)絡行為信息。經(jīng)過數(shù)據(jù)的清洗,從而達到用戶標簽體系的事實層。

(2)事實層

事實層是用戶信息的準確描述層,其最重要的特點是,可以從用戶身上得到確定與肯定的驗證。如用戶的人口屬性、性別、年齡、籍貫、會員信息等。

(3)模型預測層

通過利用統(tǒng)計建模,數(shù)據(jù)挖掘、機器學習的思想,對事實層的數(shù)據(jù)進行分析利用,從而得到描述用戶更為深刻的信息。如通過建模分析,可以對用戶的性別偏好進行預測,從而能對沒有收集到性別數(shù)據(jù)的新用戶進行預測。還可以通過建模與數(shù)據(jù)挖掘,使用聚類、關聯(lián)思想,發(fā)現(xiàn)人群的聚集特征。

(4)營銷模型預測

利用模型預測層結(jié)果,對不同用戶群體,相同需求的客戶,通過打標簽,建立營銷模型,從而分析用戶的活躍度、忠誠度、流失度、影響力等可以用來進行營銷的數(shù)據(jù)。

(5)業(yè)務層

業(yè)務層可以是展現(xiàn)層。它是業(yè)務邏輯的直接體現(xiàn),如圖中所表示的,有車一族、有房一族等。

3、標簽體系結(jié)構(gòu)分類

一般來說,設計一個標簽體系有3種思路,分別是:

  • (1)結(jié)構(gòu)化標簽體系;
  • (2)半結(jié)構(gòu)化標簽體系;
  • (3)非結(jié)構(gòu)化標簽體系。

(1)結(jié)構(gòu)化標簽體系

簡單地說,就是標簽組織成比較規(guī)整的樹或森林,有明確的層級劃分和父子關系。結(jié)構(gòu)化標簽體系看起來整潔,又比較好解釋,在面向品牌廣告井噴時比較好用。性別、年齡這類人口屬性標簽,是最典型的結(jié)構(gòu)化體系。下圖就是Yahoo!受眾定向廣告平臺采用的結(jié)構(gòu)化標簽體系。

(2)半結(jié)構(gòu)化標簽體系

在用于效果廣告時,標簽設計的靈活性大大提高了。標簽體系是不是規(guī)整,就不那么重要了,只要有效果就行。在這種思路下,用戶標簽往往是在行業(yè)上呈現(xiàn)出一定的并列體系,而各行業(yè)內(nèi)的標簽設計則以“逮住老鼠就是好貓”為最高指導原則,切不可拘泥于形式。下圖是Bluekai聚合多家數(shù)據(jù)形成的半結(jié)構(gòu)化標簽體系。

(3)非結(jié)構(gòu)化標簽體系

非結(jié)構(gòu)化,就是各個標簽就事論事,各自反應各自的用戶興趣,彼此之間并無層級關系,也很難組織成規(guī)整的樹狀結(jié)構(gòu)。非結(jié)構(gòu)化標簽的典型例子,是搜索廣告里用的關鍵詞。還有Facebook用的用戶興趣詞。

4、用戶畫像標簽層級的建模方法

用戶畫像的核心是標簽的建立,用戶畫像標簽建立的各個階段使用的模型和算法如下圖所示。

用戶畫像標簽體系建設指南

原始數(shù)據(jù)層。對原始數(shù)據(jù),我們主要使用文本挖掘的算法進行分析如常見的TF-IDF、TopicModel主題模型、LDA 等算法,主要是對原始數(shù)據(jù)的預處理和清洗,對用戶數(shù)據(jù)的匹配和標識。

事實標簽層。通過文本挖掘的方法,我們從數(shù)據(jù)中盡可能多的提取事實數(shù)據(jù)信息,如人口屬性信息,用戶行為信息,消費信息等。其主要使用的算法是分類和聚類。分類主要用于預測新用戶,信息不全的用戶的信息,對用戶進行預測分類。

聚類主要用于分析挖掘出具有相同特征的群體信息,進行受眾細分,市場細分。對于文本的特征數(shù)據(jù),其主要使用相似度計算,如余弦夾角,歐式距離等。

模型標簽層。使用機器學習的方法,結(jié)合推薦算法。模型標簽層完成對用戶的標簽建模與用戶標識。其主要可以采用的算法有回歸,決策樹,支持向量機等。通過建模分析,我們可以進一步挖掘出用戶的群體特征和個性權(quán)重特征,從而完善用戶的價值衡量,服務滿意度衡量等。

預測層。也是標簽體系中的營銷模型預測層。這一層級利用預測算法,如機器學習中的監(jiān)督學習,計量經(jīng)濟學中的回歸預測,數(shù)學中的線性規(guī)劃等方法。實習對用戶的流失預測,忠實度預測,興趣程度預測等等,從而實現(xiàn)精準營銷,個性化和定制化服務。

不同的標簽層級會考慮使用對其適用的建模方法,對一些具體的問題,有專門的文章對其進行研究。

05

用戶畫像的應用場景

用戶畫像,即用戶信息標簽化,是企業(yè)通過收集與分析消費者基本屬性、社會屬性、生活習慣、行為特征等主要信息的數(shù)據(jù)之后,抽象出用戶的商業(yè)全貌。大數(shù)據(jù)的發(fā)展讓各行各業(yè)都日益聚焦于怎樣利用大數(shù)據(jù)了解用戶需求,實現(xiàn)精準營銷,進而深入挖掘潛在的商業(yè)價值。

不同的企業(yè)做用戶畫像有不同的戰(zhàn)略目的,廣告公司做用戶畫像是為精準廣告服務,電商做用戶畫像是為用戶購買更多商品,內(nèi)容平臺做用戶畫像是推薦用戶更感興趣的內(nèi)容提升流量再變現(xiàn)。企業(yè)對用戶的了解越多,就越容易為用戶提供所需產(chǎn)品和服務,從而提升用戶的粘性,提升企業(yè)盈利能力。

1、了解用戶

不得不承認大數(shù)據(jù)正在改變著各行各業(yè),以前了解用戶主要是通過用戶調(diào)研和訪談的形式,形式單一、數(shù)據(jù)收集不全、真假難辨。尤其是在產(chǎn)品用戶量擴大后,調(diào)研的效用降低,以不能滿足企業(yè)發(fā)展的要求。

利用大數(shù)據(jù)技術(shù),基于標簽體系構(gòu)建用戶的360°畫像,從用戶的各個維度進行分析,了解用戶是誰,他們有什么特征,他們的興趣偏好,而這些信息的研究是企業(yè)制定營銷策略、服務策略,提升用戶滿意度的重要依據(jù)。

2、精準營銷

要做到精準營銷,數(shù)據(jù)是最不可缺的存在。以數(shù)據(jù)為基礎,建立用戶畫像,利用標簽,讓系統(tǒng)進行智能分組,獲得不同類型的目標用戶群,針對每一個群體策劃并推送針對性的營銷。精準化營銷具有極強的針對性,是企業(yè)和用戶之間點對點的交互。它不但可以讓營銷變得更加高效,也能為企業(yè)節(jié)約成本。

3、產(chǎn)品創(chuàng)新

在用戶需求為導向的產(chǎn)品研發(fā)中,企業(yè)通過獲取到的大量目標用戶數(shù)據(jù),進行分析、處理、組合,初步搭建用戶畫像,做出用戶喜好、功能需求統(tǒng)計,從而設計制造更加符合用戶核心需求的新產(chǎn)品,為用戶提供更加良好的體驗和服務。

4、渠道優(yōu)化

當前的零售企業(yè)的銷售渠道有多種,比如:自營門店、經(jīng)銷商代理、電商平臺、電商APP等,每個渠道的用戶群體的消費能力、興趣偏好可能是不一樣的,通過用戶畫像可以讓合適的產(chǎn)品投放在合適的渠道投放,從而增加銷售量,這是目前零售行業(yè)慣用的方法。

5、個性推薦

眾所周知,今日頭條是個個性化的新聞推薦引擎,在今日頭條CEO張一鳴看來,算法是《今日頭條》這款興趣推薦搜索引擎應用的核心,這也是與傳統(tǒng)媒體最本質(zhì)的區(qū)別,今日頭條之所以能夠非常懂用戶,精準推薦出用戶所喜好的新聞,完全得益于算法,而正是精準推薦,使得今日頭條在短短兩年多的時間內(nèi)擁有了2.2億用戶,每天有超過2000萬用戶在今日頭條上閱讀自己感興趣的文章。

06用戶畫像的分類

從畫像方法來說,可以分為定性畫像、定性+定量畫像、定量畫像

從應用角度來看,可以分為行為畫像、健康畫像、企業(yè)信用畫像、個人信用畫像、靜態(tài)產(chǎn)品畫像、旋轉(zhuǎn)設備畫像、社會畫像和經(jīng)濟畫像等。

07
用戶畫像需要用到哪些數(shù)據(jù)

一般來說,根據(jù)具體的業(yè)務內(nèi)容,會有不同的數(shù)據(jù),不同的業(yè)務目標,也會使用不同的數(shù)據(jù)。在互聯(lián)網(wǎng)領域,用戶畫像數(shù)據(jù)可以包括以下內(nèi)容:

  • (1)人口屬性:包括性別、年齡等人的基本信息
  • (2)興趣特征:瀏覽內(nèi)容、收藏內(nèi)容、閱讀咨詢、購買物品偏好等
  • (3)消費特征:與消費相關的特征
  • (4)位置特征:用戶所處城市、所處居住區(qū)域、用戶移動軌跡等
  • (5)設備屬性:使用的終端特征等
  • (6)行為數(shù)據(jù):訪問時間、瀏覽路徑等用戶在網(wǎng)站的行為日志數(shù)據(jù)
  • (7)社交數(shù)據(jù):用戶社交相關數(shù)據(jù)

用戶畫像數(shù)據(jù)來源廣泛,這些數(shù)據(jù)是全方位了解用戶的基礎,這里以Qunar的畫像為例,其畫像數(shù)據(jù)主要維度如下所示,包括用戶RFM信息、航線信息等。

Qunar的畫像數(shù)據(jù)倉庫構(gòu)建都是基于Qunar基礎數(shù)據(jù)倉庫構(gòu)建,然后按照維度進行劃分。

08
用戶畫像的作用

在互聯(lián)網(wǎng)、電商領域用戶畫像常用來作為精準營銷、推薦系統(tǒng)的基礎性工作,其作用總體包括:

(1)精準營銷:根據(jù)歷史用戶特征,分析產(chǎn)品的潛在用戶和用戶的潛在需求,針對特定群體,利用短信、郵件等方式進行營銷。

(2)用戶統(tǒng)計:根據(jù)用戶的屬性、行為特征對用戶進行分類后,統(tǒng)計不同特征下的用戶數(shù)量、分布;分析不同用戶畫像群體的分布特征。

(3)數(shù)據(jù)挖掘:以用戶畫像為基礎構(gòu)建推薦系統(tǒng)、搜索引擎、廣告投放系統(tǒng),提升服務精準度。

(4)服務產(chǎn)品:對產(chǎn)品進行用戶畫像,對產(chǎn)品進行受眾分析,更透徹地理解用戶使用產(chǎn)品的心理動機和行為習慣,完善產(chǎn)品運營,提升服務質(zhì)量。

(5)行業(yè)報告&用戶研究:通過用戶畫像分析可以了解行業(yè)動態(tài),比如人群消費習慣、消費偏好分析、不同地域品類消費差異分析

根據(jù)用戶畫像的作用可以看出,用戶畫像的使用場景較多,用戶畫像可以用來挖掘用戶興趣、偏好、人口統(tǒng)計學特征,主要目的是提升營銷精準度、推薦匹配度,終極目的是提升產(chǎn)品服務,起到提升企業(yè)利潤。用戶畫像適合于各個產(chǎn)品周期:從新用戶的引流到潛在用戶的挖掘、從老用戶的培養(yǎng)到流失用戶的回流等。

總結(jié)來說,用戶畫像必須從實際業(yè)務場景出發(fā),解決實際的業(yè)務問題,之所以進行用戶畫像,要么是獲取新用戶,要么是提升用戶體驗、或者挽回流失用戶等具有明確的業(yè)務目標。

另外關于用戶畫像數(shù)據(jù)維度的問題,并不是說數(shù)據(jù)維度越豐富越好,總之,畫像維度的設計同樣需要緊跟業(yè)務實際情況進行開展。

09

用戶畫像的體系架構(gòu)

按照應用系統(tǒng)分層設計的原則,基于標簽體系的用戶畫像的體系結(jié)構(gòu)可以分為:數(shù)據(jù)源層、數(shù)據(jù)采集層、數(shù)據(jù)建模層、數(shù)據(jù)應用層,行業(yè)應用層等。

數(shù)據(jù)源層:用戶標簽體系建設的需要從不同的來源匯集數(shù)據(jù),例如,企業(yè)的核心系統(tǒng)(不同的行業(yè)其核心系統(tǒng)不同,對制造業(yè)來說核心系統(tǒng)有ERP、MES、PLM等),營銷系統(tǒng)(CRM),互聯(lián)網(wǎng)數(shù)據(jù)(電商平臺以及微信、微博、論壇等社交平臺獲取的數(shù)據(jù)),以及從第三方專業(yè)機構(gòu)獲取的數(shù)據(jù)(各地的數(shù)據(jù)交易中心購買的數(shù)據(jù))。

數(shù)據(jù)采集層:與傳統(tǒng)數(shù)據(jù)項目的數(shù)據(jù)采集不同,基于標簽體系的用戶畫像的數(shù)據(jù)來源廣泛、數(shù)據(jù)量巨大,數(shù)據(jù)類型豐富(包括:結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)),有線上的用戶行為數(shù)據(jù),也有應用系統(tǒng)日志數(shù)據(jù),有互聯(lián)網(wǎng)爬蟲數(shù)據(jù),也有API接口的第三方數(shù)據(jù)包。

用戶畫像數(shù)據(jù)采集需要通過網(wǎng)絡爬蟲或網(wǎng)站公開API等方式從網(wǎng)站上獲取數(shù)據(jù)信息,并且可以將非結(jié)構(gòu)化數(shù)據(jù)從網(wǎng)頁中抽取出來,將其存儲為統(tǒng)一的本地數(shù)據(jù)文件,并支持以結(jié)構(gòu)化的方式存儲。同時支持圖片、音頻、視頻等文件或附件的采集,附件與正文可以自動關聯(lián)。

數(shù)據(jù)建模:基于標簽體系的用戶畫像建模主要是針對用戶畫像的建模和產(chǎn)品的建模。產(chǎn)品畫像建模包括了數(shù)據(jù)清洗、文本建模、類別識別、品牌識別、屬性識別、產(chǎn)品畫像等;用戶畫像建模包括了數(shù)據(jù)清洗、用戶全渠道ID識別、信息整合、分析建模和用戶畫像。通過統(tǒng)一產(chǎn)品類目和屬性體系和統(tǒng)一的用戶畫像標簽體系的建設,為用戶標簽的應用提供支撐。

數(shù)據(jù)應用:即基于標簽體系的應用,包括分析類應用(如用戶分析、產(chǎn)品分析)、服務類應用(如服務及產(chǎn)品創(chuàng)新)、營銷類應用(精準營銷)、數(shù)據(jù)接口API等。

行業(yè)應用:基于標簽體系的用戶畫像在各行業(yè)的所應用和探索,將為行業(yè)的發(fā)展和創(chuàng)新帶來更多可能。

10
用戶畫像的建設步驟

1、數(shù)據(jù)采集

用戶畫像是根據(jù)用戶的人口信息、社交關系、偏好習慣和消費行為等信息而抽象出來的標簽化畫像,用戶畫像數(shù)據(jù)來源多樣,采集方式也不同:線下采集、線上采集、第三方接口等。

2、數(shù)據(jù)清洗

要實現(xiàn)精準的用戶畫像就需要對這些噪聲數(shù)據(jù)、臟數(shù)據(jù)進行處理,這個過程我們叫做數(shù)據(jù)清洗。

3、數(shù)據(jù)標準化

數(shù)據(jù)標準化的方法有很多種,常用的有“最小—最大標準化”、“Z-score標準化”和“按小數(shù)定標標準化”等。經(jīng)過上述標準化處理,原始數(shù)據(jù)均轉(zhuǎn)換為無量綱化指標測評值,即各指標值都處于同一個數(shù)量級別上,可以進行綜合測評分析。

4、數(shù)據(jù)建模

數(shù)據(jù)建模就是根據(jù)用戶行為,構(gòu)建模型產(chǎn)出標簽、權(quán)重。一個事件模型包括:時間、地點、人物三個要素。每一次用戶行為本質(zhì)上是一次隨機事件,可以詳細描述為:什么用戶,在什么時間,什么地點,做了什么事。

用戶動態(tài)建模公式:用戶標識 +時間 + 行為類型 + 接觸點(網(wǎng)址+內(nèi)容),表示某用戶在什么時間、地點、做 了什么事,所以會打上某標簽。

用戶標簽的權(quán)重可能隨時間的增加而衰減,因此定義時間為衰減因子r,行為類型,同時該標簽對該用戶的重要程度也決定了用戶標簽的權(quán)重,進一步轉(zhuǎn)換為公式:用戶標簽權(quán)重 = 行為類型權(quán)重 × 時間衰減 × 用戶行為次數(shù) × TF-IDF計算標簽權(quán)重

行為類型權(quán)重:用戶瀏覽、搜索、收藏、下單、購買等不同行為對用戶而言有著不同的重要性(偏序關系),該權(quán)重值一般由運營人員或業(yè)務來決定;

時間衰減:用戶某些行為受時間影響不斷減弱,行為時間距現(xiàn)在越遠,該行為對用戶當前來說的意義越小,采用牛頓冷卻定律;

行為次數(shù):用戶標簽權(quán)重按天統(tǒng)計,用戶某天與該標簽產(chǎn)生的行為次數(shù)越多,該標簽對用戶的影響越大。

公式:t=初始溫度×exp(-冷卻系數(shù)×間隔的時間),實際應用中,初始溫度為1就行,間隔的時間為今天與產(chǎn)生行為那天的天數(shù),或者小時數(shù)都行,根據(jù)業(yè)務進行調(diào)整,冷卻系數(shù)的業(yè)務來決定,或者通過數(shù)據(jù)分析而來。

TF-IDF計算標簽權(quán)重:tf為某標簽在該用戶出現(xiàn)頻率,idf為某標簽在全部標簽中的稀缺程度。

5、標簽挖掘

標簽挖掘,即對用戶標簽體系中的用戶數(shù)據(jù)進行挖掘,形成用戶標簽,這個過程也叫標簽生產(chǎn)。

標簽的生產(chǎn)方式主要有以下兩種:

①基于規(guī)則定義的標簽生產(chǎn)方式,即根據(jù)固定的規(guī)則,通過數(shù)據(jù)查詢的結(jié)果生產(chǎn)標簽,重點在于如何制定規(guī)則。

②基于主題模型的標簽生產(chǎn)方式,主題模型最開始運用于內(nèi)容領域,目的是找到用戶的偏好,在用戶標簽中我們可以參照分類算法將用戶進行分類、聚類,使用關鍵詞的算法挖掘用戶的偏好,從而生產(chǎn)標簽。

6、數(shù)據(jù)可視化

數(shù)據(jù)可視化是基于標簽體系的用戶畫像的重要應用, 通過詳實、準確對用戶的各類標簽數(shù)據(jù)進行匯集和分析,并以圖片、表格等可視化手段幫助企業(yè)全面了解用戶的基礎信息,用戶關系情況,用戶經(jīng)濟情況、用戶偏好情況、健康情況、飲食情況等信息。

同時,利用數(shù)據(jù)標簽體系的用戶畫像可視化技術(shù),通過對用戶關系數(shù)據(jù)、用戶內(nèi)容數(shù)據(jù)、用戶行為等數(shù)據(jù)進行可視化展示,能夠幫助企業(yè)管理人員、業(yè)務人員全面了解用戶,了解用戶是誰,他們有什么特征,他們的興趣偏好等,從而為智能推薦、精準營銷、產(chǎn)品和服務創(chuàng)新、渠道優(yōu)化等業(yè)務提供支撐。

本文經(jīng)授權(quán)發(fā)布,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.allfloridahomeinspectors.com/cgo/user/69915.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2022-05-30 17:07
下一篇 2022-05-30 17:35

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復

登錄后才能評論