本文根據(jù)快看漫畫屈世超老師在DataFunTalk數(shù)據(jù)主題技術沙龍活動“大數(shù)據(jù)從底層處理到數(shù)據(jù)驅動業(yè)務”中分享的《大數(shù)據(jù)平臺的模型思維與用戶增長實踐》編輯整理而成,在未改變原意的基礎上稍做修改。
今天分享的內(nèi)容分為三個部分,首先介紹下快看漫畫發(fā)展狀況,第二個就是我們在大數(shù)據(jù)平臺和大數(shù)據(jù)業(yè)務發(fā)展的過程中總結的模型思維以及平臺搭建的一些經(jīng)驗,最后是基于我們的數(shù)據(jù)平臺用數(shù)據(jù)驅動去增長用戶、業(yè)務的一些實踐經(jīng)驗。
上圖是快看漫畫APP的一些界面,基本是精品漫畫加二次元社區(qū)、社交的一個平臺,同時我們也生產(chǎn)漫畫內(nèi)容??炜闯闪⒂?4年底,經(jīng)過幾年的發(fā)展,已經(jīng)有了超過1.3億的用戶量,月活動量近4000萬、日活動量1000萬,在中國漫畫APP中排名第一。日數(shù)據(jù)量接近百億條,對數(shù)據(jù)平臺要求比較高。
如果從事過市場推銷相關業(yè)務,都明白移動APP發(fā)展前幾年都趕上了人口紅利的曝光,推廣起來比較容易,用戶量也是實現(xiàn)了比較快速的發(fā)展。但是到17年開始,移動網(wǎng)民的數(shù)量增長量很小,在推廣過程中,搶的都是存量用戶。
隨著APP開發(fā)推廣競爭力越來越大,市場的投放、購買越來越難,成本越來越高。就目前所有APP開發(fā)者普遍存在的趨勢就是用最小成本購買優(yōu)質用戶,留存一定要做高,同時通過一定的用戶運營實現(xiàn)活躍用戶的價值輸出,即超級用戶思維。
這一切都離不開數(shù)據(jù)支撐業(yè)務增長的需求和發(fā)展。
第二部分講一下模型思維和快看數(shù)據(jù)平臺搭建,模型思維的概念很抽象,但是是無處不在的。
比如我們見過的新事物會潛意識進行抽象,然后特征提取、存儲到我們的意識中,再發(fā)現(xiàn)類似的事物就會很自然聯(lián)想到這個模型,通過模型來猜測這個相近的事物有什么特點、如何去使用它、如何去產(chǎn)生聯(lián)系。
舉個例子如我們第一次見到平衡車,我們就會想到電動車、摩托車,要駕馭它需要很好的平衡性。我們認識新事物會自動聯(lián)想我們記憶中就有的模型,這就是模型思維。
在技術開發(fā)過程中模型思維也是無處不在的,比如我們在有了需求以后,需要從需求抽象出一個模型,映射的模型從我們的經(jīng)驗記憶中聯(lián)想,那些架構模型是能夠解決當前的需求,再從這個大的模型不斷去拆分、細化、劃分模型,每個模塊又是更細粒度的模型,再拆分直到我們熟悉的技術。
模型思維就是我們要從需求出發(fā),抽象出需求模型,然后映射出架構模型,然后拆分更細粒度模型,直到我們熟悉的技術。這其中就需要我們對多項技術的積累,多項工具、框架組合使用的經(jīng)驗,才能透徹理解模型思維。
上圖是我們大數(shù)據(jù)平臺應用的總結,首先是一個需求模型的匯總,然后是架構模型的一個匯總。
在架構模型中會產(chǎn)生更加細粒度的模型,細粒度的模型繼續(xù)拆分直到不能拆分的原子模型。
先從需求出發(fā)(架構設計的依據(jù)和來源),一般大數(shù)據(jù)的應用都離不開這三塊,第一個就是數(shù)據(jù)存儲和數(shù)據(jù)探索模型,第二部分是數(shù)據(jù)分析與預測模型,第三部分是商業(yè)智能與決策模型。
比如數(shù)據(jù)存儲我們需要對數(shù)據(jù)進行備份(冷備份、熱備份),對數(shù)據(jù)進行查詢和規(guī)律分析;數(shù)據(jù)分析和預測模型包含實時分析、批量分析,數(shù)據(jù)探查包含特征提取或個性化推薦;商業(yè)智能與決策模型在金融領域比較多,比如風控領域,對貸款人信用學習決策是否能貸款、收回貸款等。
需求相關的模型基本都離不開這三部分,由需求模型映射到相應的架構模型需要經(jīng)驗性,依賴于需求過程中提取如何去使用這些數(shù)據(jù)、展示形式、數(shù)據(jù)源接入的方式或者根據(jù)數(shù)據(jù)源的格式或一些特點如何進行數(shù)據(jù)的清洗和處理;數(shù)據(jù)分析中用什么樣方式進行洞察和分析,比如使用什么樣的算法去學習個性化推薦或找到一些規(guī)律。
在做大數(shù)據(jù)時總會接觸到一些模型,如數(shù)據(jù)接入模型,做數(shù)據(jù)采集(web數(shù)據(jù)、設備數(shù)據(jù)、業(yè)務數(shù)據(jù),可能有不同形式的接入方式),接入之后做數(shù)據(jù)存儲,結構化與非結構化、分布式存儲,云存儲或存儲到傳統(tǒng)的存儲模型中。
然后是數(shù)據(jù)處理模型,實時、離線,還有清洗模型,不同格式、形式的數(shù)據(jù)用何種方式、工具進行處理。
最后是數(shù)據(jù)使用模型,做完處理后如何進行分析、可視化,如何查詢,還有用戶觸達,做一些智能決策,以及自動觸發(fā)模型。
所有的架構都是由需求衍生而來,由需求產(chǎn)生模型,這些模型是由小的原子模型通過一定的組合、封裝,逐層構建更高層次的模型,最后將技術架構實現(xiàn)。
學習技術和架構是一樣的關系,有了這種思維后,在學習技術時更有目標,在整個架構它的定位和功能是什么,與同功能的優(yōu)劣對比更清楚。這種思維能夠快速將需求抽象成模型,業(yè)務方和開發(fā)方就確立共同目標,有助于開發(fā)制定關鍵架構決策,什么樣的業(yè)務大致能知道用什么結構去解決。
架構落地是由底層到高層逐層實現(xiàn)的,從原子模型落地,通過層層組裝實現(xiàn)整體架構的落地。還有一個優(yōu)點是有了整體架構后,能夠平滑的實現(xiàn)架構升級、修復、替換,因為每次改動是基于原子模型或幾個原子模型的組合。
前面介紹了模型思維,接下介紹快看如何發(fā)展數(shù)據(jù)平臺。
創(chuàng)業(yè)公司最開始關注的并不是用戶的行為,更多的時項目是否適用于我想象的用戶群體,這個群體在APP使用時長、活躍度、留存量。
我們開始使用的是低成本接入和和使用第三方基礎數(shù)據(jù)統(tǒng)計平臺,就能滿足需求,前期成本低,通過多個第三方能夠保證數(shù)據(jù)準確性便于做數(shù)據(jù)相關性驗證以及很多宏觀指標確定APP的業(yè)界定位。
快看發(fā)展第一年主要依據(jù)第三方數(shù)據(jù)平臺做相關分析以及自己的統(tǒng)計任務基本能夠滿足需求。在成長期需求呈爆發(fā)式增長,業(yè)務線不斷分散。隨著業(yè)務量發(fā)展和數(shù)據(jù)增多,需求不斷細化不會只看宏觀基礎指標,指標會細化到每一個業(yè)務,每個業(yè)務也會查看功能性指標。
開始嘗試做原子模型的替換,調(diào)研發(fā)現(xiàn)一個“二八定律”,就是如果要對用戶行為進行分析,接入的第三方數(shù)據(jù)分析平臺,利用20%的成本接入和維護能夠滿足各個業(yè)務線80%的需求。隨著業(yè)務量以及業(yè)務需求增加,許多數(shù)據(jù)分析是定制化的,第三方數(shù)據(jù)平臺就無法解決,就自建大數(shù)據(jù)平臺。
搭建原則是利用最低成本解決需求,優(yōu)先使用第三方平臺能解決的方案,不能解決利用大數(shù)據(jù)平臺做定制性的數(shù)據(jù)洞察,比如個性化推薦,做精準的作品分發(fā)。后續(xù)數(shù)據(jù)洞察的需求越來越多,業(yè)務指標越來越定制化,數(shù)據(jù)統(tǒng)計的粒度會越來越細。
上圖是平臺架構,分為四層。雖然有很多模塊還不是很細,但是隨著業(yè)務的發(fā)展,也是適合當前人力成本取舍的一個方案。這是快看創(chuàng)業(yè)階段的經(jīng)驗,如果有在創(chuàng)業(yè)公司工作的,有需要可以參考下。
接下來講一下我們利用數(shù)據(jù)驅動來實現(xiàn)用戶增長的經(jīng)驗,業(yè)界關于類似的探索還比較少,因此做一個總結分享一下。
快看數(shù)據(jù)部門對數(shù)據(jù)的定位是基于我們的平臺,對公司所有業(yè)務線提供數(shù)據(jù)需求,做好數(shù)據(jù)驅動,每個業(yè)務線做好業(yè)務增長。
這個業(yè)務很寬泛也很難,以為很多創(chuàng)業(yè)公司是從零開始發(fā)展起來,很多時候并不太注重數(shù)據(jù),數(shù)據(jù)平臺是由需求驅動發(fā)展的,但是我們想數(shù)據(jù)平臺去驅動業(yè)務線的發(fā)展,我們花費一年半時間做數(shù)據(jù)內(nèi)部思維推廣,由于成員年輕化,很多都不是很理解數(shù)據(jù),還不斷強化他們?nèi)绾问褂脭?shù)據(jù)、好處是什么。然后就是聚焦在運和業(yè)務增長方面。
先講一下數(shù)據(jù)思維內(nèi)部推廣,培訓介紹現(xiàn)有數(shù)據(jù)平臺、第三方數(shù)據(jù)分析平臺、BI后臺以及數(shù)據(jù)字典維度等,介紹有哪些數(shù)據(jù);然后介紹各個業(yè)務能夠使用那些數(shù)據(jù);最后就是如何將數(shù)據(jù)用起來,讓CEO、CTO實施讓員工更多的去使用數(shù)據(jù),強化管理層對數(shù)據(jù)的重視,要求一些數(shù)據(jù)指標的統(tǒng)計,從上到下分配到每一個團隊,產(chǎn)品經(jīng)理和用戶增長團隊輔助確立業(yè)務核心指標,著重如何確立綜合指標來評價你當前的工作和業(yè)務發(fā)展;數(shù)據(jù)研發(fā)團隊提供數(shù)據(jù)支持,將數(shù)據(jù)抽象化、平臺化、自動化。
但是也要進行一定的取舍,因為會有一些不切實際的需求,或者提出的需求分析沒有用等等。
用戶增長團隊后期工作是介于每一個開發(fā)線與業(yè)務之間的工作,如制定指標,針對指標做一些細化,細化為可落地,對當前業(yè)務有增長的可執(zhí)行指標。引導他們?nèi)ナ褂貌⒆鲆恍﹥?yōu)化,如付費運營,每一次活動完成后分析是否達到效果,以及下次運營需要哪些工作。
會監(jiān)控每一個頁面位置作品曝光率以及用戶在每一個分發(fā)頁面的參與度,比如社區(qū)運營、游戲運營也有類似工作。產(chǎn)品經(jīng)理和用戶增長團隊聯(lián)系密切,共同去做好數(shù)據(jù)分析。
接下來講一下我們在這方面的例子,快看作為漫畫平臺核心功能就是滿足用戶對于內(nèi)容的閱讀需求,核心點就是把控作品內(nèi)容變化趨勢,同時根據(jù)用戶的需求、喜好開發(fā)一些新內(nèi)容,這些是內(nèi)容模塊的指標。讓內(nèi)容開發(fā)者基于對用戶的理解,利用數(shù)據(jù)去支撐他們的猜測,探索內(nèi)容開發(fā)方向。
具體方式就是會分析每一個作品的周留存、日留存和月留存,以及用戶閱讀次數(shù),看一下用戶對作品持續(xù)關注度。然后通過用戶搜索關鍵詞把控新作品開發(fā)方向,這樣能夠把控作品質量,同時每個用戶活躍度的變化能夠反映作品對用戶的吸引力。
上圖是用戶運營的思維,拉新越來越難,因此要對現(xiàn)有用戶留存,利用的是海盜模型去定義用戶的生命周期,從激活到留存還有沉默到流失,以及內(nèi)容傳播與收入等都有實踐。
指導思想就是對每個用戶實時跟蹤,實時搜集用戶行為,標記用戶生命周期,根據(jù)生命周期標簽做相關推薦,如新用戶進行冷啟動學習進行推薦,沉默會做拉活嘗試,流失會做用戶召回活動。留存也會做優(yōu)化,但更多是基于用戶畫像進行個性化作品分發(fā)以及個性化push。
運營這一塊很重要,每年花費在市場推廣成本很高,如何評價和吸引高質量的用戶難點很多,主要有對接的渠道很多,接入方式多種多樣,借助第三方平臺實現(xiàn)高質量推薦不現(xiàn)實。
因此定制化BI后臺,嘗試對用戶拉新精準歸因,然后做精準統(tǒng)計。平臺應用中,發(fā)現(xiàn)利用自己的平臺能節(jié)省20%的運營成本。在做用戶拉活和廣告素材方面會做個性化投放,通過用戶個性化標簽生成對應的廣告素材做精準拉活和召回投放。
文:屈世超@DataFunTalk(datafuntalk)
首席增長官CGO薦讀:
更多精彩,關注:增長黑客(GrowthHK.cn)
增長黑客(Growth Hacker)是依靠技術和數(shù)據(jù)來達成各種營銷目標的新型團隊角色。從單線思維者時常忽略的角度和高度,梳理整合產(chǎn)品發(fā)展的因素,實現(xiàn)低成本甚至零成本帶來的有效增長…
本文經(jīng)授權發(fā)布,不代表增長黑客立場,如若轉載,請注明出處:http://m.allfloridahomeinspectors.com/cgo/12369.html