關于UGC內容社區(qū)新熱推薦的一些思考記錄

本篇文章不會涉及過多背景介紹與基礎信息的講解,默認大家都對于推薦本身,對于推薦為何要追求新熱有一定認知。

一句話而言:內容推薦是將用戶喜歡的,同時符合平臺意志的內容按照一定順序展現給用戶,而熱點事件是最吸引眼球的,對于新熱內容,如果能更快更及時地展現給用戶,就能夠將用戶的注意力牢牢地抓在平臺手中。

基于策略PM視角,內容社區(qū)應該從以下幾個方面去服務滿足用戶獲取新熱內容的需求:

熱點獲取、熱點內容挖掘、熱點內容推薦、熱點感知提升&評估體系搭建。

下面我也會從這幾個維度來聊聊新熱推薦在內容社區(qū)的實施,包含一些可能存在的坑,以及一些需要注意的關鍵點。

2 新熱推薦的社區(qū)應用

2.1 熱點獲取

熱點事件分為兩種,一種是全網熱點事件,比如前段時間的吳亦凡被捕、東航墜機事件、最近的上海疫情進展,第二種是原生熱點事件,基于社區(qū)文化,在內部產生,具備一定破圈能力的事件,這方面的案例最典型的是古早的“賈君鵬,你媽媽喊你回家吃飯”、最近的“蔡徐坤周杰倫超話打榜”。

全網熱點事件是全民關注的,其特征是發(fā)酵非常迅速,能吸引大多數人的目光,通常不具備過高的理解門檻,但足夠重要或者足夠勁爆。當事件發(fā)生時,人工往往會比機器有更強的先驗判斷能力,比如吳亦凡事件,當被捕的消息剛發(fā)布微博的時候,機器可能需要計算同時段爆發(fā)的相關討論情況才能判斷事件等級,但人工就很容易判斷其一定是一個全網熱點事件。

原生熱點則一般是社區(qū)內部先小范圍發(fā)酵,是社區(qū)用戶一段時間最關心熱議的話題,初期一般具備具備鮮明的領域屬性,或者存在一定理解門檻。但當討論議題足夠具備爭議性,且衍生出了一些不需要了解事情完整情況也能get到的梗的時候,原生熱點也完成了進階,具備了拓圈,成為全網熱點事件的可能。

扯了一大堆終于到了正題,作為平臺方,我們應該如何更快更準確的獲取到熱點信號呢?

同樣需要分熱點類型來看,對于全網熱點事件,著重看三方面信號:競品push內容(微博、頭條、百度等)、頭部媒體號發(fā)布內容(人民日報、共青團中央等)、競品熱榜內容。

其中push通常是最快的,熱榜是最準的,頭部媒體號發(fā)布的通常是最具價值的。

這三類信號都存在雜音,比如push還包括很多非新熱向的個性化push,熱榜也通常有平臺意志強加的內容,策略在這步中需要做好的是信號的獲取與處理,接入更豐富的信號源,做好信號處理,包括事件聚合(同一事件在不同平臺存在不同表述)、事件交叉驗證(同時間出現在多個競品熱榜高位的大概率是全網熱點事件)。

不可或缺的還是運營的介入,提供一個人工的判斷界定,可能更快的熱點事件發(fā)現、修正策略對事件重要性的判斷結果,這方面需要策略團隊與運營的通力協作,通常還需要設置一些中間指標,來衡量策略和運營在熱點發(fā)現這一環(huán)節(jié)的表現,這塊可以自行設置,就不再展開。

而對于原生熱點事件,就更讓人頭疼了,對于頭部社區(qū)來說,如微博,由于用戶形成了較強的#話題感知,通過計算一段時間內話題的熱點躥升情況,是能夠很好發(fā)現熱點的,而對于其他ugc內容社區(qū),熱度躥升的德爾塔值同樣具備很強的參考價值,因為具備討論的熱點一定會在短時間具備強虹吸效應,將附近的注意力與流量聚集起來,這就會帶來一些置信的熱點判斷信號,包括用戶層面的集群、內容層面的集群。

策略團隊通過與數據團隊協作,定義獲取熱點置信信號,定義熱點爆發(fā)度信號(用于計算熱點內容的爆發(fā)擴散能力)、來挖掘可能的原生熱點事件。

2.2 熱點內容挖掘

這部分尤其針對全網熱點,從外站獲取到了熱點事件,通常以一串文字的形式呈現,比如#鄧倫偷稅1.06億,這就是策略用以內容挖掘的主要抓手,而在ugc內容社區(qū),用戶發(fā)布的內容并不具備很強的結構化,很多時候標題就是“xdm,出大事了”,然后截圖的熱點事件的外站截圖,這就給策略做內容匹配出了一道大難題。

要平衡準確性和召回能力,怎么解呢?

傳統(tǒng)的做法是通過切詞匹配&事件聚合策略,匹配的主體分別是熱點事件名的切詞結果和社區(qū)內容標題,這種做法的優(yōu)點是匹配的準確性較好,但缺點是沒法匹配到上一段我們所說的那種內容,而這種內容可能在社區(qū)中占比比高結構化的內容多得多。

筆者嘗試過加入正文內容,以及ocr識圖結果來做匹配,結果是匹配的相關性很差,幾乎是不可用的程度,和策略rd討論過后,有幾種可嘗試的方法,也po出來和大家討論:

  • 梯度匹配,同樣引入正文內容和ocr結果,但加入限制,對于這部分內容,要求匹配相關性更高,再加入召回。
  • 策略嘗試,在jarcard相似度的基礎上嘗試其他算法,進行bagging,提升匹配的準確性。
  • 獲取熱點title及落地頁內容、社區(qū)內容title和內容,基于KeyGraph算法做匹配。
  • 同樣,運營在這步中可以做為人工內容補充的一個源泉,同時對策略挖掘的內容做二次審核和不相關剔除,同樣需要制定相應的中間指標,共背指標才能互相約束。

這部分就不細拆了,如果想要進一步討論,可以找筆者私聊~

2.3 熱點內容推薦

這部分反倒是最簡單的,三個步驟需要關注一下:熱點事件的定向人群冷啟、熱點事件的擴散、熱點事件的LCN及時退場。

定向人群依賴于對用戶畫像的刻畫,需要對新熱用戶進行定義,對這部分喜歡看熱點事件的用戶,優(yōu)先將熱點事件推薦展現,根據他們的表現,來決定下一步是否需要進行熱點推薦的擴散(提權)、熱點事件同樣需要做好LCN退場,即對于同一個事件下,內容推薦超過X條,無點擊行為,需要對該用戶及時退場,避免搶占曝光資源。

這步策略主要聚焦的核心指標,可以通過“事件發(fā)生xx min時間內的用戶覆蓋”來衡量。

2.4 熱點感知提升&評估體系搭建

推薦出新熱內容,并不直接意味著用戶新熱感知自提升了,需要結合功能側的一些改動,比如典型如微博,推薦帶推薦理由,搜索框實時展現熱點事件等,都是從功能側驅動,配合策略實現用戶切實對新熱事件感知的提升。

關于UGC內容社區(qū)新熱推薦的一些思考記錄

那么怎么評估用戶新熱感知提升了呢?

包括月度的用戶評估報告(最好有和競品的對比,新熱感知月報)和數據維度的例行評估。

數據維度的評估主要從四個方面進行:

  • 全面:事件覆蓋全、事件推薦角度全;
  • 及時:是否在事件發(fā)生第一時間給用戶推薦出來;
  • 準確:是否內容是熱點事件相關的,是否推給了對該熱點事件感興趣的人;
  • 適度:是否推薦適度,不存在霸屏、連出、退場不及時的問題;

3 新熱推薦的拓展想法

有幾個問題筆者一直在思考:

  • 內容社區(qū)真的把新熱做起來,應該是一個什么樣的狀態(tài)?
  • 熱點事件,更應該以什么形式承載,單內容?話題?
  • 話題榜中,全網熱點和原生熱點,應該怎么分布才算合理?
  • 新熱線條,產品和運營應該怎么分工,究竟是哪方主導?

這幾個問題,限于篇幅,就不在這篇文章中展開了,如果大家有想法,可以在評論區(qū)發(fā)表自己的看法,也可以找我私聊討論。

若能拋磚引玉,不勝榮幸~

本文經授權發(fā)布,不代表增長黑客立場,如若轉載,請注明出處:http://m.allfloridahomeinspectors.com/cgo/coo/63832.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2022-04-08 10:46
下一篇 2022-04-08 11:00

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復

登錄后才能評論