當前位置:法律諮詢服務網 - 企業資訊 - 信息流的小事:3推薦算法是如何實現的?

信息流的小事:3推薦算法是如何實現的?

說完信息流流行的原因(關於信息流的小事:為什麽信息流這麽流行),我們再從產品的角度來看壹下推薦算法在技術上是如何實現的。

根據所需技術和運營成本,主流推薦算法可分為三類:基於內容元數據的推薦、基於用戶畫像的推薦和基於協同過濾算法的推薦。

基於元數據的推薦是壹種比較基礎的推薦算法。基本原理就是給內容貼標簽。根據內容選擇特定的元數據。常見的角度包括內容的關鍵詞、類型、作者和來源。打開壹個頭條app,選擇屏蔽壹個內容,可以看到該內容的壹些元數據。

有了內容的元數據,就可以根據內容之間的相關性推薦相關內容。喜歡看Qipa的用戶可能也喜歡看咪咕傳媒出品的飯局的誘惑。根據內容的元數據,還可以記錄用戶的內容偏好並逐漸明晰,積累數據,便於基於用戶偏好的精準推薦,這就是下面要提到的基於用戶畫像的推薦內容。

用戶畫像和標記用戶壹樣,主要由三部分組成:用戶基本數據(年齡、性別等。)、應用使用數據(應用使用頻率、持續時間等。)和內容偏好數據(喜愛的內容分類、類別等。).

對於基礎數據,不同年齡段的用戶在內容偏好上有很大差異。年輕人可能更喜歡新歌和熱門歌曲,而中年人可能更喜歡聽懷舊歌曲。根據應用使用數據,可以對用戶進行分層,活躍用戶可以推薦更多的內容來促進其使用,即將流失的用戶可以推送壹些打開率高的內容來挽救,運營活動可以更有針對性;基於內容偏好數據,可以記錄用戶的內容偏好並逐漸明晰,從而做出更精準的推薦。從看娛樂新聞,看國內明星,看壹個小鮮肉,隨著內容偏好數據的逐漸積累,頭條產品的推薦會更加精準。

協同過濾算法,簡單來說就是找到相似的用戶或內容進行推薦,主要包括基於用戶的協同過濾推薦和基於項目的協同過濾推薦。

(1)基於用戶的協同過濾推薦

基於用戶的協同過濾推薦算法,就是對內容偏好相似的用戶進行分析,通過算法向妳推薦他們喜歡的內容。這種推薦誌同道合的人喜歡看的內容的思路,更類似於生活中的朋友作為誌同道合者的推薦。比如妳喜歡ABC,其他用戶也像妳喜歡ABC壹樣喜歡D,那麽D就會推薦給妳。

(2)基於內容的協同過濾推薦

基於內容的協同過濾推薦算法是通過算法分析內容與內容之間的相關性,根據妳喜歡的內容推薦最相關的內容。看這個內容的用戶85%也喜歡xxx,就是這個想法。比如妳喜歡A,喜歡A的用戶喜歡B,那麽B就會推薦給妳。

與單純基於內容元數據的推薦相比,基於內容的協同過濾推薦可以發現某些內容之間更深層次的聯系。比如羅輯思維往往只基於內容元數據來推薦各種內容,羅輯思維的壹集應該是最相關的壹集,卻無法推薦內容元數據相關性不大的節目中推薦的內容。但由於很多用戶在觀看後可能會搜索和查看節目中推薦的內容,基於內容的協同過濾推薦會發現兩者的相關性,並做出推薦。

在介紹推薦算法的思路時,我們壹直在講壹個詞“內容偏好”,這是實現推薦算法時的壹個核心問題——需要什麽樣的數據來判斷用戶的內容偏好?有三種主流觀點:

讓用戶手動選擇顯然是最簡單的想法。但由於選擇空間有限,用戶只能從幾個類別中選擇,無法涵蓋全部內容。同時,粒度太大也很難精準推薦。而且用戶剛打開應用就選擇太重,或者使用壹段時間後再補充選擇,可能導致用戶流失。

由於人工選擇難以實現,我們需要從用戶的使用數據中挖掘。主流的思路是根據用戶的壹些主動行為來判斷。點擊閱讀表示喜歡,點擊喜歡或者回復分享表示非常喜歡。跳過內容,就會減少推薦。如果點擊不感興趣,就不再推薦了。

根據用戶的操作來判斷內容偏好,在不斷的使用中積累和提煉數據,對內容偏好的判斷會越來越準確,這是頭條系統應用的主要策略。這種策略對於不願在下沈市場主動選擇的沈默用戶來說是非常合適的策略,但這種策略只看點擊和運營,不註重內容的實際質量,也會造成標題黨、低俗內容等問題,後面會進壹步介紹。

既然選擇不能完全代表用戶的內容偏好,如何讓判斷更準確?有必要從壹些更隱蔽的數據入手。比如對於文章,除了點擊,閱讀時間,閱讀完成情況,是否查看文章的相關推薦內容,都可以考慮。相比純點擊判斷,可以在壹定程度上解決標題黨的問題。再比如看視頻。如果快進太多次,可能即使看完也不是特別感興趣,但值得重復觀看的內容,擊中內容偏好的幾率相對較高。

介紹完推薦算法的原理和數據來源,我們再來嘗試還原壹個內容的完整分發過程。

首先,是內容的初始化和冷啟動。可以通過算法對內容進行分析提取或人工處理,提取內容的來源、分類、關鍵詞等元數據,然後根據用戶畫像計算內容興趣匹配度,分發給具有相應內容偏好的用戶,也可以通過原始匹配度將內容分發到關系鏈中,完成內容的冷啟動。

然後根據用戶的閱讀時間、閱讀完成量、互動次數等數據,分析內容的質量,並據此增減推薦,實現內容的動態分發和調整。

最後,就是協同過濾算法發揮作用的時候了。對於優質內容,可以通過基於用戶的協同過濾推薦,推薦給與內容受眾有相似興趣愛好的用戶,也可以基於項目協同過濾推薦,推薦給喜歡看相似內容的用戶,讓優質內容的傳播不局限於關系鏈。

在真正的推薦算法實現過程中,除了基本的內容原創匹配度、內容匹配度、內容質量,還有很多問題值得考慮,比如新聞通知等時效性強的內容要短時間加權,不推薦超時;用戶對內容的偏好不可能永遠保持。隨著時間的推移,用戶可能會喜歡新的內容。如果用戶在壹定時間內對之前喜歡的內容不感興趣,就應該減少這種推薦。另外,為了不陷入越喜歡越推薦,最後都是壹種內容,讓用戶厭煩的局面,要為用戶的喜好設置壹個上限;為了保持新鮮感,需要幫助用戶找到他們可能喜歡的新內容。.....

最後,我們可以通過數據知道自己是如何閱讀這篇文章的,但是沒有任何數據可以準確描述我們閱讀後的感受和收獲;算法再先進,也只是算法。雖然它可能比我們更了解我們的實際內容偏好,但它無法理解我們對內容的追求。

這可能也是頭條產品取得巨大成功的原因,但也受到了標題黨、低俗化、回音室效應的指責。接下來,我們來談談信息流產品面臨的問題以及可能的解決方案。

  • 上一篇:信息安全培訓應達到的效果是什麽
  • 下一篇:形容情感疏離的成語
  • copyright 2024法律諮詢服務網