NETFLIX從DVD租賃到矽谷公司的路徑

流媒體網 發佈 2020-01-16T13:19:50+00:00

2009年,作為推薦系統領域最標緻性的事件,Netflix發起NetflixPrize百萬美金競賽,這次比賽不但吸引了眾多專業人士投身於推薦系統領域研究工作,也讓這項技術從學術圈真正地進入到了商業界,在引發了熱烈討論的同時逐漸深入到了商業核心腹地。


在過去近十年的時間裡,Netflix公司逐步成為美國乃至全球付費OTT業態的典型代表。但很多人在談起Netflix的時候依然停留在《紙牌屋》「大數據拍片」的神話中,或者是極度關注Netflix在原創內容上的大筆投入以及在艾美獎上的成功。那麼,Netflix到底是一家正在向原創內容領域進軍的在線流媒體業務提供商?還是一家以數據和技術為主導的矽谷科技公司?


2009年,作為推薦系統領域最標緻性的事件,Netflix發起Netflix Prize百萬美金競賽,這次比賽不但吸引了眾多專業人士投身於推薦系統領域研究工作,也讓這項技術從學術圈真正地進入到了商業界,在引發了熱烈討論的同時逐漸深入到了商業核心腹地。而推薦系統也成為Netflix最受推崇的創新工作。本文引用《Netflix從DVD租賃到矽谷公司的路徑》報告內容,介紹Netflix內容推薦決策新方法論——「品味社區」。該報告結合Netflix發展歷程深入研究其微觀運作特色,尤其是在技術運營、內容運營與用戶營銷方面的創新工作,對大視頻領域相關企業的具體運營創新工作有很大的借鑑參考意義。


除了前言之外,本報告核心內容包括6個篇章:綜合篇、文化篇、技術篇、創新篇、思考篇和建議篇。字數共計7.36萬,並有130個圖。(詳見文末目錄)

內容推薦算法中隱性數據和顯性數據


人們在Netflix上觀看的電視節目中,超過80%是通過該平台的推薦系統發現的。Netflix使用機器學習和算法來幫助打破觀眾的先入之見,找到他們最初可能並不會選擇的節目。為了做到這一點,Netflix關注的是內容中微妙的線索,而不是依靠廣泛的類型來做出預測。


Netflix在算法中所運用的數據可以分為兩種——隱性數據和顯性數據:顯性數據就是用戶字面上所表達的意思,比如用戶給劇集《皇冠》點讚了;隱性數據實際上是用戶行為數據,用戶沒有明確地表明「我喜歡某一部劇」,但花了兩個晚上就把這個劇全看完了。而為了完善自己的內容推薦系統,Netflix不止在顯性數據方面發力,因為事實上大多數有用的數據都是隱性的。


品味社區及其三大基礎


Netflix做內容和用戶推薦的決策,並不是基於廣泛的人口統計數據,而是基於「品味社區(Taste Communities)」來決定是否訂購一部新劇以及向用戶推薦什麼樣的內容。


「品味社區」即喜歡看相同內容的用戶群體,Netflix目前已識別出2000個這樣的用戶群。這些品味社區也可能會喜歡看似完全不同的內容,比如,Netflix的算法發現單口喜劇演員Dave Chappelle的粉絲群與霍金傳記電影《萬物理論》的粉絲群之間存在著令人意想不到的聯繫。」


圖為:Netflix「品味社區」劃分


之前,Netflix根據用戶的地理位置進行內容推薦,比如,德國人喜歡看的內容可能與南美人喜歡看的內容有所不同,但Netflix的產品副總裁Yellin去年在接受採訪時表示,「我們越來越發現這是無稽之談。」所以,Netflix轉而根據「品味社區」來進行用戶推薦。Netflix用於形成「同品味用戶群」的三大基礎分別是Netflix的用戶行為數據、節目內容標籤數據和機器學習算法。



用戶行為數據:雖然Netflix在全球擁有超過1億的用戶,但如果將每個用戶的多個用戶配置文件計算在內,那活躍的用戶配置文件總數將達到2.5億左右。「我們從這些資料中看到的是以下類型的數據——人們看了什麼,之前看了什麼,之後看了什麼,一年前看了什麼,最近看了什麼,每天什麼時候看。」這些數據構成了凳子的第一條腿。



節目內容標籤數據:旨在理解節目內容的數據。這些數據基礎構建由數十名內部員工和自由職業者組成,他們觀看Netflix平台上的每一場節目,甚至每一分鐘的節目,並將其貼上標籤(tag)。從作品的思想性,到演員整容的完整性,標籤範圍很廣。



機器學習算法:「我們把所有這些標籤和用戶行為數據結合起來,然後使用非常複雜的機器學習算法,找出最重要的、我們應該重視的,」根據Netflix產品副總裁Yellin的說法,他們會沿著用戶收看的軌跡去摸清楚用戶的品味。


「品味社區」應用


「品味社區」的應用涉及如下領域。


第一,「品味社區」可以用於內容評價。Netflix通過分析這些「品味社區」,並根據從這些群體收集的數據開發新的節目。當Netflix高管們在決定是否要訂購一部新劇集時,他們會看這個劇集是否能夠聚集足夠多的這些「品味社區」,以證明一部劇集的成本是否合理。Netflix的內容是為了迎合他們的口味,而不是迎合高管們的口味。


圖為:Netflix個性化推薦




第二,最直接的應用是,「品味社區」直接影響用戶在登錄到Netflix服務平台時看到的內容推薦即首頁。事實上,Netflix的內容推薦在用戶層面的影響主要分為個性化推薦介面和個性化圖片功能,具體可以參考流媒體網的《Netflix大屏互動設計分析系列》文章。



Netflix通過設置數萬種不同的電影屬性標籤(甚至包括對人物的道德評級),創造了與其千萬級用戶的觀影習慣相匹配的「微類型(Alt-Genre)」與「同品味用戶群」相互作用,並採用算法為每個用戶創建一個個性化首頁。根據用戶特徵以及瀏覽設備的不同,從用戶相關的視頻(用戶本人或朋友曾看過)以及成千上萬個可用候選行(每行擁有可變數量的內容)中,選擇最適合該用戶的行分組進行分組間及組內顯示排序。


「研究表明,圖片不僅是用戶決定觀看內容時的最大影響因素,而且在用戶瀏覽Netflix時也占了他們82%的注意力。對於Netflix所推薦的每個內容,用戶平均花1.8秒進行考慮。」考慮到用戶品味和喜好的多樣性、不同配圖包含著劇情發展中的不同主題,這些信息無法通過任何單獨一張圖片去呈現。


一張影片配圖的有效性也可能取決於其他對影片的介紹(比如故事梗概、預告片等),每部影片的海報之間也需要有足夠大的差異去吸引有著不同喜好興趣的潛在觀眾。歸根結底,一張配圖的有效性和信息量其實取決於看到的不同的人。



圖為:根據用戶品味喜好結合演員特點生成的《心靈捕手》推薦海報


附報告目錄:




報告價格:

  • 售價:6000元
  • 年度VIP會員價:5000元

《Netflix從DVD租賃到矽谷公司的路徑》報告結合Netflix發展歷程深入研究其微觀運作特色,尤其是在技術運營、內容運營與用戶營銷方面的創新工作,對大視頻領域相關企業的具體運營創新工作有很大的借鑑參考意義。這一報告與此前的《Netflix全球化運營與發展策略研究》報告完美互補,該報告對Netflix企業源起與基因、原創內容戰略、全球化運營戰略、區域市場拓展策略、電影內容發展策略等進行系統描述。

關鍵字: