粟 皓,趙 暉
(1.中國科學院大學,北京 100049;2.新疆大學,新疆 烏魯木齊 830046)
隨著數字化、網絡化、智能化的快速發展,數字電視網絡運營商依托技術優勢逐漸實現了電視節目點播與個性化推薦功能,從而開拓出與以往不同的電視節目營銷方式。如2017年3月7日,“央視專區”在北京歌華有線試點上線智能推薦功能,為專區用戶提供個性化節目推薦服務[1]。對于推薦系統,Resnick和Varian[2]認為,它利用電子商務網站為顧客提供商品信息和建議,幫助用戶決定應該購買什么產品,模擬銷售人員幫助客戶完成購買過程。系統的個性化推薦技術能夠自動為用戶推薦符合其偏好的信息,減少用戶檢索的時間,提升用戶體驗,提高傳播效率。其中,大數據處理為此提供了很好的技術支撐。大數據處理,就是對大量的用戶數據使用一定的處理方法進行統計與分析,幫助使用者在決策、洞察外界環境變化和優化流程等方面表現得更佳[3]。大數據與互聯網在電視平臺中的應用促進了傳統推薦營銷方式的變革,其中最突出的變化表現在以下方面。
首先是臺網融合趨勢的出現。當下,基于雙向互動的數字電視已走進千家萬戶,其是建立在雙向數字化技術基礎之上,具備開放式操作系統與應用平臺,能夠滿足用戶點播節目等個性化、多樣化和多層次需求的電視產品。電視平臺在數字電視的基礎上開發出各種產品和服務,同時互聯網技術以及大數據對電視平臺營銷影響巨大。在二者的共同作用下,電視平臺現已不僅僅是電視臺播出電視節目的渠道,而是逐漸轉變為由內容提供商、服務提供商和電視臺共同構成的跨網、跨終端的多元化業務組合。電視平臺通過數字電視完成了對用戶信息的收集與分析,實現了電視節目的個性化推薦。
其次是電視節目市場的分眾化。傳統的電視節目推薦主要以首頁頂置和黃金展位為主導,關注最為大眾接受的節目,小眾內容很難占據流量位置。這有利于電視平臺打造大流量爆款內容,但不利于更全面地吸引觀眾。而電視節目個性化推薦的營銷方式則彌補了這種不足,使小眾用戶也可以更加快捷地搜尋到符合自身觀看偏好的節目。個性化推薦需針對不同的用戶偏好推薦不同的電視節目,因而電視平臺對于市場的關注需從僅關注流量節目轉而同時關注爆款節目和小眾節目,由此帶來了電視節目市場的細分。
最后是電視平臺對大數據的依賴程度加深。個性化推薦營銷建立在對大量用戶數據收集、整理、分析和分類的基礎之上,電視平臺需對不同的節目進行分類,采用相關算法計算出各種電視節目之間的相似程度,向用戶進行個性化節目推薦時也需計算用戶常觀看節目與平臺內節目組之間的相似程度,根據相似程度進行匹配進而推薦節目。由此,電視平臺對于大數據的依賴程度顯著提升。根據個性化推薦技術手段的不同,電視平臺需對用戶觀看偏好數據進行不同方式的處理,并及時接收用戶的反饋信息。上述工作均是在對用戶觀看數據進行處理的基礎上進行的,從中可以反映出電視平臺對大數據依賴程度之深。
基于大數據的電視節目個性化推薦是各電視平臺向消費者提供個性化視覺體驗服務的重要營銷方式之一。通過大數據處理,電視平臺可以實現對用戶觀看與點播歷史的統計,并根據歷史數據對用戶未來可能觀看的節目作出預測進而進行推送。在電視平臺進行電視節目個性化推薦營銷的過程中,用戶會接收并響應電視平臺的刺激進而進行自我參照,其注意力會自發地集中于與過去觀看經驗相似的內容。若推薦內容符合用戶的自我參照,則其更有可能觀看推薦內容并減少對其他內容的搜索。目前,個性化推薦所依賴的數據主要是基于內部數據和外部數據這兩類[4]。
內部數據來自于平臺自身對用戶觀看數據的統計和分析,當下使用比較廣泛的基于內部數據的個性化推薦算法有兩種。一種是基于內容的推薦方法,又稱為基于信息過濾的推薦,其是根據用戶選擇的節目對象推薦屬性類似的節目,核心思想是根據用戶興趣和節目特征的相似性進行推薦。另一種是基于協同過濾的推薦方法,其是根據用戶所在分類的同分類用戶的觀看歷史來估計當前用戶的觀看偏好,從而對節目進行篩選推薦。
上述兩種推薦方法各有優缺點。基于內容的推薦方法是根據用戶個人觀看歷史進行相似節目的類比并進行推薦,以該方法推薦的結果不會受同類別其他用戶觀看偏好的影響,推薦結果更為直觀、準確。但是此種方法難以處理復雜的數據且難以發現用戶的潛在興趣,因而容易形成偏好固化。這種推薦方法是根據用戶觀看節目的特征信息進行匹配推薦,若同一終端使用者不為一人,系統統計到的用戶觀看偏好無法保持一致則不易形成匹配結構,導致推薦出現困難。同時,這種推薦方法向用戶推薦的內容具有高度同質性,很難發現用戶的相似偏好或其他方面的潛在興趣。
基于協同過濾的推薦方法可在一定程度上克服基于內容的推薦方法的不足。該方法使用的是與用戶有著相似觀看偏好的用戶群數據,進行類比后再為用戶推薦相類似的節目。從用戶的角度來說,其獲得的推薦信息來自于用戶群的瀏覽行為,不需用戶主動查找適合自己的推薦信息;并且該方法可以處理包含圖像、聲音等較為復雜的非結構化對象數據。此外,這種方法對用戶的推薦是基于群體觀看偏好,因而推薦的節目雖具有一定的相似度但同時也保持了一定的差異性。這可以幫助用戶在觀看節目時拓展自我參照邊界,發現相似的潛在興趣。但是這種推薦方法存在冷啟動和數據稀疏性問題。數據稀疏性問題是指在現實中,電視平臺存在著大量沒有觀看或評價數據的用戶,沒有或者只有極少量的新用戶信息,包括用戶的歷史瀏覽記錄以及用戶對推薦內容的反饋信息等,也就是說用戶還未在該平臺表現出穩定的觀看偏好,而只有當用戶有一定的歷史記錄后系統才能對其偏好進行分類;且由于用戶之間的選擇存在差異性,因而用戶對于同樣的節目可能評價差異很大。另外,新節目加入系統數據庫后,必須有一定數量的用戶觀看記錄及評論后系統才能對其進行分類。冷啟動則是數據稀疏的一種特殊情況,是指用戶在該平臺內完全沒有歷史記錄,此時使用該推薦方法便無法對其進行個性化推薦。
基于外部數據的推薦首先需要不同的電視平臺之間進行數據共享,然后根據用戶在本平臺與其他平臺的觀看歷史進行相關推薦。如果某一電視平臺能夠從其他電視平臺獲取某一用戶的觀看偏好信息,那么該電視平臺將會獲得更為全面的用戶觀看偏好,并為其提供更為精準的電視節目推薦。外部數據共享會給平臺營銷帶來更多有效數據,相關研究表明,如果公司與競爭對手之間共享消費者數據,將會同時提高兩個公司獲得消費者的能力,形成雙贏局面[5]。對規模較小的電視平臺而言,來源于外部的數據能夠更好地反映用戶的觀看偏好,如果其能很好地利用來自外部電視平臺的數據為用戶提供個性化推薦,那么用戶接受這種營銷方式的概率將會提高。對規模較大的電視平臺而言,實現數據共享可進一步豐富平臺自身大數據的內容,獲取更多的平臺用戶信息資料,進而可為用戶提供更為精準的個性化推薦。用戶也可以由這種自我參照的滿足產生對平臺的忠誠,忠誠度越高,用戶觀看該電視平臺推送節目的概率也越高[6]。
通常情況下,用戶在電視平臺內接收個性化節目推薦主要經過以下階段。一是推薦請求階段,即當用戶進入電視平臺后,客戶端會將需要推送的個性化節目請求發送至服務器推薦系統。二是用戶個性化節目生成階段,即推薦系統根據請求篩選需要推薦的節目并將結果返回客戶端。三是個性化推薦顯示階段,即客戶端顯示由推薦系統返回的推薦節目。在這一過程中,后臺系統將根據不同用戶的觀看歷史記錄生成不同的推薦反饋,用戶在接收到推薦后可選擇接受或者拒絕其中的部分推薦,在此基礎上后臺系統可根據用戶的反饋不斷調整推薦內容。
個性化推薦營銷在數據共享的情況下能夠為電視平臺帶來更多的收益,但平臺間的數據共享面臨眾多阻礙,主要表現為:一是數據共享涉及數據安全問題。在數據共享過程中數據會在不同電視平臺間流動,需對數據安全進行監管。當下信息技術發達,具有商業目的的信息盜竊與信息泄露時有發生,因而保證信息安全是各電視平臺在數據共享時需應對的一大難題。二是數據共享面臨泄露商業秘密的風險。大數據時代,用戶使用信息是電視平臺的重要資源,可在一定程度上反映平臺自身欄目的建設特點和優勢,映射出平臺的核心競爭力,而數據共享則有泄露平臺商業秘密的風險。“同行是冤家”的傳統思想給用戶數據共享增添了一道阻礙,各電視平臺往往會出于品牌保護的目的而不愿共享用戶數據。三是數據的稀缺資源屬性在一定程度上制約了數據共享。用戶數據是電視平臺收集而來的稀缺資源,各平臺的用戶觀看數據是對用戶的觀看記錄等歷史數據不斷進行收集、整理和分析獲得的,電視平臺需付出較高的成本以形成完整、豐富的數據庫,此種稀缺資源能為電視平臺的個性化推薦營銷帶來極大便利,出于對資源的保護,電視平臺往往不愿共享數據。
從傳統的節目推薦營銷轉向個性化推薦營銷,電視平臺需處理的用戶信息數量大幅增加,可能會超出電視平臺數據處理的能力。一是個性化推薦帶來觀眾分類的碎片化。傳統推薦是針對爆款節目的推薦,是在大數據中統計觀看人數、收視率較高的節目并將其作為爆款放置于電視平臺截面頂部或黃金位置;而個性化推薦需對用戶進行細分,形成眾多不同的用戶群體,電視平臺的個性化推薦是對不同用戶群體甚至每個不同用戶進行推薦。個性化推薦對數據的處理需對不同用戶的碎片數據進行整合,不僅僅是對某類節目觀看人數、收視率等數據的整合,而是包括了用戶年齡、性別、行業等復雜因素的數據整合。二是個性化推薦帶來電視節目分類的碎片化。傳統推薦方式下,電視平臺只需關注節目的瀏覽量和評價,在協同過濾推薦方式下,節目推薦建立在用戶對節目的評價等信息的基礎之上,電視平臺需根據節目評價同時依據用戶偏好對節目進行差異化對比和詳細分類。因而在節目信息處理方面,個性化推薦下電視平臺需處理的信息數量明顯增加。
正如前文所述,基于內容的推薦方法和基于協同過濾的推薦算法各有優缺點,限于相關算法的固有缺陷,電視平臺在建立數據分析系統時會出現不足,進而不能充分發揮個性化推薦營銷的優勢。一是基于內容的推薦方法不能有效處理多媒體數據,其主要是對數據的單方面處理,如對文字信息中高頻詞匯的統計和分析等。此外,為用戶推薦的視頻內容局限于用戶觀看的歷史記錄,無法在類似用戶群中形成聯動,推薦節目種類單一、同質化程度高,難以充分滿足個性化推薦營銷中推送內容豐富的要求。二是協同過濾推薦算法雖可在一定程度上克服基于內容推薦方法的推薦內容同質化程度高、不能有效處理復雜數據等缺點,能夠針對用戶群體中具有相似觀看偏好的用戶進行節目推薦,然而高質量的協同過濾推薦結果是建立在節目信息、用戶觀看記錄、用戶評價等大量復合數據的基礎之上的,現實中用戶偏好差別巨大、節目數量龐大、數據稀疏性問題較為明顯,因而降低了個性化推薦營銷的質量。同時,新用戶使用平臺和新節目進入數據庫時所產生的冷啟動問題也會影響推薦結果。
電視節目個性化推薦營銷是基于用戶或者相似偏好用戶的歷史數據產生的。在用戶和系統之間不斷交互信息的過程中,系統會根據用戶反饋提供更為精準的個性化推薦,用戶則會進一步選擇符合其觀看偏好的節目,此時便容易產生用戶偏好固化的問題。從用戶角度來看,其在接收到系統的個性化推薦服務后,會在其中選擇最符合自己觀看偏好的節目,而用戶長期接受同類型的節目推薦又會養成非自主選擇習慣。用戶的觀看習慣和觀看偏好會隨個性化推薦的深入日趨固化,在一定程度上導致用戶的喜好和選擇出現不同程度的窄化。從系統角度來看,系統在接收到用戶的反饋信息后會對推薦的節目進行調整,出于提高用戶觀看率的目的,系統會自發地向用戶提供更符合其偏好的節目,這在用戶觀看節目的過程中不斷循環,系統推薦的節目也會越發精準。然而忽略對用戶潛在觀看偏好和相似偏好的發掘,也將導致個性化推薦的范圍不斷變窄。因而,在用戶和系統的共同作用下,用戶接收到的推薦范圍越發狹窄,最終容易形成用戶偏好固化,從長期來看不利于電視平臺、電視節目的發展以及對用戶觀看潛力的發掘。
外部數據有助于電視平臺建立更為完善和全面的數據庫,幫助電視平臺解決冷啟動和數據稀疏性問題,推進電視節目個性化推薦營銷。雖然電視平臺之間以及電視平臺和網絡視頻平臺之間的數據共享存在一定阻礙,但這并不意味著無法進行。首先,電視平臺需充分保障數據安全,保護用戶隱私。在對用戶信息進行數據共享前,應通過合理方式征得用戶同意,并在進行平臺間信息共享時通過信息加密技術加強對信息傳輸安全的保障。各平臺應安排專人負責平臺間的數據傳輸工作,以明確責任,保證數據共享期間用戶信息不被竊取和盜用。其次,以原始信息的共享代替分類后信息的共享。此種共享方式不僅可以解決商業機密泄露的問題,還可降低共享成本。各電視平臺可通過外包或建立合資公司的方式處理共享數據。外包時應保證第三方公司的獨立性,這樣更有利于數據收集與反饋的客觀性和全面性;建立合資公司有助于實現對用戶數據的控制,提升數據處理質量。
個性化推薦營銷方式下電視平臺需處理更大量、更復雜的用戶偏好數據和節目分類數據。面對數據數量的激增,電視平臺可通過內部改制或者尋求外部合作的方式提升數據處理能力,為個性化推薦營銷做好技術保障。具體而言:一是各平臺可通過內部改制的方式建立專業部門處理用戶和節目數據,如可在平臺內部建立數據處理中心或者對原有技術部門進行調整,通過人員和設備的整合提高平臺的數據處理能力。二是各平臺可通過業務外包或者建立分公司的方式進行數據處理。若采用業務外包方式則電視平臺無需建立專業的團隊和部門,在很大程度上降低了電視平臺對數據處理的投入,也可免去日后運營與維護等支出;采用建立子公司的方式可更好地實現對數據質量的控制,子公司也可與其他電視平臺進行合作進而向母公司提供更為全面的數據分析。
為弱化個性化推薦營銷算法的固有缺陷,可采用組合推薦的方式。組合推薦可分為后融合、中融合和前融合幾種方式[7]。后融合方式是指多種推薦方式各自產生推薦結果后再將推薦結果進行對比和融合,最終決定為用戶推薦何種內容。中融合是指以一種推薦方式為框架,融合另一種推薦方式。前融合是指將不同的推薦方式融合到一個框架中進行綜合分析,然后得出推薦結果。
后融合有兩種組合方式。一是將不同推薦方式產生的推薦結果進行評分而后確定所要推薦的內容,此時用戶看到的推薦內容包含了不同推薦方式的結果。二是將不同推薦方式產生的推薦結果各自進行評分,然后根據評分決定向用戶推薦何種內容,此時用戶收到的推薦是來自于某一種推薦方式的推薦結果。后融合組合推薦方式能夠最大限度地保證推薦節目的合理性,并且可以降低推薦系統的復雜程度,節約成本。
中融合需以一種推薦方式為框架,本文以使用基于內容的推薦方法為框架同時融合協同過濾推薦方法為例進行說明。基于內容的推薦方法可合并簡化收集到的用戶觀看記錄、用戶評價等信息,而協同過濾則是依據簡化合并后的信息以及用戶性別、年齡等信息進行相關節目的推薦。這樣進行信息綜合后的推薦可減少數據稀疏帶來的推薦不準確問題,但需要較為復雜的運算系統。
前融合需將不同的推薦方法融合于統一的框架中,采用較為復雜的算法對信息進行綜合處理,從而得出最終的推薦結果。
需要指出的是,組合推薦能夠在一定程度上克服單一推薦方式的缺陷,可進行更為準確的推薦,更有助于電視平臺進行個性化推薦營銷,但對于冷啟動和數據稀疏性問題仍需借助外部數據來解決。
如前所述,若用戶長期接收相似推薦信息的刺激,可能導致其潛意識中繼續選擇相近內容的節目。此外,隨著系統的推薦和用戶的反饋,節目推薦會越發精準。若用戶長期接收并選擇相近內容,則可能導致其偏好變窄,新進入市場的節目因不屬于已知類型而無法被推薦,長期來看不利于電視平臺的健康發展。對此,首先應注意個性化推薦營銷算法的選擇。相較于基于內容的推薦方法,協同過濾和組合推薦的方式更能保證推薦的節目具有一定的區別性。這是因其所使用的數據為用戶群體數據,而用戶選擇是存在差異性的,這種差異性的存在可以幫助用戶發現存在差異的節目,從而降低用戶偏好的同質化程度。其次可通過人為干預的方式控制推薦節目的內容。即可在最終形成的推薦結果中,通過對系統的設定將其中一兩檔節目調節為相似系數較低、具有一定差異性的節目,以此方式推薦的節目不僅較為符合用戶觀看偏好,還能幫助用戶發現新的觀看偏好。同時,以用戶為導向的節目在制作過程中也應保持一定的差異性,盡量降低同質化程度。