李閃閃
摘 要 2018年4月,今日頭條因為平臺涉及低俗、色情等內容接連接受整改,這讓我們在感嘆其可以提供“精準化、個性化、定制化”內容的同時,也不得不去思考個性化推薦新聞客戶端在大數據時代面臨的困境問題。文章借鑒拉斯維爾的“5W理論”研究思路,對今日頭條平臺“信息來源——信息把關、處理——信息推送后的結果”的傳播過程進行線性分析,對其遇到的困境進行了5點梳理,以求引發個性化推薦新聞客戶端的思考,并不斷做出改進。
關鍵詞 大數據時代;個性化推薦;新聞客戶端;困境分析;今日頭條
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2018)212-0130-03
1 問題研究背景
1.1 大數據時代背景
1.1.1 大數據
關于大數據的定義眾說紛紜,對大數據的理解取決于定義者的態度和學科背景。有關大數據的特點,行業內比較認可的有以下4點:Volume(規模性)、Variety(多樣性)、Velocity(高速性)、Value(價值性)。大數據的規模性、多樣性對應于當今時代信息的海量化、多元化。紛繁復雜的信息時代,規模化的數據信息可以快速生成、在人與人之間急劇傳播,對這些數據進行挖掘又可以產生不可估量的價值,這又恰與大數據后兩個特性不謀而合。
1.1.2 大數據催生個性化新聞推薦
傳統上的新聞客戶端,多是通過人工篩選、編輯信息,基于用戶的共性需求推薦同樣的新聞內容,即共性化推送。大數據時代的到來和科技的進步使得個性化新聞推薦成為可能。北京字節跳動科技有限公司就是在這樣的時代背景下,充分發揮其敏銳的嗅覺,開發了今日頭條——一個基于數據挖掘的個性化信息推薦引擎。從2012年9月開發第一版推薦系統以來,今日頭條緊跟大數據時代的腳步,成為個性化推薦系統行業的先驅和佼佼者,其新聞聚合、分發模式很好地解決了大數據時代信息過載的問題。
1.2 今日頭條接連接受整改
2018年4月,今日頭條以極不情愿的姿態上了頭條。4月4日,國家廣播電視總局約談今日頭條,要求立即整改,全面清查庫存節目;4月9日,應用市場下架今日頭條客戶端,并暫停服務三周;4月10日,今日頭條永久關停旗下“內涵段子”客戶端及公眾號;4月11日,今日頭條下的抖音App刪除了所有用戶評論。在此之前,今日頭條也受到過類似的處理。2017年12月29日,北京市網信辦就曾針對今日頭條持續傳播色情、低俗信息約談企業負責人,責令企業立即停止違法行為。大數據時代下,個性化新聞推薦使得點對點(P2P)的傳播更精準,但也帶來了一些問題,值得我們思考和研究。
2 今日頭條困境分析
拉斯維爾的“5W理論”向我們展示了新聞信息傳播的過程:Who?says?what?in?which?channel? to?whom?with?what?effects,這為本文研究的問題也提供了一個很好的線性分析思路。從今日頭條聚合新聞信息到推薦到用戶的手機客戶端界面,經歷了一個“信息來源——信息把關、處理——信息推送后的結果”的過程,因此筆者按照這個流程對今日頭條面臨的困境進行了以下五點分析。其中針對“平臺信息來源”,進行了第一點分析,針對“信息把關、處理”,進行了第二、第三點分析,針對“信息推送后的結果”,進行了第四、第五點分析。
2.1 聚合各平臺信息,引來版權糾紛
2014年以來,廣州日報等多家媒體曾聲稱今日頭條侵犯版權,2017年5月2日,《南方日報》也發表公告指責今日頭條竊取自家新聞。針對侵權問題,今日頭條負責人曾以各種理由抗辯,打法律擦邊球,但也有不少業內人士認定今日頭條構成侵權。IT法律專家趙占領指出:今日頭條構成侵權主要涉及兩種方式,一是深層鏈接,二是采用轉碼“優化”的方式進行轉載。這兩種轉載方式都沒有將原有網頁進行完全呈現,因此涉嫌侵權[ 1 ]。筆者了解到,今日頭條在對信息進行處理時,可能將原有媒體頁面進行“優化”、更改媒體來源、改變網站原有設計、屏蔽廣告,這也給趙占領專家的解釋提供了事實依據。
一直以來,新媒體之間,傳統媒體與新媒體之間都不斷存在版權紛爭。在信息就是財富的“流量變現時代”,媒體平臺要有版權意識、法律意識,今日頭條要認真處理平臺信息來源問題,盡量避免再次陷入版權紛爭。
2.2 機器代替人工,造成把關的缺位
今日頭條創始人張一鳴一直堅持把大量資金投入到技術研發領域,以求用更精密的機器和更準確的計算模型,把用戶的興趣算得更快、更好。重視算法技術的運用,可以提高工作效率,節省人力資源,但機器完全代替人工,也會造成一定的把關缺位。
2.2.1 把關缺位,導致大量低質內容泛濫
作為反映意識形態的精神產品的生產者,新聞媒介從屬于上層建筑范疇,可見新聞產品在傳達意識形態、弘揚社會價值觀上具有重要意義。今日頭條雖然不是信息生產者,但其作為新聞產品的運輸者,也理應做好把關作用,確保傳播內容的真實性、積極性、正面性。機器人進行把關,大都是針對新聞信息的自身特性進行分發,例如文化類、娛樂類、科技類、生活類等,很難對信息內容的優劣、價值觀導向進行審核、篩選,因此很可能會傳播一些色情、低俗的信息。低質內容的泛濫,會對用戶產生不良的引導,這也正是前不久國家責令今日頭條整改其平臺內容的原因所在。
2.2.2 算法推薦,導致新聞價值喪失
國內外關于新聞價值的討論眾說紛紜,標準不一。一般較為流行的是美國希伯特(《現代大眾傳播工具概論》作者)和麥克道格爾(《闡釋性報道》作者)提出的新聞價值五要素:時效性、接近性、顯著性、重要性、人情味[2]。個性化信息推薦系統利用數據挖掘、算法分析對新聞信息進行整合分發,在對新聞價值的選擇上完全依據用戶的后臺使用行為。數字化的用戶數據很難于與新聞價值的五要素聯系起來,以此作為評判新聞價值的依據,就很難去推送重要及時、重要有用有趣的信息,一定程度上會造成新聞價值的喪失。
2.2.3 機器把關,媒體難以承擔社會責任
任何新聞媒體都具有與生俱來的公共性,新聞媒體的公共性要求媒體承擔必要的社會責任,以公眾的公共利益為優先目標,或者說公共利益至上是新聞媒體的第一訴求[3]。在今日頭條算法技術的背后,是機器所做的枯燥的、冷冰冰的數學計算。只以數字化的計算結果作為后期推薦的依據,媒體自身不對內容進行把關,則不容易選出公共利益至上的信息。機器沒有人類情感,沒有社會歸屬感,自然很難判斷哪些信息對社會有益,哪些有害,完全用機器進行把關,媒體很難承擔應盡的社會責任。
2.3 平臺信息繁雜,內容可能處理不當
今日頭條的主要“生產方式”,是廣泛搜索、采集新聞網站、門戶網站、自媒體平臺或者社區等的信息,然后通過一定的算法將抓取到的有價值信息推送給用戶。人工智能時代,算法的確代表著先進的生產力,但算法不是萬能的。因此面對海量的數據信息,即便是擁有先進技術的數據算法,在內容處理上也可能存在問題。
2.3.1 更新頻繁,新聞碎片化閱讀嚴重
今日頭條根據用戶使用特征、使用場景進行個性化推薦。使用特征包括用戶瀏覽新聞的時長、刷新網頁的速率,還有點贊、轉發、評論等行為,根據這些個人特征實現真正的私人定制。除此之外,基于GPS系統,用戶在不同的使用場合也會收到不同的推薦。用戶的使用行為變化莫測,使用場景不斷變化,這都使得平臺上的信息更新頻繁。試想一下,如果在不連續的時間內打開網頁看到的新聞都不一樣,上次閱讀的新聞還沒保存就刷新掉了,就不能實現連續性閱讀,新聞碎片化閱讀現象嚴重,給用戶帶來不便。
2.3.2 標題黨新聞泛濫
繁雜的平臺信息使得內容處理成為難題,想要得到更多用戶的關注,不僅要在內容方面著手,在新聞展現形式上也要加以改進,這就催生了大量標題黨新聞的產生。或是通過聳人聽聞的題目吸引眼球,或是用明星的奇聞軼事來做噱頭,再或是借助“掛羊頭賣狗肉”這樣題文不符的方式來贏得關注,大數據時代的聚合類新聞平臺泛濫著太多標題黨新聞。這樣只求流量、不講質量的方式,難以提高顧客忠誠度,形成極高的用戶黏性,也不利于企業形象的塑造。
2.3.3 容易重復推薦相似內容,浪費用戶注意力
個性化推薦系統基于“新聞內容+數據化精確制導”的方式給用戶提供私人定制化信息。一方面,算法技術通過分析用戶個人基本信息、興趣特征、使用特點等來給不同用戶提供信息;另一方面,用戶通過不同的標簽主動選擇自己喜歡的信息內容來滿足自身需求。一旦喜歡的內容確定下來,機器在下次就會完成自動推薦。海量信息的不易處理,再加上標簽分類的有限性,導致容易重復推薦相似內容,用戶重復觀看相似的新聞信息,嚴重浪費了注意力。
2.3.4 多為直接轉載,內容不深刻
今日頭條平臺上的新聞多為直接轉載,沒有對新聞內容進行二次加工就呈現給用戶。這種運作方式對于內容相對獨立的娛樂新聞無可厚非,但對于一些涉及重大事件的政治新聞或是專業性比較強的經濟新聞,如果不專門進行特殊的專題式整合、專題式推送,就不利于用戶全面了解重大新聞事件或新聞話題,內容也失去了深刻性。
2.4 個性化信息推送,形成“信息繭房”
凱斯·R·桑斯坦在2006年著作《信息烏托邦——眾人如何生產知識》中,提出了“信息繭房”的概念:信息傳播中,因公眾自身的信息需求并非全方位的,公眾只注意自己選擇的東西和使自己愉悅的通訊領域,久而久之,就會將自身桎梏于像蠶繭一般的“繭房”內[4]。今日頭條的個性化推薦服務讓每個人都擁有為自己量身定制一份個人日報的可能,但這種行為也導致了“信息繭房”的形成。
2.4.1 信息窄化,阻礙個人認知世界
今日頭條依據不同的用戶畫像進行新聞推送,用戶毫不費力就能看到自己感興趣的內容。一方面,當個人禁錮在自己所建構的信息繭房中,久而久之,個人生活就會呈現一種定式化、程序化。另一方面,長期處于過度的主動選擇中,沉浸在個人日報式的滿足中,個人信息逐漸窄化,失去了解不同事物的機會和能力,也會阻礙個人客觀全面地認識世界。
2.4.2 社會黏性喪失,不利于社會發展
在網絡信息時代,社會是一個個原子式的用戶的集合體,用戶的行為與社會發展息息相關。算法技術的應用,使得每個用戶都擁有一個私人定制式的個人主頁,達到了真正的千人千面。精準化的推送使得每個人處于自己的信息格子中,如若長期不接收相似的新聞內容,在發生重大公共事件時,就會妨礙社會共識的凝聚和公共議程的設置,也不利于公共事件的解決和公共政策的出臺。
2.4.3 助推網絡群體極化
群體極化這一論點最早是詹姆斯·斯托納在1961年提出的,是指在群體中進行決策時,人們往往會比個人決策時更傾向于冒險,向某一個極端偏斜,從而背離最佳決策。雖然今日頭條的用戶在接收信息上相對獨立,但是新聞下面的評論、回復、分享、關注等功能在獨立的用戶之間架起了溝通的橋梁,容易形成一個個網絡群體。原子化的個人聚集在一起會產生強大的呼聲,面對公眾事件,群體可能會做出更冒險、更極端的行為,再加上網絡的匿名性,這種群體極化現象會越來越嚴重。
2.4.4 個人接收信息的“回音室效應”
桑斯坦曾指出:由于人們只說或只選擇愉悅自己的通訊領域,久而久之,具有相似想法的人都能并且的確把自己歸入他們設計的回音室,制造偏激的錯誤、過度的自信和沒道理的極端主義[5]。長期接收相似信息的用戶,信息窄化,容易造成思維模式的固化,認知世界的積極性、創新性可能也會隨之減弱;眼光永遠局限一隅,坐井觀天,以為自己接受的信息都是正確的、自己的觀點都是無誤的,這樣長期的盲目自信從長遠角度來看對個人、對社會都是不利的。
2.5 用戶信息可二次利用,個人隱私容易泄露
今日頭條的內容分發平臺是基于移動端的,集社交、搜索、場景識別、個性化推送、智能化聚合為一體的智能算法平臺,這種算法平臺的背后是打包儲存的用戶數據。在眼球經濟時代,用戶流量就是金錢,用戶數據的價值已不再單純來自于它的基本用途,而更多來自它的二次利用。一旦打包好的用戶數據遭到泄露,會產生嚴重的后果。經官方統計,截至2016年10月,今日頭條累計激活用戶達到7億。如此龐大的數據信息一旦遭到泄露,被不法分子利用,對個人乃至社會都可能是一場災難。
大數據時代,個人隱私數據的保護成為一個棘手的問題,面臨著內憂外患。內憂主要指的是企業內部,可能出現四種不同形式的泄露:信息的收集、誤用、二次使用和未授權訪問;外患主要指的是外部人為了獲取數據,通過系統的漏洞對數據進行竊取。[6]由此可見,大數據時代,個人隱私變得數據化,個人隱私的泄露方式更隱匿、更多樣。因此今日頭條作為廣大社會群體認識世界的窗戶,不僅要承擔提供信息的責任,還要保護好用戶的個人隱私,這樣才能值得用戶信任,進而提升媒體的公信力和影響力。?
3 結論
大數據時代下,個性化新聞推薦系統通過算法分析、精準推送很好地解決了信息過載的問題,但純技術化的信息分發方式也帶來了“侵犯版權、把關缺位、信息處理不當、信息繭房、個人隱私泄露”諸多問題。今日頭條等個性化推薦新聞客戶端應該意識到自身所處的困境,提出有針對性的解決方案,這樣在競爭激烈的新聞市場,才能永遠保持領先地位。
參考文獻
[1]趙剛.“今日頭條”:行走于創新和版權之間[N].光明日報,2014,6(10):10.
[2]郝雨.回歸本意的新聞價值研究[J].上海大學學報社會科學版,2006,13(6):69-74.
[3]李良榮.新聞學概論[M].上海:復旦大學出版社,2015:141.
[4]梁鋒.信息繭房[J].新聞前哨,2013(1):87.
[5]凱斯·R·桑斯坦.信息烏托邦——眾人如何生產知識[M].北京:法律出版社,2008.
[6]劉雅輝,張鐵贏,靳小龍.大數據時代的個人隱私保護[J].計算機研究與發展,2015,52(1):229-247.