刀刀



4月1日,百度給我們講了一個高大上的愚人節玩笑,一鼓作氣發布了四項“神技”:能甄別食材安全,幫助用戶掌握食品信息的“筷子”——百度“筷搜”;能可視化還原夢境的百度dulife手環;對著手機吹一口氣,就能檢測出身體健康狀況并得到專家診斷和健康指導的百度iBreath;以及能模擬觸覺、嗅覺等感覺的百度視頻4D觸感技術——在介紹這項技術的視頻里,姑娘因為通過屏幕“摸”到了都教授的臉而興奮不已。而天真的網友在發現根本無法下載到“百度視頻4D版APP”后,憤而在“百度知道”里留言道——“你,們,騙,我!”
有人說,四項神技的發布是百度工程師患上了集體臆想癥。也有人覺得,這是個認真的玩笑,其中暗示了百度的發展大計。
百度當然是認真的——至少“百度視頻4D”在這一天的玩笑中收獲了百萬級的點擊和關注。
百度視頻PC端搜索于2007年上線,百度視頻移動客戶端(百度視頻App)于2011年發布。截至目前,百度視頻App累計用戶突破2億,日均搜索播放量超過1億次。但一般用戶只把它看作是百度搜索框上方眾多標簽中的一個,或手機里眾多視頻APP應用工具中的一個——而實際上百度視頻搜索是技術圈的產物,嚴格意義上來說,并非視頻圈的玩家。
但在百度“大數據引擎驅動未來”的發展戰略下,作為高冷技術控的百度視頻搜索,如今有了更強的動力,“讓用戶在搜索視頻時感受到技術帶來的神奇變化”,也有了更強的欲望,通過大數據的挖掘來與娛樂行業深度互動。
我們有大數據,你知道嗎'
“通過用戶的搜索、瀏覽、觀看等行為,我們可以知道任何影視內容在任何時候的受歡迎程度。”胡一川說。
作為百度視頻技術負責人,胡一川在闡釋百度視頻的技術創新成果時提到,“用戶每天在百度視頻會進行數億次的搜索、瀏覽和觀看請求。借助搜索聚合技術,百度視頻能打通百度貼吧、百度知道等平臺,實現對大數據的全面匯聚。我們不僅可以知道任何影視內容在任何時候的受歡迎程度,而且,我們可以分析看這些影視內容的用戶的特征,例如:用戶性別、年齡、學歷,包括這個群體中男女的比例、年齡的分布等等。在對視頻用戶的觀看趨勢以及行為軌跡清晰把控的基礎上,借助大數據分析進行影視作品的市場決策、用戶挖掘、營銷推廣,能夠實現事半功倍的效果。”
直到今天,影視圈內外的許多人仍在津津樂道Netflix是如何利用大數據成就了《紙牌屋》——雖然也早有人指出,那不過是Netflix利用《紙牌屋》的成功包裝出來的一個美麗故事。但不管大數據與《紙牌屋》的制作有無關系,2013年,大數據技術的崛起與其熱情洋溢的自我宣揚,確實令中國影視行業對數據的認識有了一次“大躍進”般的進步,并且極大地提升了這個行業對大數據應用前景的期待。
雖然百度暫時還沒有向影視行業提供數據,但大數據未來將如何發展,很多人都把殷殷期待投向了百度。同時,技術和人才也都在涌向百度。
在加入百度前,胡一川是“今晚看啥”的聯合創始人兼CTO。“今晚看啥”于2012年6月上線,定位為電影搜索及個性化推薦引擎。2012年11月下旬,“今晚看啥”由百度收購,并入百度垂直搜索業務體系。胡一川則開始全面負責百度視頻的數據挖掘與個性化推薦相關項目的規劃、設計與實施。而“今晚看啥”所做的事情,與百度視頻搜索如今正在做的事情,頗有共通之處。當然,后者的格局、野心都更大。
極速,低流量,并且知道你想看什么'
在4月份的技術分享會上,百度視頻發布了幾項能夠提升用戶體驗的創新技術成果,包括極速視頻搜索技術、視頻連環畫播放技術、百度視頻影視基因庫及其鉆研已久的個性化推送技術等。
百度視頻想告訴大家,在你點擊搜索按鈕之前,搜索行為其實就已經開始了。極速搜索技術能夠通過百度的大數據計算能力預測用戶的搜索結果,請求和獲取相關信息。在保證搜索的可靠性和穩定性的基礎上,極速搜索系統可將用戶的視頻搜索請求時間縮短至原來的十分之一,并且擁有非常高的預測準確率。
受網絡環境限制,用戶觀看視頻時經常會出現緩沖不及時的卡頓情況,影響用戶的觀影體驗。針對這一現象,百度視頻開發了“連環畫模式”技術,這項技術會根據當前視頻的信息截取視頻的關鍵畫面,對關鍵畫面進行排序,生成圖片庫。在因視頻緩沖不及時、無法正常觀影的時間段,百度視頻會根據播放請求,從畫面庫中讀取對應的關鍵畫面進行播放 ,以“連環畫”的形式展現視頻內容,讓用戶在消耗最少流量的情況下可以用最短的時間獲取視頻的基本信息。據悉這項技術已申請專利,預計很快將正式上線。
百度視頻“影視基因庫”的建立,則類似于Netflix對電影作品所做的“微類型”分類。但百度視頻的操作方式與Netflix迥然不同。據悉Netflix 為旗下所有電影作品共計配置了七萬多種標簽組合,并雇傭了大量人力經過訓練之后來為每一部作品貼標簽。百度視頻則是首先咨詢了影視行業內的研究人士及深度用戶,了解并確定了有哪些標簽可以用于描述視頻內容,然后再采用技術算法來給視頻貼標簽。
比如,當用戶搜索某個類型的視頻時,百度視頻的初期反饋結果不一定能夠滿足用戶的需求。比如用戶搜索“高智商科幻電影”,百度反饋的結果可能只是那些描述中帶有“高智商”或“科幻”的電影。但搜索了這個關鍵詞的用戶,最終還是會得到某些搜索結果。如果某個結果是錯誤的,那么用戶在點開視頻后就不會完整觀看視頻(很快就會關掉),這一動作就證明了這部電影肯定不符合“高智商”、“科幻”這兩個標簽中的一個。
通過建立完整的“影視基因庫”,結合百度的自然語言處理技術,百度視頻就能夠智能理解用戶的需求。比如用戶搜索“和動物有關的電影”時,系統會智能推薦《忠犬八公的故事》、《馴龍高手》等獲得海量用戶好評的動物相關影片。甚至當用戶不知道想看什么影片時,都可以搜索“好看的電影”,系統將從觀影人數、評分高低等維度給用戶推薦優質影片。
同時,用戶的搜索行為分析證明,很多用戶會通過不斷增加關鍵詞的方式來尋找自己想要看的視頻。例如,用戶會先搜索“鄭多燕”(韓國健身明星,減肥操辣媽),然后再搜索“鄭多燕 甩油操”、“鄭多燕 豐胸收腹”等關鍵詞的組合,來尋找想看的視頻。同時,從數據中發現,對于一個給定的關鍵詞,用戶會對某幾個特定關鍵詞組合特別感興趣。基于此,百度視頻可以事先將這些特定的關鍵詞組合挖掘出來,將視頻進行結構化的標記和分類。在用戶搜索一個關鍵詞時,百度視頻會將與其相關的關鍵詞組合展現出來,令用戶更加便捷地發現想看的視頻。數據顯示,經過智能推薦,視頻列表的點擊率高于傳統列表頁3倍以上。
此外,百度視頻App通過分析用戶在手機、平板上的搜索、觀看視頻的行為,還為用戶自動發送個性化的消息推送。例如:當用戶最常觀看的電視劇有最新集時,百度視頻App會自動給用戶同步推送;如果用戶經常觀看新聞類短視頻,百度視頻App會及時提示國內外的重點新聞;而對于體育迷來說,百度視頻App則會將重大賽事第一時間呈現給用戶。百度視頻期望運用大數據技術,為每位用戶打造出屬于自己的個性化視頻觀看平臺。
百度開放數據合作'
如今,百度已將大數據升級為公司戰略。
在4月24日的百度技術開放日上,李彥宏為百度大數據引擎站臺,百度將用數據合作的方式來幫助和改造傳統行業。對此,互聯網觀察者羅超解讀稱,“百度將大數據引擎做成一個開放平臺,形成標準的接口,讓每個行業不同企業可以根據自身需求各取所需。而它的首要目的是獲取數據,然后是考慮變現。變現方式可能是增值服務、收費云、數據分析結果、技術咨詢等方式,這將改變百度盈利模式過渡依賴‘搜索廣告的現狀”。
羅超指出:“大數據已經給Google每天帶來2300萬美元的收入,一年約為82億美元。這已經遠遠超過百度2013年51億美金的年收入了。因此,如果百度大數據引擎能夠成功,很可能會為之帶來源源不斷的數據以及現金流。”
憑借在大數據方面的長期積累和沉淀,如今,百度終于決意開辟新的戰場。
作為百度系的一員,百度視頻的大數據也將為用戶/客戶提供從智能推薦到數據分析的多面服務。百度視頻未來產生的數據,對于影視產業鏈各個環節的市場行為,也必將產生重要影響。但前提是,“百度視頻能在未來充分利用好百度的大數據資源,恰到好處地運用到用戶體驗的改善上去,讓用戶習慣于把百度視頻當作入口,精準找到自己想要的影視內容,甚至精準找到UGC內容”。互聯網分析師葛甲認為,“這個目標實現起來任重而道遠,但卻是百度視頻唯一的正確方向,也是大數據從漂浮狀態落地的為數不多的落腳點”。
據悉,百度近期已低調上線了一款新的大數據產品“百度預測”(http://trends.baidu.com/),目前可提供景點舒適度預測、城市旅游預測、流行感冒預測等信息查詢,未來則有望推出電影票房預測等服務。可以肯定的是,未來互聯網的發展必將極大地改變影視內容的制作、觀賞和視頻消費市場的分享。大數據在其中的作為則更加令人期待。