余忠華
(上海工程技術大學管理學院,上海 201620)
人工智能發展之迅速令人驚嘆,已成為當下最受關注的新技術之一。目前,人工智能廣泛應用于各領域,如人臉識別、智能推薦、語音輸入、語音翻譯、聊天機器人、智能家居等。其在社交方面也起到了越來越明顯的作用,如雨后春筍般發展起來的相親交友軟件就是一個例證。類似于購物網站上的“猜你喜歡”功能,向用戶推薦意向產品;陌生人社交平臺會根據后臺算法與大數據,匹配符合用戶擇偶標準的其他用戶,幫助用戶尋找心儀的另一半。這項應用雖然存在諸多問題,如匹配無法做到完全精準、匹配過程涉及個人安全隱私等,但其無疑為人類生活帶來了極大便利。數字經濟蓬勃發展,科技進步日新月異,然而人們普遍面臨較大壓力,交際圈十分有限,根據2018 年6 月《第一財經周刊》發布的《都市人壓力調查報告》,有43%的人認為他們承受的壓力“超標”了。這從側面反映出,現代人的生活、工作、學習壓力較大,人工智能通過算法匹配輔助人類尋找戀愛對象,既能協助人類提高匹配效率,也能在一定程度上緩解人類的相親交友壓力。根據中國青年報社社會調查中心聯合問卷網的一項對1 962 名處于適婚年齡的單身青年進行的調查顯示:70.9%的受訪單身青年看好大數據在青年相親交友領域的應用,77.9%的受訪單身青年有興趣使用大數據婚戀交友平臺,56.8%的受訪單身青年認為大數據能解決當下青年對另一半訴求模糊的問題。
人工智能在婚戀相親交友中起到的作用可以總結為以下幾個主要方面:①人工智能的海量數據拓寬了人們的交際圈,大數據本質上是一種信息資產,正因為信息基數大,在某一具體領域中,能夠涵蓋的范圍極其廣泛,基于一個人的人際圈子不可能無限制擴大,因而這些適婚青年只能在自己現有的人際圈子里選擇配偶。大數據則有效地克服了該問題;②人工智能的高時效性促進了數據的有效性,大數據的特點是實時更新,實現從靜態數據到動態數據的轉變,提高數據時效性,繼而增強數據的可參考性;③人工智能的精確匹配能提高交友效率,這種較為精確的方式可以減少大量的前期時間成本和金錢成本,也極大減少了這些成本淪為沉沒成本的可能性,可在一定程度上提高找到合適伴侶的機率。
為了深入淺出地理解人工智能應用于婚戀交友的關鍵部分:如何進行篩選與匹配,可以參照購物網站的推薦算法,即如何“猜”用戶喜歡,從而向用戶推薦。在購物網站的后臺中,每一位用戶的信息其實是巨大表格中一行一行的數據,這行數據記錄了用戶在網站上瀏覽、購買、退貨、收藏的商品歷史。其他用戶的數據也是如此,每當有瀏覽行為或購買行為等發生,數據就會實時改變,不斷更新。推薦系統會通過各種算法對用戶數據進行收集與處理。目前,推薦系統中應用的核心技術是個性化協同推薦[1]。根據調查數據,美國著名在線零售商在采用個性化廣告推薦系統后廣告點擊率提升了兩倍,銷售額增長達20%~30%;亞馬遜的銷售額中有35%來自系統推薦;You?Tube 有60%的視頻點擊率是由主頁推薦轉化而來;Netflix電影觀看率有80%得益于公司的推薦系統;淘寶和百度的廣告推薦系統可為公司增加100 億元以上的收入;今日頭條發展之迅速離不開推薦系統的作用[2]。
個性化推薦系統主要解決龐大的信息量篩選、信息過載以及用戶搜索商品的問題,可以較高速率獲取用戶感興趣商品的主要信息[3]。推薦系統主動幫助用戶找到感興趣的內容并進行推薦,主要涉及預測與推薦這兩個關鍵問題。預測即系統應盡量精準地對用戶喜好作出預測,推薦指系統應根據預測結果將盡可能接近用戶喜好的商品及內容推送給用戶。由此可見,推薦環節的依據是由預測環節的結果而來,因此多數推薦算法主要研究預測環節的問題[4]。推薦系統之所以能夠做到較為精細的個性化推薦,是因為系統會跟蹤每個用戶在網站上的軌跡,包括瀏覽、購買、好評等行為,然后經過“協同”計算,分析出單個用戶的“個性化”偏好,再向用戶推薦符合其偏好的商品。國內對于這種個性化推薦系統的應用早已取得明顯成效,如淘寶網等一些電商網站,利用個性化推薦系統收集用戶購買行為產生的記錄、瀏覽行為產生的軌跡、評價行為產生的數據等[3],加以整合與計算進而對用戶需求作出預測與推薦,有效增強了用戶的購物體驗。這種基于協同計算的分析,遠遠復雜于針對關鍵字的分析。婚戀交友平臺采用的也是這種技術,通過分析用戶個人微博、微信等社交媒體,以及瀏覽的網頁、喜歡的電影等網絡足跡,從眾多信息中提取出關鍵信息,分析其戀愛觀、婚姻觀、性格、價值取向;還有根據各大電商的購物記錄判斷一個人的消費能力和生活習慣等。推薦系統主要由用戶、用戶模型和推薦對象模型以及推薦引擎4 部分組成[5]。基于此,采用AI 和機器學習幫助人們配對,在挖掘用戶的社交媒體數據后,用后臺算法分析數據,然后為最合適的兩個人相互推薦。推薦系統確實可以有效緩解信息過載問題,但仍存在準確性、稀疏性以及數據冷啟動等問題[4]。
隨著推薦系統廣泛應用于各領域,如亞馬遜網站的書籍類推薦系統[6]、Netflix 電影推薦系統[7]、Jester 的笑話推薦系統[8]和Facebook 朋友推薦系統[9]等,推薦系統中的重要技術,即協同過濾方法的研究備受關注。協同過濾算法有兩種:基于內容的協同過濾算法和基于模型的協同過濾算法[10-11],兩種協同算法分類如圖1 所示。較為簡單的協同算法如Grouplens 和Ringo[1],都是基于用戶關聯的。這種算法原理是根據兩個用戶之間擁有的一致性意見的量,計算這兩個用戶之間的“距離”,即用戶之間的相似度[12]。對通過這種“距離”找出來的偏好相近的用戶進行預測,預測范圍被稱之為共享的鄰域[1]。如李琳等[13]將評分矩陣和評論文本相融合以提高推薦質量。另一種協同算法是基于模型參數[14],即首先利用評分數據對模型參數進行估計,繼而利用事先訓練好的模型對評價數據進行預測處理。模型選擇視具體情況而定,常用數學模型有貝葉斯網絡模型、隱語義模型、潛在因子矩陣模型、基于概率的矩陣分解方法等[15-19]。現有推薦算法具有一定局限性,因為并不是所有事物都具有被用戶給出意見的信息,人們也常會對同一事物給出多種看法,并且這種計算出來的“距離”很容易隨著用戶的網絡行為而改變,即時計算意味著計算量十分龐大,可能導致返回的推薦結果不夠準確。因此現實情況中,婚戀交友平臺的智能匹配結果并不總是樂觀,時常有不符合用戶心理預期的匹配結果出現。

Fig.1 Collaborative filtering algorithm classification圖1 協同過濾算法分類
學者們和算法工程師們將協同算法進行不斷優化與改進,以求使得協同過濾技術更加完善,從而達到計算更加準確、匹配擬合度更優、推薦結果更加精準的目的。協同過濾技術的原理是基于已存在的用戶群已經發生的商品選擇軌跡,去預測用戶最偏好最中意的商品。其計算目標是針對用戶之間或項目之間相似度與預測評分的計算,計算流程如圖2 所示。這項技術不完全依賴于商品本身信息,即使存在商品信息缺失情況,也仍然可以根據最鄰近用戶的偏好信息進行預測與推薦。協同過濾技術存在的問題是當用戶量急速增長時,用戶空間較大,用戶數據暴增,計算用戶之間的“距離”進而搜索最鄰近用戶的這一目標便可能無法達到較理想的時效性。為了解決這類問題,國內外許多學者進行了研究與實踐,提出了一些協同過濾算法的改進算法。例如,基于極端評分行為的相似度計算[20]、基于螢火蟲聚類的協同過濾推薦算法[21]、融合用戶興趣和評分差異的協同過濾推薦算法[22]、融合知識圖譜和協同過濾的推薦模型[23]等。

圖2 協同過濾算法一般流程Fig.2 General flow of collaborative filtering algorithm
智能推薦算法中,除協同過濾技術外,還有一些其他算法可應用于婚戀交友匹配中。如基于語義的推薦,已逐漸成為當下研究的熱點。基于語義的推薦不強調字面上的匹配,而是對于語義進行近似匹配或引申義匹配,平臺通過用戶碎片式的網絡行為,推測用戶背后的意圖、場景與動機[24]。越來越多的模型將用戶行為與語義兼顧考察,目前較具有代表性的是隱語義模型。隱語義模型可以理解為是隱含語義分析技術。這項技術的本質在于通過對數據進行分析,找出潛在隱藏的分類或者主題[25]。此模型是從用戶行為數據中自動找出分類規律,然后進行合理的個性化推薦[26]。隱語義模型的核心思想是將用戶與物品映射到同一隱含特征空間內,根據用戶興趣與物品之間隱含的特征關系將兩者建立起聯系[27],并進行自動聚類[28]。隱語義技術最初應用于文本挖掘領域,在取得較好效果后,得到進一步發展并逐漸應用于其他領域。發展到如今,隱語義模型已經產生了一些著名的方法與模型,如LFM(Latent Factor Model)、LDA(Latent Dirichlet Alloca?tion)、矩陣分解等[27]、基于奇異值分解(SVD)[29-30]等。應用隱語義模型的前提是,假設每個用戶都有屬于自己的、與別人不同的偏好與選擇傾向。分析可知,婚戀交友符合這一假設前提。首先以書籍為例,一個用戶在選擇書籍時,可能對歷史類、科幻類、懸疑類、軍事類等書籍有特殊的選擇偏好,這些偏好就可以抽象為一個個的隱變量。對于每一本書而言,每個隱變量上的權重指標綜合起來,就可以構成用戶對這一本書的偏好程度。針對婚戀交友平臺,每個平臺上的用戶擇偶標準或條件要求,可以抽象為數個隱變量,例如有人對于交往對象的職業要求是從事教育類,或醫療類;有人對于女朋友的要求是內向型性格,或是外向型性格;而對于性格的分類,更適合用隱語義模型實現,比如將一個人的社交活動、手機使用的軟件、網頁搜索的內容、專業及工作經歷等,將每一項內容都抽象出對應的隱變量,然后根據計算分析,得出一定的權重指標,進而分析出這個人的性格類型。這樣可以在一定程度上解決人的性格難以量化分析的問題,并且能夠提高匹配合適度。
數據處理過程即數據輸入到數據輸出的過程,在此過程中,輸入的數據會對輸出的數據造成限制。對于機器學習算法而言,輸出的結果受訓練集數據的影響十分顯著。溫德爾·瓦赫拉的書中提到,“在機器習得越來越像人的語言能力的過程中,它們也正在深度地吸取人類語言模式中隱含的種種偏見”[31]。因而會存在這樣的問題:算法在一定程度上吸納了某種價值觀,那么其價值觀并非中立。這種價值觀由訓練數據集而來,更嚴格意義上講是受訓練數據來源方或是數據生產者的價值觀影響。目前,許多企業可以通過算法輕易了解到用戶偏好與需要,為了提高用戶量,吸引更多用戶關注,就會利用算法向用戶推送用戶想要的商品或其他信息。對于婚戀交友平臺而言,也存在這種做法:為了將用戶留在其平臺,只向用戶推送用戶偏好的婚戀對象候選,這樣,用戶在此平臺中看到的就只是一個充滿著自己喜歡的交往對象的網絡世界,而不是有著多樣化人類的真實世界。長此以往容易陷入對世界的錯誤認知。關于此問題,有學者總結為:“算法應該給你想要的,還是給你應該要的”[32]的問題,并且也提出,該問題目前存在很大爭議性。一方觀點認為,算法本身應該是中立的,不應該帶有某種價值觀,好的算法應將用戶自己想要的提供給用戶即可;而另一方觀點認為,算法本身應該傳遞一定的價值觀,不僅應該迎合大眾的心理需要,還應該對人的思想有一定的正向引導。隨著人工智能的發展,人與世界的認知關系可能會發生改變且帶來巨大影響,對世界的認知在于人的主動認知,在人工智能發展到一定程度后,人將更多的任務交付給機器與算法,包括交友推薦,人對世界的認知途徑是否會改變,認知來源是人還是算法[24]。目前,該爭議尚無定論,可以設想出,這種爭論在未來還會持續。
在網絡平臺進行個人信息搜集,需要重點關注的問題是如何平衡信息獲取與信息保護以及如何平衡用戶隱私與人格保護。婚戀交友平臺的匹配計算過程會收集其他關聯的各種應用平臺的用戶數據,用戶在使用這些應用平臺時,或多或少地會在不經意間將個人隱私信息提交到平臺上,共享到互聯網空間,導致個人隱私泄露,其會因技術的愈發智能化而變得更加難以查證與控制。并且,該問題還存在著辯證性矛盾:一方面,人們希望各種婚戀交友平臺應盡可能地保證用戶個人信息與個人隱私不被泄露;另一方面,人們也希望算法在變得越來越智能的同時,應盡可能地兼具透明性、可解釋性與可理解性[33]。但是這對矛盾是難以調和的,尤其是人工智能算法有一定的挖掘性與學習性,會基于原始程序自動編寫更多代碼,即人工智能以計算機或其它物體(比如具備生物特性的傳感器)為載體,自主根據所處不同環境而自發編寫程序或指令,產生一個合適的算法并自主執行[32]。這樣就難以保證算法可以如人類預設的目標一般,完全產生出意料之中的、合乎道德的結果。由于算法能夠自發編寫程序、調整參數,對于個人隱私泄露就難以監控。對婚戀交友平臺而言,用戶在使用平臺的智能推薦功能獲取更多選擇的同時,自己的信息也會被推送給更多陌生人。此外,還會涉及敏感信息,如宗教信仰、性取向等,對于婚戀匹配而言是必要性信息,在其他網絡平臺則為非必要信息。但算法在收集與計算數據時是否能夠正確區分敏感信息與普通信息尚待考察,不能有效區分則會導致個人敏感信息泄露[24]。即便婚戀平臺可以設置某一部分信息不顯示,但匹配越精準意味著算法的智能性越高,而算法智能性越高也許就意味著存在著更大的信息安全風險。
2016 年,美國斯坦福大學發布了其“人工智能百年研究”的首份報告:《2030 年的人工智能與生活》[34]。該報告描述了目前人工智能相關技術、法律以及道德上的挑戰,并對產業界、學界、政界三方人士提供了人工智能技術、應用、政策上的指導與建議。這份報告中提到:“基于協同系統對模型和算法進行研究,以幫助開發能夠與其他系統和人類協同工作的自主系統。該研究依賴于開發正式的協作模型,并學習讓系統具備有效合作伙伴所需的能力。利用人類和機器互補優勢的應用正吸引到越來越多的關注——對人類而言可以幫助人工智能系統克服其局限性,對機器代理而言可以擴大人類的能力和活動”。
有理由認為,這將是人工智能與戀愛結合的未來趨勢。不得不承認,機器的智能與人類腦力的智能之間存在互補性,那么將人類的智能與機器的智能聯通起來,利用兩者之間的互補性,在本文觀點中,則是最為科學的發展方向。未來人機協同的新型智能信息系統,應當構建起雙向閉環的信息生態系統。在該系統中,原來的機器智能應具有足夠的自主性,能夠最大限度地為人類提供便捷服務,改善人類生活;而人類智能應與機器智能足夠相適應與包容,并互聯互通,人類可以感知人工智能信息系統的信息,人工智能信息系統可以讀取人類組織的信息,兩界之間實現信息的無縫交互。
這樣的發展趨勢符合人工智能與人類社會發展浪潮。為了實現這樣的信息系統,應以開放包容的心態接納人工智能在人們生活中的滲透。不管是婚戀交友還是生活中的其他方面,相信未來可以讓人工智能更好地為人類所用。
人工智能的產生與發展都源于更高效緩解或解決人類社會中的負擔或創新生活方式以促進社會進步,人工智能逐漸應用于人類生活的各種情景,其在互聯網婚戀交友平臺的出現與發展中扮演著至關重要的角色。互聯網婚戀交友平臺通過有效利用智能推薦算法,極大提高了人們交友的廣度與效率。但婚戀交友與網絡購物不同,算法需推薦的是人而非物,衡量的是較為復雜的情感而非單一偏好,故智能算法推薦只能充當輔助手段,應正確認識與定位人工智能婚戀交友;為使人工智能推薦成為更科學有效的交友途徑,應不斷改進推薦算法,致力于人機協同的新型智能信息系統的構建與完善。
本文首先從主要智能推薦算法著眼,分析互聯網婚戀交友的科學性與可行性;然后從算法倫理角度分析智能算法推薦交友對象的局限性與負面性;最后對人工智能應用于婚戀交友推薦的未來作出展望與建議,希望能為相關研究者提供一定的參考與借鑒。本文對于智能推薦算法的梳理尚存在不足,對于推薦算法的技術最新進展如何、關鍵技術解析等有待深入研究。未來可進一步對推薦算法的應用場景、存在問題及優化等進行討論或檢驗。