文/蔣萬勝
近年來,學界開始頻繁使用互聯網時代、信息時代、云時代、云計算時代、人工智能時代、算法社會這些詞匯來表征和描述目前民眾所身處其中的社會。這些對于人類社會指稱和觀察的每一種維度(或者說視角)都是單一的,是從事物眾多屬性中某個屬性或人類認識可能的多個視角之一來思考和描繪人們所生活于其中的周圍環境(既包括自然的環境,也包括社會的環境)。現在人們在觀察和思考云計算、人工智能、區塊鏈、智能制造、芯片制造等新的技術(或者說存在意義上的事物),但大多數人對于這些新技術的構成原理卻不是特別清楚。隨著機器學習理論和技術的不斷發展,算法作為其核心及其引起的影響越來越受到人們的關注,于是算法社會這個概念就出現了。
第一,人類思維的二分法特征。人類觀察和感知世界最基本的方法就是二分法,這種方式其實就是基于人類思維中最基本的二分特征。對于人類來講,這種特征首先表現在人們以語言詞匯對于空間關系、時間關系的表示上。我們日常表示空間關系的詞語就有上下、前后、左右,進而演化成指示方向的東、南、西、北4個詞語,再進行組合就變成八方:東、東南、南、西南、西、西北、北、東北,人們在組合的意義上視東南和南東,視西南和南西,視西北和北西為一個,并取前者來便于使用。人們在使用二分法時其實都暗含和假定了一個中心的存在,那就是自己(或者說標準)。對于這個中心,我們在空間概念中用一個“中”表示這個中心,在方位詞中就是 “中”,“東、南、西、北”加上“中”。如果將二分法暗含的“標準”或“假定”揭示出來,就會形成三分法。這一點在時間概念中表現得非常明顯,例如過去、現在、未來,昨天、今天、明天都揭示了時間的劃分特點。然而許多人在日常生活中都會使用這些建立在二分基礎上的概念,但在進行運用語言文字表達自己的思想時卻不會進行有意識地使用,多數時候只是在進行無意識的、習慣性的使用。我們將表示相對位置的前后關系,進一步在時間觀念中細化為前、中、后的三分關系。在計算機技術中,通過對物理電路的兩種狀態(“開”和“關”)的數字賦值(“1”和“0”)和運算實現來人們所需要的功能,中間經過了復雜的邏輯步驟和技術轉換過程。
在對大腦功能模仿的過程中,人們經過了大量的、多學科的研究和探索才取得了現在計算機在人類語音識別、視覺識別、機器翻譯等方面的重大突破。在這個研究過程中,人們所抱有的信念就是計算機能夠實現對人類大腦功能的模仿。20世紀初,在邏輯領域出現了羅素和懷特海的《數學原理》,它建立起現代數理邏輯的基礎;在哲學領域出現了語言哲學,例如維特根斯坦的《語言哲學》,人們開始從語義表達的準確性去研究語言,分析自然語言的句子表達方式、詞義場景性問題;在技術領域,技術專家則研究如何在機器上實現對于數學邏輯關系的電路設計問題,例如諾依曼的《計算機與人腦》就在探索這方面的問題。自然科學家相信人腦的功能可以被模仿,人類大腦內在的結構及運行過程能夠被揭示出來,而不會永遠是“黑盒子”,也不能永遠是“黑盒子”,這種信念激勵著眾多研究人員去從事這方面的理論探討和實驗研究。 自然科學的研究和探討在今天取得了現在人們所看到的、令人驚嘆的巨大成就,而有的人文學科研究者卻一直抱著這樣的看法:大自然的運行機理太復雜,以人類的智力水平不會揭開大自然的奧秘。
第二,二分法的計算機實現。二戰以后出現了信息論、控制論和系統論等與計算機技術密切相關的理論。其中最有名的著作有維納的《人有人的用處》。世界上第一個計算機的形態非常大,由于其體積的龐大,運算速度又不是特別快,人們就質疑其存在的價值。但隨著計算機專家在邏輯分析方面的不斷努力,集成電路技術的不斷突破,計算機的外形也在沿著兩個方向變化:一個是小型化,現在計算機外形尺寸與其最早的原型機相比,已經變得相當小;另一個是大型化,這類計算機主要是為了滿足諸如天氣預報這種具有眾多變量的復雜系統的運算,現在它是以多個小型計算機并聯的方式組成,體型龐大。計算機的小型化對于社會的發展具有非常大的影響,因為計算機的小型化,使得計算機得以進入家庭,被個人用于生產和生活領域,處理日常事務。計算機(機器)相互之間聯網和通信,對于人類社會的生產和生活方式也產生了巨大影響。計算機硬件構成有中央處理器、暫時記憶設備、長期記憶設備,再加上其他輔助設備(電源、鍵盤、顯示屏等)。其核心部件就是中央處理器和記憶系統。我們過去講的內存(暫時記憶硬件)和硬盤(長期記憶硬件)在智能化手機上已經被內存替代,這要歸結于虛擬內存技術方面的進步。
對于計算機來講,因為要在二進制的基礎上實現對于人類大腦功能的模仿,就必須制定一系列的用于進行計算和還原替代的規則,并將其變成機器可以識別的指令(即代碼)。計算機的出現本身就是人們對于人類大腦結構和運行按照形式邏輯進行分析的結果。因此,在計算機的運行中程序就很突出地成為其重要的組成部分。在計算機對人腦結構及其功能的模仿中,程序成為必需的東西,人們將其稱為軟件,編程人員花費很大力氣開發出來的東西如果不在計算機上運行,它就是無用的。對計算機程序進行編程的過程就是對于人類的行為進行數學邏輯分析并建立模型的過程,人們要發現人類活動過程中存在的規則性、可重復執行的邏輯。人類語言運用是很復雜的一個過程,經過對于語言的語音語調變化和詞匯語義關聯性的分析研究,人們還是發現了其中包含的規則,并運用計算機實現了對人類自然語言語音的模擬,實現了語音和文字之間的機器識別和轉換。
第一,算法。目前算法這個詞成了一個很熱門的詞語,而且似乎已成為指稱計算機運行規則的專用詞。計算機技術的最底層架構和運行基礎就是二進制,就是以0和1這兩個數字的賦值方式來表示芯片電路的兩種狀態:開和關。算法就是計算機以數字方式存儲信息(更準確地說是在硬盤上刻畫符號)、提取、處理和使用的規則。機器對算法的學習包括兩種形式:一般性機器學習和深化的機器學習——深度學習(主要是因為機器學習層級的增加)。機器學習就是計算機以數據的形式直接通過案例和經驗學習的技術。所謂機器的學習過程就是計算機在應用一定數學模型(算法的核心)對于新采集數據或新增信息的分析,反過來不斷修改和完善自己原來的算法,使其具有更強大的分析和預測能力。現在的深度學習其實是人們以計算機運行程序模仿人腦的活動過程來達到人類學習所取得的效果,力圖使機器也像人腦那樣具有創造性。目前在機器學習領域,人們正在研究人類大腦的神經網絡的信號傳遞和處理過程,力圖對其進行邏輯化分析,發現其中的規律性,并將其運用于新一代計算機的制造和對信息(數據)的處 理上。
算法對于計算機來講,就是計算機調用和使用數據并對其進行處理的規則或者程序性的方法。由于計算機在人類生產和生活中被大規模使用,再加上由計算機組成的網絡(區域網或互聯網),算法對于人們生產和生活發生的影響愈來愈大。計算機的計算與人腦的計算的差別在于:人腦的計算是基于神經網絡結構的計算,而計算機的計算主要是基于元件分布式疊加結構的計算,它的計算過程是遍歷式的邏輯窮盡計算。目前的計算機計算對于能量(主要是電力)的消耗很大,而人腦的計算過程能量消耗卻是很低的。研究者認為,最近很多深度學習取得的結果得益于以圖形處理器(GPU)為基礎的傳統深度神經網絡。但目前的圖形處理器相當于一個小烤爐,比生物大腦更耗費能量。生物大腦的神經元通過短暫的突觸接觸進行有效交流,平時總是處于安靜狀態。目前研究者又在努力分析人腦基于神經元網格的計算過程,并力圖制造仿真人腦的新型計算機。這種計算機耗能要低很多,也切合人類地球資源利用方面的環保理念,有利于人類社會的長期持續發展。
第二,算力。顧名思義,算力就是計算的能力。這種計算可以由人來完成,也可以由計算機來完成。從古至今,人計算時通常借助簡單的輔助工具——人的手指和腳趾,紙筆、計算工具(如中國的算盤)等,在近代則有歐洲的手搖計算器,現在則制造出電子計算機。現在的電子計算機不僅能夠幫助人們完成數學問題的計算,還能幫助人們實現對文檔的處理,對一些自然和社會的現象運行趨勢進行預測。人類社會計算能力在計算機出現以前,主要表現為單個人的運算能力,在現代計算機出現以后主要表現為電子計算機對于數據的分析和處理能力。算力表現為計算機單位時間內處理數據量的多少,以及它能夠處理的數據類別的多少。現在人們多關注云計算,主要是因為這種計算對于企業和個人兩方來講都具有很大益處。企業可以通過算法采集和獲取有關個人用戶的大量信息,企業(主要是互聯網平臺)可以通過對于數據的分析了解用戶的偏好和內在的心理,進而預測其感興趣的內容和可能發生的行為。數字平臺(多由企業搭建)可以通過將這些數據出售給第三方或者為其提供有關的服務來為自己獲得經濟方面的收益。對于個人用戶來講,其個人數據(例如照片、視頻、音頻)可以在云端(即平臺的數據庫)得以保存,因為平臺對于個人在云端數據的保存一般都會提供一定的免費空間,這為眾多個人用戶提供了便利,所以人們對于云計算很熟悉也樂于使用。人們對于另外兩種計算——滴計算和霧計算相對比較忽視,這是因為這兩種計算可以使用的人群范圍很小,使用人數不是很多。
沿著算法視角觀察到的算法社會由四個部分組成:執行算法的設備——計算機、算法、算法的設計者以及使用計算結果的人。在討論算法所引起的社會問題時,我們可以將其核心主體區分為以下兩種:一是算法的研發者,即計算機領域的專業研發人員;二是委托進行算法研發的組織,即運用算法來實現既定目標的企業。在兩者的外圍還有兩種主體:一是對算法的具體知識知之甚少、只能通過媒體傳播的信息和對于有關產品的使用感受來了解算法的社會公眾;二是對于社會進行管理、力圖使其維持在一定秩序范圍的政府。政府對于算法的重視是因為算法使用已經和可能引發許多社會問題,為此必須有政府的介入和干預。在算法社會,人們對于算法的依賴和使用大多是間接的,而不是直接的。算法的直接設計者是計算機的程序設計者,對于算法的直接使用者是計算機,而不是真正的、具有獨立生命的人。人們現在之所以會如此關注算法對于自己生活的影響,就是因為對基于算法運行的計算機的使用已經非常強烈地影響、改變并塑造著人們的日常生活。
計算機執行的程序(算法的計算機內部指令實現方式)的代碼的編寫,現在受到了人們的關注,主要是因為隨著計算機智能化程度的提高,依據算法進行的數據采集和分析會侵害人們的隱私權,影響到人們的生活,使人們的利益受損。企業在進行營銷活動時會依據搜集到的數據和編制好的計算機算法分析出人們的購物偏好、消費習慣,并針對不同的消費者推送相關信息或廣告。計算機工作時執行的算法對于非專業人員來說,是十分陌生的,因為對于普通大眾來講,他們只是將計算機看作與犁耙、車床、生產線一樣的工具,只是從其功能角度來關注和理解它。人們也多是從使用方法(更準確地說是操作方法)方面了解它,至于其背后的運行機制,多數人是不關注的。為計算機設計算法的人是編輯計算機程序、寫代碼的工程技術人員。在給計算機設計、輸入算法時,他們對于人類社會規范的認識水平和傾向會影響他們對程序編碼方法和代碼權重賦值,以及計算機算法的選擇。我們有必要了解處于這個群體中人員的價值觀和選擇偏好,因為他們對人們隱私權、知情權方面的認識會影響他們對計算機算法的選擇。在這里也不能忽視利益因素在選擇計算機算法方面的影響,在這方面從事計算機算法業務的公司就會在其中發揮非常大的作用。人們會要求算法公開來保護自己的隱私,以防計算機業務對自己造成隱私侵犯和利益損害。在算法的編制和選擇中以下兩方面我們都需重視:一是直接參與算法編寫人員所持的社會觀念;二是有關企業在選擇和使用算法時的利益權衡。
算法社會就像農業社會、工業社會、信息社會、智能社會等概念一樣,是我們對于整個社會所表現出來的某種鮮明特征的標明和指出。它主要是力圖讓我們沿著一個方向去觀察和認識我們所處于其中的社會某個方面的特征及其影響。這種帶有鮮明條理性、方向性、視角性的觀察,并不能排斥和否定我們還可以沿著其他方式去觀察和分析我們生活的社會。算法社會這一概念的核心就是要指明或者強調算法在人們社會生活中的影響。但對于算法是什么,一般普通大眾是不關注的,即使關注也很難對它有比較深的理解。在未來社會里,算法及其載體必然會對人們的生產、生活發生巨大影響,已經出現和可能引發的新問題必然會引發人們更多的思考。