從農業(yè)社會開始,人類就開始了對于語言的研究,經歷了語文學、文法研究、語言哲學研究的漫長時期;進入工業(yè)社會,歷史比較語言研究、結構主義語言研究、功能主義語言研究、形式主義語言研究此起彼伏、相映成趣;計算機和互聯(lián)網出現(xiàn)后的信息社會,計算語言研究、語料庫語言研究、新媒體語言研究、數(shù)理語言研究、網絡語言研究等應運而生;當下人類正在進入數(shù)字社會,數(shù)字語言研究等開始萌芽。
人類的生產力在發(fā)展,科學研究的生產力需順應時代而發(fā)展,語言研究的生產力亦需與時俱進、拓新而行。根據(jù)生產力的定義,可以將語言研究生產力界定為:語言研究過程中研究者與研究環(huán)境之間的關系,是研究者觀察和研究語言、同語言進行互動的客觀物質力量。語言研究的生產力至少涉及3 個大的方面:研究對象、研究手段(資料)和研究者。在自然人?機器人?數(shù)字人共生的人類文明新形態(tài)中,語言研究也需要新質生產力。
就研究對象來說,一方面,語言系統(tǒng)本身快速發(fā)展。比如,網絡詞語、新詞新語涌現(xiàn),多模態(tài)語言表達層出不窮,使得當代詞匯空前膨脹;數(shù)字化時代的語言交流速度更快,語言使用更加靈活多樣,引起語法結構的加速發(fā)展和演變;數(shù)字技術如語音識別技術等的普及,則可能帶來語音系統(tǒng)在語速、語調、語音質量等方面的新發(fā)展。另一方面,語言生活呈現(xiàn)新的面貌:數(shù)字時代提供了更多的創(chuàng)造性表達方式,例如網絡視頻、音頻廣播、大語言模型文本或視頻生成等,從而豐富了語言表達的形式和內容,語音助手和語言智能技術的普及改變了人們與機器和數(shù)字交互的方式;在數(shù)字社群中,人們可以選擇不同的語言和語言風格來表達自己的身份認同,這賦予語言使用以多樣性和靈活性,也帶來了語言身份認同的新情況和新問題;數(shù)字化時代的語言交流使得傳統(tǒng)媒體的壟斷地位受到挑戰(zhàn),個體和小團體也能夠通過網絡平臺進行廣泛的語言傳播,這對語言權力的分布產生了新的影響;數(shù)字化技術的發(fā)展為語言教育帶來了新的機遇和挑戰(zhàn),例如在線語言學習平臺、語言學習APP 等,它們改變了傳統(tǒng)的語言教育模式,也促進了語言學習理論和方法的創(chuàng)新;虛擬現(xiàn)實(VR)和增強現(xiàn)實(AR)技術的發(fā)展使得語言交流形式更加多樣化,沉浸度更高,為語言學家提供了研究數(shù)字語言環(huán)境中語言使用的新機會;自然語言處理技術的發(fā)展使得機器能夠理解和生成人類語言,不僅改變了人機交互的方式,也對語言研究提出了新的挑戰(zhàn)和機遇;大數(shù)據(jù)和人工智能技術的發(fā)展使得語言數(shù)據(jù)的挖掘和分析變得更加容易,為語言研究提供了更多的數(shù)據(jù)來源和分析方法,也促進了語言研究與其他學科的交叉應用;數(shù)字化對全球語言生態(tài)系統(tǒng)產生了深遠影響,現(xiàn)實語言、網絡語言和數(shù)字語言構成了一個新系統(tǒng),它們之間的互動以及整體系統(tǒng)的發(fā)展,值得關注。
就研究手段來說,除了自然語言處理、語料庫研究法、社交媒體分析法、多模態(tài)語言研究法、數(shù)據(jù)可視化與交互分析、網絡調查和在線實驗、神經科學方法等已經較為成熟的新方法之外,一些更新的研究手段正在塑形。比如:大數(shù)據(jù)驅動的研究手段,數(shù)字化時代帶來了海量的語言數(shù)據(jù),研究者可以利用大數(shù)據(jù)技術進行語言研究,通過分析大規(guī)模的語料庫數(shù)據(jù),對語言的模式、規(guī)律和趨勢進行更深入的挖掘,從而更深入地理解語言的結構、功能和演變;語言虛擬實驗法,借助數(shù)字技術,研究者可以設計和實施虛擬實驗來研究語言現(xiàn)象,例如通過在線調查、語言游戲和模擬交流等方式收集數(shù)據(jù)并進行分析,從而更好地理解語言認知和語言交流過程;深度學習和生成模型手段,研究者可以利用這些技術來生成語言數(shù)據(jù),模擬語言交流過程,從而探索語言現(xiàn)象的規(guī)律和機制;用戶體驗研究路徑,可以幫助研究者了解用戶在語言使用過程中的感受、態(tài)度和行為,設計更加用戶友好的語言工具和應用;可再現(xiàn)性研究手段,強調研究結果的可重復性和可驗證性,研究者可以通過公開數(shù)據(jù)、開放源代碼和詳細的方法描述來促進研究結果的再現(xiàn)性,從而增強研究成果的可信度和可持續(xù)性;生物信息學方法,近年來在語言研究中得到應用,例如研究者可以將語言數(shù)據(jù)視為生物信息,利用生物信息學方法來分析語言的結構、演化和遺傳機制。
就研究者來說,至少需要在知識體系和研究能力等方面與時俱進。在知識體系方面,數(shù)字時代的語言研究知識體系在傳統(tǒng)知識的基礎上,增添了計算機科學和信息技術知識、數(shù)據(jù)科學和統(tǒng)計學知識、機器學習和人工智能知識、語言技術和工具知識、數(shù)字時代倫理和法律知識、跨學科和跨領域合作知識、科學傳播和科學普及等知識,形成了一個與時代特征相適應的綜合性知識體系。在這個知識體系中,語言學知識提供了對語言現(xiàn)象和結構的深入理解,計算機科學和數(shù)據(jù)科學知識提供了處理和分析語言數(shù)據(jù)的方法和工具,人工智能知識提供了構建語言模型和實現(xiàn)自然語言處理的技術支持,社會科學知識提供了對語言在社會和文化背景下的影響和作用的認識,而網絡與社交媒體知識、跨文化溝通與國際化知識、數(shù)字時代倫理和法律知識等也為語言研究者在實踐中提供了必要的指導和規(guī)范。在研究能力方面,至少需要在以下方面加強提升:創(chuàng)新意識和方法,即新質生產力要求語言研究者具備創(chuàng)新意識和方法,能夠提出新的問題、探索新的方法,這就需要語言研究者具備敏銳的觀察力、批判性思維和解決問題的能力;數(shù)據(jù)科學能力,即語言研究者需要能夠處理和分析大規(guī)模的語言數(shù)據(jù),因此需要具備數(shù)據(jù)科學方面的能力,包括數(shù)據(jù)收集、清洗、存儲、分析和可視化等技能;多模態(tài)數(shù)據(jù)分析能力,隨著多模態(tài)數(shù)據(jù)的普及,如文本、圖像、音頻、視頻等多種形式的數(shù)據(jù),語言研究者需要具備分析這些多模態(tài)數(shù)據(jù)的能力,能夠綜合運用不同的分析方法和工具,揭示多模態(tài)數(shù)據(jù)之間的關聯(lián)和互動;一定的計算機編程能力,掌握編程技能能夠幫助語言研究者開發(fā)和應用自動化工具、模型和算法,以及進行復雜數(shù)據(jù)分析和模擬實驗;機器學習和人工智能技能,了解機器學習和人工智能的基本原理和應用方法,能夠利用這些技術來構建語言模型、分析語言數(shù)據(jù)、進行自然語言處理等任務;跨學科合作能力,數(shù)字時代語言研究涉及多個學科領域,語言研究者需要具備跨學科合作的能力,能夠與計算機科學家、心理學家、社會學家等不同領域的專家合作,共同解決復雜的語言問題;信息素養(yǎng)和科學溝通能力,具備良好的信息素養(yǎng)能夠幫助語言研究者有效地搜索、評估和管理語言數(shù)據(jù),同時良好的科學溝通能力使得研究者能夠清晰地表達研究成果和觀點,與同行和社會大眾進行有效的交流和溝通;數(shù)據(jù)隱私和倫理意識,語言研究者需要具備對數(shù)據(jù)隱私和倫理問題的敏感性和意識,遵守相關法律法規(guī)和研究倫理準則,確保在研究過程中保護被調查者的權益和隱私;國際視野和跨文化交流能力,語言研究者需要具備國際視野和跨文化交流能力,能夠關注多語言環(huán)境下語言使用的變化和影響,以及不同文化背景下的語言差異和共通性。
當然,生產力的發(fā)展是一個較長時期的過程,語言研究新質生產力的發(fā)展也將會是一個傳統(tǒng)繼承和創(chuàng)新開拓相結合的歷史進程。本期“數(shù)字時代的語言生活”的4 篇文章,分別聚焦自然人?機器人?數(shù)字人共生時代語言生活的新常態(tài)、手語數(shù)字人、語言產業(yè)的新形態(tài)、語言智能的治理等話題,希望能為語言研究的新質生產力發(fā)展增磚添瓦。