大語言模型(以下簡稱“大模型”a)是當前生成式人工智能最主流的技術,具有強大的生成、遷移與交互能力。簡單地說,該技術通過訓練模型閱讀海量文本,使其在語言表達、即時對話、任務規劃、邏輯推衍等許多方面具備了與人類媲美的能力。目前,學界業界主要圍繞3 個方面開展大模型的研究:(1)傾盡所有算力,通過提高數據質量、優化模型架構和訓練策略等各種手段來研發基礎、通用大模型,提升模型能力;(2)深入探索大模型的機理,拓展其性能,將最初僅能處理文本的模型,推向兼具文本、語音、圖片、視頻處理能力的多模態大模型;(3)開發專用或領域大模型、多智能體框架,以滿足特定目標,拓展其應用場景。這些研究為大模型應用奠定了物質基礎,為大模型的使用者提供了模型選擇空間。
大模型的評測研究是伴隨其研發同時開展的。為了探究大模型各種能力的天花板,對比不同大模型對特定任務的適配性,引導模型不斷地改進優化,滿足應用需求,研究者開發了公共的評測平臺,設計評測任務和測試試題,從語法、語義、語用、邏輯、知識、計算、推理、規劃等各個維度開展大模型的能力評測。在所有評測任務中,語言能力的測試是其中最重要、最基礎的內容。深入挖掘語言研究成果,精準地設計探測、激發大模型深層語言能力的測試試題,是利用語言學研究成果引導大模型技術推進的一種方式,同時也向語言學研究提出了挑戰。
大模型超強的智能表現,不但大跨步地推進了人工智能的發展,改變了其研究范式,同時也深刻影響著社會生活,為各個領域的研究帶來新的契機。就語言研究領域而言,大模型為語言研究帶來了新的研究對象和工具。首先,大模型是通過海量閱讀、自注意力機制、強大的神經網絡、反饋學習等技術學到了與人類比肩的語言能力,這些技術與人類獲得語言能力的過程是否一樣?與已經存在的語言學理論是否一致?其次,大模型使自然語言不再是人類獨有獨用的產物與工具,機器生成的與人類產出的語言及其內容各自有什么特點?第三,大模型作為分析語言數據的強大工具,促進了大規模、深層次的語料加工,既可以輔助語言現象的系統描寫和語言規律的挖掘,也可以為模型訓練提供高質量的數據。因而,大模型與語言研究是雙向賦能、融合發展。
將大語言模型與語言研究相結合,首先要了解模型的“能”與“不能”。前期研究表明,大模型擅長解決答問、閑聊(含角色扮演)、翻譯、文本摘要、改寫、創作、信息抽取、代碼分析與生成等類別的任務,但在以下能力上存在缺陷:(1)大模型往往生成流暢但不準確的內容,即產生“幻覺”現象,表現為語義理解、邏輯關聯、基本常識、領域知識等方面的錯誤。由于大模型的工作機制目前仍處于“黑箱”狀態,解決幻覺問題還需要時日。(2)由于預訓練模型的成本極高、微調數據規模有限,對于時效性、專業性較強的問題,大模型幾乎沒有能力處理。(3)大模型強依賴于預訓練數據中的先驗知識,生成文本極易受其影響,例如在修正語法錯誤時,模型往往存在過度修改潤色的情況。(4)模型目前還無法準確理解、區分不同數字的含義。因而人們以試探、引導的方式應用大模型輔助人類提高效率。
利用大模型開展語言研究,有3 種訪問大模型的方式:(1)通過網頁或者APP 對話;如文心一言、ChatGPT、智譜清言等;(2)通過API 調用,如GPT4、Qwen-turbo,智譜AI 等都提供了API 接口;(3)使用開源模型,如Llama 系列、Qwen 系列、ChatGLM 系列等,還可對它們進行微調或二次開發。無論哪種方式,其本質主要是利用大模型強大的上下文學習能力和遷移能力,引導其適應具體的語言研究任務。因而先測試模型對應的能力,然后有目標地開展引導,誘發出大模型潛在的知識和能力,已經成為大模型應用的一種主要模式。
“提示”是當前最通用、最便捷的引導大模型的方式。“提示”有不包含任務樣例(零樣本),包含少量樣例(少樣本),以及附加額外知識等形式,而提示詞的設計直接影響對模型引導的效果。設計提示詞的常用策略包括:
第一,為模型設定角色,如“擅長分析語言現象和總結規律的語言學家”“經驗豐富的國際中文教師”等。
第二,給出清晰具體的任務說明和解決方案,包括:(1)提供必要的背景信息和具體的任務說明;(2)給出問題和答案示例;(3)針對復雜任務設定分步驟解決思路;(4)提供外部知識庫或工具檢索等必要的專業知識作為參考;(5)設置限制和要求;等等。
第三,在提示詞的格式方面,建議:(1)用換行符和###、\"\"\" 等分隔符來區分提示的不同部分(如指令、背景信息、輸入數據等),讓模型更容易區分和理解;(2)可要求模型以特定格式輸出,如列表、JSON 等,以便在批量調用時獲得結構化、易解析的結果。
第四,通過API 調用模型或使用開源模型時,宜參考文檔設置合理的參數值,例如,當追求模型輸出的一致性和穩定性時,可將temperature 參數設為接近0 的數值。
綜上,利用大模型開展語言研究時,人的判斷、決策與引導扮演著極為關鍵的角色。人工智能時代的語言研究亟需深入診斷模型機理,充分挖掘模型潛力,使得大語言模型和語言研究實現雙向賦能。在這一探索過程中,或會引發諸多值得探討的新問題,例如,語言學知識如何賦能語言智能技術發展,實現知識與技術的雙向迭代?如何高效地為模型注入專門領域知識,以減輕幻覺現象,并促進解決專業性問題?人類社會存在高度多樣性和復雜性,如何探究模型與人類價值觀對齊的方法論?多模態大模型與多智能體等技術的發展又會為語言研究帶來哪些新的挑戰和機遇?為此,《語言戰略研究》期刊專門組織了“大語言模型”專題,邀請語言學與計算機領域的研究者們共同探討相關問題,圍繞領域模型的研發、模型的特定語言能力測試任務設計與分析,利用大模型輔助具體語言問題的研究,交流他們的研究成果;同時,就語言知識的研究與利用、語言數據與人類知識的相互融合來為大模型提供資源,大模型及智能體對研究和應用產生的影響,以及大模型帶來的安全、價值取向和倫理問題,交叉學科人才培養,等等,給出了研究者的觀點,期待通過上述交流,推動語言學與人工智能技術的創新融合發展。