999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

主持人語 大語言模型與語言研究的雙向賦能與融合發展

2024-01-01 00:00:00楊爾弘胡韌奮
語言戰略研究 2024年5期
關鍵詞:語言能力模型

大語言模型(以下簡稱“大模型”a)是當前生成式人工智能最主流的技術,具有強大的生成、遷移與交互能力。簡單地說,該技術通過訓練模型閱讀海量文本,使其在語言表達、即時對話、任務規劃、邏輯推衍等許多方面具備了與人類媲美的能力。目前,學界業界主要圍繞3 個方面開展大模型的研究:(1)傾盡所有算力,通過提高數據質量、優化模型架構和訓練策略等各種手段來研發基礎、通用大模型,提升模型能力;(2)深入探索大模型的機理,拓展其性能,將最初僅能處理文本的模型,推向兼具文本、語音、圖片、視頻處理能力的多模態大模型;(3)開發專用或領域大模型、多智能體框架,以滿足特定目標,拓展其應用場景。這些研究為大模型應用奠定了物質基礎,為大模型的使用者提供了模型選擇空間。

大模型的評測研究是伴隨其研發同時開展的。為了探究大模型各種能力的天花板,對比不同大模型對特定任務的適配性,引導模型不斷地改進優化,滿足應用需求,研究者開發了公共的評測平臺,設計評測任務和測試試題,從語法、語義、語用、邏輯、知識、計算、推理、規劃等各個維度開展大模型的能力評測。在所有評測任務中,語言能力的測試是其中最重要、最基礎的內容。深入挖掘語言研究成果,精準地設計探測、激發大模型深層語言能力的測試試題,是利用語言學研究成果引導大模型技術推進的一種方式,同時也向語言學研究提出了挑戰。

大模型超強的智能表現,不但大跨步地推進了人工智能的發展,改變了其研究范式,同時也深刻影響著社會生活,為各個領域的研究帶來新的契機。就語言研究領域而言,大模型為語言研究帶來了新的研究對象和工具。首先,大模型是通過海量閱讀、自注意力機制、強大的神經網絡、反饋學習等技術學到了與人類比肩的語言能力,這些技術與人類獲得語言能力的過程是否一樣?與已經存在的語言學理論是否一致?其次,大模型使自然語言不再是人類獨有獨用的產物與工具,機器生成的與人類產出的語言及其內容各自有什么特點?第三,大模型作為分析語言數據的強大工具,促進了大規模、深層次的語料加工,既可以輔助語言現象的系統描寫和語言規律的挖掘,也可以為模型訓練提供高質量的數據。因而,大模型與語言研究是雙向賦能、融合發展。

將大語言模型與語言研究相結合,首先要了解模型的“能”與“不能”。前期研究表明,大模型擅長解決答問、閑聊(含角色扮演)、翻譯、文本摘要、改寫、創作、信息抽取、代碼分析與生成等類別的任務,但在以下能力上存在缺陷:(1)大模型往往生成流暢但不準確的內容,即產生“幻覺”現象,表現為語義理解、邏輯關聯、基本常識、領域知識等方面的錯誤。由于大模型的工作機制目前仍處于“黑箱”狀態,解決幻覺問題還需要時日。(2)由于預訓練模型的成本極高、微調數據規模有限,對于時效性、專業性較強的問題,大模型幾乎沒有能力處理。(3)大模型強依賴于預訓練數據中的先驗知識,生成文本極易受其影響,例如在修正語法錯誤時,模型往往存在過度修改潤色的情況。(4)模型目前還無法準確理解、區分不同數字的含義。因而人們以試探、引導的方式應用大模型輔助人類提高效率。

利用大模型開展語言研究,有3 種訪問大模型的方式:(1)通過網頁或者APP 對話;如文心一言、ChatGPT、智譜清言等;(2)通過API 調用,如GPT4、Qwen-turbo,智譜AI 等都提供了API 接口;(3)使用開源模型,如Llama 系列、Qwen 系列、ChatGLM 系列等,還可對它們進行微調或二次開發。無論哪種方式,其本質主要是利用大模型強大的上下文學習能力和遷移能力,引導其適應具體的語言研究任務。因而先測試模型對應的能力,然后有目標地開展引導,誘發出大模型潛在的知識和能力,已經成為大模型應用的一種主要模式。

“提示”是當前最通用、最便捷的引導大模型的方式。“提示”有不包含任務樣例(零樣本),包含少量樣例(少樣本),以及附加額外知識等形式,而提示詞的設計直接影響對模型引導的效果。設計提示詞的常用策略包括:

第一,為模型設定角色,如“擅長分析語言現象和總結規律的語言學家”“經驗豐富的國際中文教師”等。

第二,給出清晰具體的任務說明和解決方案,包括:(1)提供必要的背景信息和具體的任務說明;(2)給出問題和答案示例;(3)針對復雜任務設定分步驟解決思路;(4)提供外部知識庫或工具檢索等必要的專業知識作為參考;(5)設置限制和要求;等等。

第三,在提示詞的格式方面,建議:(1)用換行符和###、\"\"\" 等分隔符來區分提示的不同部分(如指令、背景信息、輸入數據等),讓模型更容易區分和理解;(2)可要求模型以特定格式輸出,如列表、JSON 等,以便在批量調用時獲得結構化、易解析的結果。

第四,通過API 調用模型或使用開源模型時,宜參考文檔設置合理的參數值,例如,當追求模型輸出的一致性和穩定性時,可將temperature 參數設為接近0 的數值。

綜上,利用大模型開展語言研究時,人的判斷、決策與引導扮演著極為關鍵的角色。人工智能時代的語言研究亟需深入診斷模型機理,充分挖掘模型潛力,使得大語言模型和語言研究實現雙向賦能。在這一探索過程中,或會引發諸多值得探討的新問題,例如,語言學知識如何賦能語言智能技術發展,實現知識與技術的雙向迭代?如何高效地為模型注入專門領域知識,以減輕幻覺現象,并促進解決專業性問題?人類社會存在高度多樣性和復雜性,如何探究模型與人類價值觀對齊的方法論?多模態大模型與多智能體等技術的發展又會為語言研究帶來哪些新的挑戰和機遇?為此,《語言戰略研究》期刊專門組織了“大語言模型”專題,邀請語言學與計算機領域的研究者們共同探討相關問題,圍繞領域模型的研發、模型的特定語言能力測試任務設計與分析,利用大模型輔助具體語言問題的研究,交流他們的研究成果;同時,就語言知識的研究與利用、語言數據與人類知識的相互融合來為大模型提供資源,大模型及智能體對研究和應用產生的影響,以及大模型帶來的安全、價值取向和倫理問題,交叉學科人才培養,等等,給出了研究者的觀點,期待通過上述交流,推動語言學與人工智能技術的創新融合發展。

猜你喜歡
語言能力模型
一半模型
消防安全四個能力
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
大興學習之風 提升履職能力
人大建設(2018年6期)2018-08-16 07:23:10
讓語言描寫搖曳多姿
你的換位思考能力如何
累積動態分析下的同聲傳譯語言壓縮
3D打印中的模型分割與打包
主站蜘蛛池模板: 999福利激情视频 | 国产午夜无码专区喷水| 特级精品毛片免费观看| 久久久久久久久亚洲精品| 免费无码网站| 国产亚卅精品无码| 永久成人无码激情视频免费| 久久精品视频亚洲| 久久国产精品电影| 亚洲欧美激情小说另类| 亚洲人成人伊人成综合网无码| 亚洲综合激情另类专区| 国产亚洲精| 伊伊人成亚洲综合人网7777| 欧美综合激情| 四虎永久免费地址| 亚洲视频免| 亚洲天堂成人在线观看| 一级毛片视频免费| 国产第一页第二页| 亚洲天堂成人| 久久精品国产精品青草app| 亚洲成人精品在线| 这里只有精品在线| 色噜噜综合网| 视频二区中文无码| 啪啪啪亚洲无码| 国产一国产一有一级毛片视频| 国产好痛疼轻点好爽的视频| 视频一本大道香蕉久在线播放| 久久国产拍爱| 亚洲视频黄| 精品五夜婷香蕉国产线看观看| 久久综合国产乱子免费| 亚洲中文字幕久久精品无码一区| 国产综合精品一区二区| 久久久久久久久18禁秘 | 国产成人综合在线观看| 日本草草视频在线观看| 男女男免费视频网站国产| 亚洲狼网站狼狼鲁亚洲下载| 欧美爱爱网| 91无码人妻精品一区二区蜜桃| 亚洲va在线∨a天堂va欧美va| 亚洲爱婷婷色69堂| 日本免费福利视频| 亚洲男人天堂网址| 麻豆AV网站免费进入| 五月丁香在线视频| 国产欧美网站| 亚洲黄色视频在线观看一区| 有专无码视频| 国产精品jizz在线观看软件| 日本亚洲最大的色成网站www| 亚洲成人精品在线| 麻豆国产原创视频在线播放| 99久久婷婷国产综合精| 日韩欧美国产区| 欧美日韩一区二区三区四区在线观看| 亚洲无码高清一区二区| 欧美日韩一区二区在线播放| 亚洲综合第一页| 亚洲综合片| 国产精品一区二区无码免费看片| 亚洲天堂网站在线| 91在线免费公开视频| 麻豆精选在线| 色综合中文字幕| 久久99这里精品8国产| 2021最新国产精品网站| 亚洲国产精品成人久久综合影院| 亚洲高清无在码在线无弹窗| 国产精品视频观看裸模| 亚洲国产高清精品线久久| 91网址在线播放| 亚洲精品欧美日本中文字幕| 亚洲一区网站| 欧美中文字幕一区| 99伊人精品| 国产迷奸在线看| 亚洲成肉网| 超清无码一区二区三区|