關鍵詞:大模型;提示工程;可供性;人機交互;思維鏈
課題:國家社科基金重大項目“增強中華文明海外網絡傳播力影響力研究”(編號:23ZDA094)
DOI: 10.3969/j.issn.2095-0330.2025.04.006
一、問題的提出:可供性視角下大模型應用面臨的挑戰
(一)大模型的普及與發展
2022年11月30日,OpenAI公司推出了基于大語言模型(LargeLanguageModel,下文簡稱為“大模型”)的ChatGPT,該聊天機器人擁有較強的自然語言處理能力,在閱讀理解、文本分析、問答對話等任務上的完成能力十分突出①,推出后迅速吸引大量用戶注冊。除了OpenAI的GPT系列,Google的Gemini、Meta的Llama、Anthropic的Claude均具有巨量參數和算力支持,在信息提取和文學創作等方面表現良好。
在中國,的文心一言大模型、的訊飛星火認知大模型、的通義千問大模型、的豆包大模型、智譜AI的GLM-4大模型等在技術迭代和應用探索上持續突破,展現了中國大模型行業的多元化競爭力。而從2024年12月底到2025年1月底,中國初創公司推出的大模型DeepSeek的全球用戶數從34.5萬攀升至1.19億,日活躍數的增速遠超ChatGPT,并在百余個國家及地區的應用市場中位列榜首②,將大模型的開發、應用與研究推向更新的高度。
(二)可供性視角下的大模型
在AIGC(Artificial Intelligence GeneratedContent)時代,人機交互進入新的階段。用戶無須依賴特定的編程語言或煩瑣的操作界面,而是通過自然語言即可與大模型進行交互,實現了在多種場景下人與機器的流暢溝通。③2017年,阿西什·瓦斯瓦尼(AshishVaswani)等人提出基于注意力機制的新型神經網絡架構Transformer,它能更好地捕捉文本依賴關系和上下文信息,提高了自然語言處理的能力,使得語言模型獲得了前所未有的通用性。……