


摘 要:隨著大語言模型在自然語言處理領域的廣泛應用,其在數學建模領域中的準確性成為研究的焦點。該文通過引入命名實體識別(NER)和提示詞工程(Prompt Engineering)的方法,提高大語言模型在數學建模問題中的回答準確率。基于GPT-3.5模型,通過對數學建模領域特定問題的語境和結構進行深入分析,闡述一套有效的NER策略和提示詞工程方法,以優化大模型對數學問題的理解和響應。
關鍵詞:大語言模型;ChatGPT;命名實體識別;提示詞工程;數學建模
中圖分類號:TP18 文獻標志碼:A 文章編號:2095-2945(2024)22-0018-04
Abstract: With the wide application of large language model in the field of natural language processing, its accuracy in the field of mathematical modeling has become the focus of research. In this paper, named entity recognition (NER) and prompt engineering are introduced to improve the accuracy of large language model in mathematical modeling. Based on the GPT-3.5 model, through the in-depth analysis of the context and structure of specific problems in the field of mathematical modeling, this paper expounds a set of effective NER strategies and prompt engineering methods to optimize the understanding and response of the large model to mathematical problems.
Keywords: large language model; ChatGPT; named entity recognition; prompt word engineering; mathematical modeling
近年來,深度學習領域取得了巨大的成功,其中Transformer模型的出現標志著自然語言處理、計算機視覺等多個任務的性能突破。Transformer作為一種創新性的神經網絡架構,在其問世后引起了廣泛的關注和研究。其獨特的自注意力機制和并行化能力使其在處理長序列和捕捉全局上下文信息方面表現出色,成為深度學習領域的重要里程碑。
大語言模型是深度學習的應用之一,尤其在自然語言處理(Natural Language Processing,NLP)領域。它在大規模語料庫上進行預訓練的巨大神經語言模型深度神經網絡,其基于Transormer架構,學習大量的文本數據,理解和生成人類語言。隨著大語言模型在自然語言處理領域的快速發展,其在數學建模中的應用為提高大模型在問題理解和準確回答提供了新的機遇。大語言模型能夠通過學習大規模文本數據中的語言模式,自動提取問題陳述中的關鍵信息,并生成相應的回答。在數學建模領域,這種能力尤為重要,因為問題通常涉及復雜的數學概念和關系以及模型的各類專業知識。……