


摘 要:從命名實體類流行語描述性釋義的語言學特征分析入手,制定其特有的語言規則匹配模板,從海量信息中,自動識別出符合條件的候選項,再通過構建語言模型,設定包含時間詞的句子權重,來體現命名實體類流行語的時效性,從候選項中識別出命名實體類流行語的描述性釋義,該識別研究可為流行語詞典的編纂與動態更新提供一定的參考。
關鍵字:命名實體類流行語 "描述性釋義 "詞義演變 "詞典編纂
一、命名實體類流行語描述性釋義識別的必要性
流行語是在某一時期,某一地域或某一人群中迅速傳播、盛行的詞匯。命名實體指文本中具有特定意義的實體,包括人名、地名、機構名、專有名詞等。上述兩個方向的已有大量研究成果,而命名實體類流行語的研究還是一項空白。謝學敏(2005)將流行語分為有標記的流行語釋義與不帶標記的流行語釋義兩類,不帶標記類又分為事件類、人物簡歷類釋義兩個分類分別加以處理,計算復雜度相對較高。術語定義提取方面的工作一直受到學界關注。張艷(2003)利用句法分析工具分析短語成分,根據句型結構,并建立數據和概念描述,給出術語發現算法,最終識別出術語定義。荀恩東(2004)采用術語定義的語言學模式,多線程高效下載網頁,經后續處理返回給用戶術語定義。荀恩東后續又通過考察術語定義構成的語言學模式、定義中詞匯和術語周邊的統計特征,并根據新術語出現的上下文統計特征,用SVM分類器進行術語定義的識別。……