阿迪來·艾合買提+馮向萍



摘 要: 命名實體識別在自然語言處理實踐中具有高度重要的作用,而且也是信息提取等各種自然語言方式的基礎工具。本文采用條件隨機場模型(Conditional Random Fields,CRF)對維吾爾語音樂實體識別進行初步的探討。首先維吾爾語網站上收集數據,進行一系列預處理后得到純文本,然后制定語料標注規則對實體進行人工標注,再利用上下文、關鍵字、詞典等一系列特征進行訓練,制定一個適合的模板來進行音樂實體的識別。實驗結果證明,此方法在維吾爾語音樂領域不僅可行、而且有效。
關鍵詞: 音樂實體識別;條件隨機場模型;特征選擇
中圖分類號:TP301
文獻標志碼:A
文章編號:2095-2163(2017)02-0059-04