黃彥,溫繼文,陳英義
摘要:將手機短信平臺中的短信轉化為文本的特性,把文本分類算法運用到短信處理技術之中,通過對短信文本進行預處理、特征選擇及分類器等步驟,將果農短信文本按不同果業信息類別進行分類,根據分類結果,有針對性地向果農提供有效的果業信息服務。
關鍵詞:文本挖掘;短信分類;果農
中圖分類號:TP311.5 ? ? ? ?文獻標識碼:A ? ? ? ?文章編號:0439-8114(2014)23-5864-04
DOI:10.14088/j.cnki.issn0439-8114.2014.23.062
短信是依托現代通信技術手段為農民提供即時通信服務,實現信息進村入戶的重要手段。手機短信平臺為果農提供果業信息,幫助他們及時、準確地掌握科技技術信息,了解市場行情,為其決策提供相關的依據。目前,農村存在短信服務平臺,如移動“農信通”、聯通“電子農務”、“12316”農業短信平臺等,實現短信預訂、接受、推送等短信服務。為了向果農更有針對性地推送果業相關信息,提高農業短信平臺的應用功能,需要對果農按照所發短信內容類型的不同進行分類。
果農向農業短信平臺發送的咨詢短信中,80%左右的電子化信息都是以無結構自由文本的形式存在的,具有模糊性和歧義性,人或者計算機都難以使用這些未經整理的信息。于是就需要文本挖掘技術來對這些短信內容進行分類篩選。
為此,主要針對以短信形式提交的果業問題,根據短信可轉化為文本這一特性,憑借對短信文本相關特性和相關技術的研究了解,將文本分類算法運用到短信處理技術之中。通過對短信文本進行預處理、特征選擇及分類器等步驟,分析推理果農所提問題涉及的領域分類,從而針對性地為果農提供果業信息。……