李明超,田 丹,沈 揚,Jonathan Shi,韓 帥
(1.水利工程仿真與安全國家重點實驗室 天津大學,天津 300350;2.中國長江三峽集團有限公司,北京 100038;3.College of Engineering,Louisiana State University,Baton Rouge,LA 70803,USA)
在水利水電工程建設過程中,產(chǎn)生了大量對水利水電工程施工過程反饋、管理評估、質(zhì)量驗證等具有重要作用的文本,增加了文本管理與分析的難度[1-2]。在文本管理與分析中,自然語言處理(Natural Language Processing,NLP)技術具有較高的應用率與可靠性,能夠?qū)崿F(xiàn)海量文本數(shù)據(jù)的系統(tǒng)管理。雖然NLP技術在文本分析中取得較大發(fā)展,但現(xiàn)有的NLP術語研究主要針對日常生活用語,較少涉及具體專業(yè)領域。基于此,不同領域的學者目前都針對自己的領域發(fā)展專業(yè)性較強的NLP技術,增強NLP技術在專業(yè)領域的應用能力[3]。然而,針對水利水電工程專業(yè)的NLP技術尚處于起步階段,未形成具體的專業(yè)文本識別提取與分析體系。
采用NLP技術分析水利水電工程專業(yè)文本最關鍵的環(huán)節(jié)之一是專業(yè)詞識別,在海量的多源文本中準確提取專業(yè)詞,有利于提高專業(yè)文本信息分析的準確率。現(xiàn)有NLP技術缺乏完善的水利水電工程專業(yè)詞識別方法,難以直接用于水利水電工程專業(yè)詞提取,同時已有水利水電工程專業(yè)詞典無法囊括所有專業(yè)詞,隨著施工技術的進步,大量的水利水電工程新工藝、新技術被開發(fā),同時產(chǎn)生許多新的專業(yè)詞[4]。水利水電工程專業(yè)詞智能識別能有效提高水利水電工程管理信息的理解與分析效率,便于在工程各階段快速查找與反饋工程內(nèi)容,完成海量工程信息檢索,增強工程管理效率,提高對施工現(xiàn)場的管理效果,對于水利水電工程質(zhì)量、進度、成本、安全等管理與評價具有重要意義。……