張維沖 王芳 黃毅
(1.南開大學(xué)商學(xué)院,天津 300071;2.中電科大數(shù)據(jù)研究院有限公司,貴陽 550081;3.南開大學(xué)網(wǎng)絡(luò)社會(huì)治理研究中心,天津 300071)
國家治理現(xiàn)代化離不開政府治理現(xiàn)代化,建設(shè)數(shù)字政府是推進(jìn)政府治理和國家治理現(xiàn)代化的重要途徑。當(dāng)前數(shù)字政府建設(shè)中,普遍存在政務(wù)數(shù)據(jù)“擁而難用、匯而不慧”的現(xiàn)象。雖然政務(wù)數(shù)據(jù)共享開放工作不斷深入,跨部門數(shù)據(jù)流通渠道逐漸建立,但對(duì)海量政務(wù)數(shù)據(jù)仍然缺乏有效的整合分析,數(shù)據(jù)挖掘分析多停留在簡單的相關(guān)性分析層面,碎片化政務(wù)數(shù)據(jù)難以轉(zhuǎn)化為可供決策使用的知識(shí)和智慧[1]。政府公文,作為政務(wù)數(shù)據(jù)的一種,既是政府部門日常辦公處理的重要內(nèi)容,也是重要的知識(shí)資源[2]。自然語言處理、知識(shí)圖譜與深度學(xué)習(xí)等技術(shù)的迅速發(fā)展,為政府公文的知識(shí)發(fā)現(xiàn)、管理與利用創(chuàng)造了基本條件。為實(shí)現(xiàn)新時(shí)期政策制定的科學(xué)化、智慧化、精準(zhǔn)化,持續(xù)推進(jìn)政府治理能力現(xiàn)代化,亟需將大規(guī)模、碎片化的政策性公文中的知識(shí)進(jìn)行關(guān)聯(lián)聚合,以實(shí)體為基本單位對(duì)政務(wù)數(shù)據(jù)進(jìn)行挖掘分析,揭示各實(shí)體間的復(fù)雜關(guān)系,實(shí)現(xiàn)知識(shí)層面的數(shù)據(jù)融合與集成,更大程度地釋放政策數(shù)據(jù)價(jià)值,進(jìn)而為政府、企業(yè)、組織、公眾提供知識(shí)服務(wù)。
然而在政策公文時(shí)空關(guān)聯(lián)研究上,現(xiàn)有成果主要集中于處理小規(guī)模數(shù)據(jù)的信息計(jì)量方法[3-4],以及基于詞語、句子的淺層統(tǒng)計(jì)分析方法[5-7]等。趙洪等[8]基于卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建基于大規(guī)模政府公文智能處理的算法,實(shí)驗(yàn)結(jié)果表明有較好的性能,但未對(duì)公文間的關(guān)聯(lián)關(guān)系進(jìn)行分析。……