付鋆 易也
摘要 隨著協同辦公系統在貴州電網公司的持續完善及推廣,系統正逐步深入人心,達到了預期的建設效果。用戶經常通過檢索的方式來收集自己需要的公文數據信息,并且這些數據中大部分都是非結構化的數據。非結構化數據的來源有很多,公文、合同、制度的附件等都是可以提供數據信息的載體。將數據非結構化其實就是利用數據預處理技術對數據進行統一篩選操作,去除數據內部包含的噪聲從而凈化數據。本文結合多個方面,對非結構化文檔全文檢索技術以及其在協同辦公系統中的應用情況進行了深入的探究。
【關鍵詞】非結構化 全文檢索技術 協同辦公系統 應用情況
協同辦公系統數據分析在系統使用過程中占據著重要地位,通過利用非結構化文檔全文檢索技術,用戶可以輕而易舉的找到自己需要的信息。非結構化數據的種類比較豐富,其存在的形式也有很多種,一般這些數據都是文件的附件而自動生成的,并且大多是以圖片、文檔等形式存在的。
1 概述非結構化文檔全文檢索技術
用戶要想在眾多的非結構化文檔信息中快速的檢測到自己需要并且感興趣的信息,就必須要依靠全文檢索技術。在現代化的檢索技術中,全文檢索是其中比較重要的~部分,它能夠有效的幫助用戶快捷的采集數據信息。為了加快用戶獲取信息的速度,我們首先要劃分信息的種類,這樣用戶不僅可以輕松的查詢到自己想要了解的數據信息,還能對目前出現的信息進行自動分類,有效的提高了網絡平臺的檢索效率。
全文檢索是一種檢索文字資料的方法,它能夠把文件中全部的文本信息和檢索詞相匹配的內容檢索出來。就目前情況來看,全文檢索是搜索引擎中的核心技術,要想在全文檢索的理論基礎上來實現對非結構化文檔的全文檢索,需要我們積極的開發一些軟件程序,通過利用組合詞搜索技術來掃描每一篇文檔中出現的相關詞匯,以組合詞為單位,對這些文件進行智能排序,然后再依靠檢索詞計算出每個文檔中詞匯出現的頻率,對出現過檢索詞的文檔進行整體排序并顯示最終的排序情況,這就是用戶檢索的最終結果。針對已經存在的文檔,我們應該通過創建靜態索引的方式來保留索引內容,當用戶對文檔進行增刪改除的操作時,我們應該利用索引的更新功能,使得索引能夠自動的完成動態更新,最后再把靜態和動態的索引結合起來,充分發揮索引創建的自適應功能。
2 非結構化文檔全文檢索技術在協同辦公系統中的應用探究
非結構化文檔全文檢索技術在協同辦公系統中具有非常重要的作用。對于我國的一些企業來說,只有部門與部門之間做好協同工作,公司的項目才能良好的開展下去。以往傳統的辦公模式需要企業投入大量的人力、物力,并且,公司對員工工作的完成情況也沒有進行有效的監測管理,對于工作中出現的問題沒有及時的給予解決。協同辦公系統的出現在一定程度上解決了此類問題,此系統是現代企業實施管理工作的主要手段。搜索引擎在協同辦公系統中占據著非常重要的地位,搜索引擎能夠搜集到互聯網上出現的全部信息資源,然后將這些信息整理儲存,方便用戶進行查詢。搜索功能主要包含三部分內容,分別是采集信息、整理信息和用戶查詢。搜索的原理也很簡單,首先,搜索引擎需要完成抓取網頁的步驟,每一個獨立的搜索引擎都有著自身獨特的用來抓取網頁的小程序,通過超鏈接的應用就能抓取到許多網頁,其次,搜索引擎需要對這些網頁進行處理,最主要的處理環節就是提取網頁中的關鍵詞,創建索引文檔。最后,當用戶為了檢索自己需要的內容而輸入關鍵詞時,搜索引擎就會依靠創建的索引,從數據庫中找到包含此關鍵詞的網頁,供用戶瀏覽。搜索引擎的應用為系統的用戶帶來了極大的便利,不僅為員工節省了更多的工作時間,還增強了企業員工的工作效率,給企業創造了更大的經濟效益。
非結構化文檔全文檢索技術能夠幫助企業采集員工的相關信息,企業可以根據用戶的需求,實現對企業各模塊的設計。數據庫的出現為系統的軟件開發奠定了基礎。用戶通過組合詞搜索等方式對一些需要的數據信息進行搜索,然后在得出的文檔排序中找到最適合的答案,以此完成企業協同工作系統的創建。非結構化文檔全文檢索技術不僅節約了企業辦公的人力資源,還通過無紙化辦公的方式,減少了企業的物資消耗。除此之外,協同辦公系統的“無址化”特點,幫助企業形成了一個更加自由的辦公環境,工作人員在任何地點和時間內都可以進行辦公,一個完善的協同辦公系統能夠提升企業的信息共享效率以及員工的協作能力。在員工查詢工作信息時,全文檢索技術能夠為員工提供一個統一的文檔檢索與獲取的查詢入口,協作辦公系統的用戶只需要將檢索內容中的關鍵詞輸入進檢索窗口中就可以達到查詢的目的。
3 全文檢索在協同辦公系統的應用優勢
首先非結構化文檔全文檢索速度較快,相較于其他幾種檢索方式而言,該檢索方式通常可以在較短的時間內幫助用戶定位到所需的網頁或信息,反映在協同辦公系統中則能夠有效壓縮檢索使用時間,進而提高辦公效率。
其次非結構化文檔全文檢索功能不會因檢索結果太多而影響到辦公效率。當檢索結果太多時,用戶一一瀏覽就會耗用大量的時間,該檢索方式展示檢索結果排序的依據是以單一信息中關鍵詞出現的頻率而非信息使用頻率或訪問頻率,從而將最具關聯性的信息反映在用戶面前,不容易造成用戶錯覺,辦公效率也自然提高。
此外非結構化文檔全文檢索技術的應用,能夠提高企業信息的功效效率,一方面能夠提高企業員工工作效率,便于企業知識管理的展開和完善,企業管理者更容易掌握企業信息的使用情況和知識技術的應用情況,便于做出最符合企業當前發展需求的決策,提高企業知識利用率的同時推動了企業的生產和發展。
4 結束語
隨著我國信息技術的快速發展,企業要想在激烈的社會競爭中站穩腳跟,就必須要研究出適合企業發展的新技術。企業搜索技術的出現,為企業協同辦公系統的用戶提供了更加快捷、便利的信息查詢通道。本文結合多個方面,對非結構化文檔全文檢索技術以及此技術在協同辦公系統中的應用情況進行了深入的探究。
參考文獻
[1]謝子超,非結構化文本的自動分類檢索平臺的研究與實現[J].軟件,2015, 36 (11):112-114.
[2]肖興平,阮俊.基于地質技術方法非結構化數據的文檔檢索研究[J].中國西部科技,2015 (11):23-25.