成海
摘 ? 要:首先,文章對計算機文本挖掘技術和網絡安全進行了簡要的概述;其次,簡要說明了計算機文本挖掘技術的方法。最后,結合自身工作和學習經驗,分析計算機文本信息挖掘技術在網絡安全中的應用措施,希冀能為此專業(yè)發(fā)展盡到些許綿薄之力。
關鍵詞:計算機;文本信息技術;網絡安全
社會由于經濟水平的不斷發(fā)展和進步,早就進入到一個經濟大爆炸的時代。21世紀是信息技術爆發(fā)的時代,計算機網絡信息技術取得飛速的發(fā)展。在這個時代,計算機和互聯網占據著最主要的作用。無論是生活還是工作,信息技術為社會帶來了巨大的改變。人類的日常行為已經無法離開計算機,但它在為人帶來極大便利的同時,也埋下了重要的安全隱患,不可忽視。
1 ? ?計算機文本挖掘技術和網絡安全簡述
1.1 ?計算機文本挖掘技術簡述
計算機文本挖掘技術屬于第三次工業(yè)革命以來,從不斷發(fā)展的互聯網技術中產生的一項新技術。它是對計算機內部文本信息處理的一項新技術,通過對大量文本信息的處理和挖掘,來獲得計算機文本的內容,進一步獲取其中有價值的信息,從而給工作和學習的開展帶來極大的便利[1]。
1.2 ?網絡安全的簡述
隨著信息技術的發(fā)展,現代人的所有信息都被儲存在計算機互聯網之中,給現代人的生活帶來了不小的方便,但也相當于“有把無形的利劍隨時懸在頭頂”,一旦出現計算機問題,極易造成信息的泄漏,變成“透明人”被公之于眾,所以網絡安全尤為重要。黑客泛濫、竊取信息等網絡安全問題不容忽視,要及時運用文本挖掘技術來構建安全網絡系統(tǒng),保護公民的信息安全。
2 ? ?文本信息挖掘技術的方法
2.1 ?關注文本信息技術的來源渠道
在數據挖掘的過程中,挖掘的對象和方法都不是單一的。實際操作過程要采取可視化的方法來進行全面的數據挖掘,包括:二維數據表數據、文本數據、多媒體數據和萬維網數據,這些數據都是文本信息需要去挖掘的地方。另外,數據挖掘具有極強的專業(yè)性和知識性,所以也要去學習和運用它的背景知識,對挖掘數據中的建模具有很大的積極作用。通過運用所學習的背景知識,能夠在挖掘數據中提高精準性,從某些角度來講,會極大地提升計算機的工作效率。
2.2 ?臨近分類法
臨近分類法最為簡單、最易操作,是在文本分類的過程中被采用的次數最多文本挖掘方法,可以創(chuàng)建c個分類方案,對所有區(qū)分的文本方案和數據進行比對。通過對比,各文本特征分類明顯,最佳的方案一目了然,更簡單地確定了文本的屬性。但鄰近分類法同樣存在著一些無法繞過的問題:若是文本內有不同的文本特征存在,相鄰對象就會極大可能出現平行、共線的情況,最終也會導致文本挖掘的結果失去精準度。
臨近分類法雖然操作極為方便、原理通俗易懂,但卻會出現不同分類特征,可能會出現共線和平行的現象,使臨近分類法的信息分類結果可能存在誤差,具有極強的波動性質。所以,目前已經擁有解決臨近分類法弊端的相關改進措施,其改進的主要原理為:對共線之間不同信息數據的特征進行有效的分析,將一些容易引發(fā)成共線的特征進行合并,同時最大限度地去壓縮文本向量的信息維度,使得臨近分類法的成功效率和運算效率都能夠得到進一步的提高,進而提升文本挖掘的工作效率。
3 ? ?計算機文本信息挖掘技術在網絡安全中的應用
3.1 ?網絡新聞媒體領域
計算機技術已經深入滲透到了每個人的生活和工作之中。當今社會,有80%以上的工作都是在計算機互聯網上完成的。大數據時代,計算機互聯網具有強大的人脈和豐富的資源,能讓人最快速地掌握第一手的資料。在這一背景下,也衍生出了很多新的詞匯,比如人肉。網絡媒體的傳播速度,是傳統(tǒng)紙質媒體傳播速度的好幾倍,傳播過程也更加簡便,所以與之相應的個人隱私和網絡輿論問題,也不容忽視。這就需要把計算機文本信息挖掘技術合理應用到網絡新聞媒體領域中去,運用獨特的技術對網絡新聞媒體產生的輿論成因和條件進行分析,對網絡新聞媒體產生輿論的正確性進行合理的判斷,對網絡新聞媒體產生的輿論進行簡要的描述,并且進一步向下預測其未來的發(fā)展走向。
3.2 ?醫(yī)療健康領域
隨著人民生活水平的逐漸提高、人均收入的不斷增多,越來越多的人開始期盼擁有一個良好的身體素質,健康生活方式的重要性也成為人民大眾開始“提上嘴邊”的一個話題。計算機文本信息挖掘技術同樣也可以在醫(yī)療健康的領域有所建樹,發(fā)揮它獨有的價值,尤其是在計算機文本信息領域中,中文信息分析有著其獨特的優(yōu)勢,這是英文所不具備的,所以,計算機文本信息挖掘技術在對中醫(yī)藥學的挖掘研究上更是有著得天獨厚的天分。當今社會,計算機文本信息挖掘已經在醫(yī)療健康方面開始普及,并得到了廣泛的運用[2]。比如:利用文本信息挖掘技術分析各種疾病下中藥和西藥的用藥理念和用藥規(guī)律,將兩者進行比對,進一步把得出的結果信息加以反饋,取兩者之所長,補兩者之所短,從而使現有的醫(yī)療技術水平得到進一步提高,造福于人民群眾。同時,也有利于從業(yè)者和非從業(yè)者都能夠在計算機網絡上面學習到相關的知識結構,進一步提高人民的綜合素質水平。
3.3 ?專利信息領域
隨著人類科學技術水平的不斷升級,各種物質產品也在不斷地更新換代,越來越多的發(fā)明也如雨后春筍般地涌現出來。在這樣的前提條件下,尊重原創(chuàng)、支持原創(chuàng)的意識也就順應時代而誕生了出來。在信息大爆炸的時代,借助各種平臺的推廣,新興事物都會以一種不可思議的傳播速度進入公眾的視野。這固然是好事,可以讓所有人都能夠在第一時間了解到全新的世界,但在傳播的過程中,有無數的風險也隱藏著,其中,黑客的竊取導致傳播速度變慢、中間者“添油加醋”地改裝并據為己有、商業(yè)機密的泄漏等種種問題迎面而來,各種別有用心的“宵小之輩”從中牟利,最終導致原創(chuàng)者“慘淡收場”。所以,保護專利信息的安全不可忽視。計算機文本信息挖掘技術在專利保護上的具體表現為對專利技術所有權的挖掘、登記調查權力的挖掘、專利使用權的挖掘等幾個方面,并以此為基礎,確定后續(xù)的發(fā)展方向和未來的熱點計劃,最終實現更新的技術開發(fā)。
3.4 ?市場營銷領域
在多元化的市場,企業(yè)不再是孤軍奮戰(zhàn),各企業(yè)之間的聯系日益密切起來,這同樣也帶來了激烈的競爭,像一個“沒有硝煙的戰(zhàn)場”。如何跟緊市場的風向標,在多元化的市場中占有自己一定的份額,是每一個企業(yè)發(fā)展都需要面對的問題。在市場營銷領域中,計算機文本信息挖掘技術有著不可忽視的作用,具體表現為整合市場的大部分資源,擴大企業(yè)的經濟效益,并且讓企業(yè)自身不斷地總結和反省,統(tǒng)籌優(yōu)化自身結構,能夠更好地幫助企業(yè)掌握第一手商業(yè)資料,從而促進企業(yè)的不斷發(fā)展。除此之外,計算機文本信息挖掘技術還能幫助國家機構在對市場進行調節(jié)時,及時分析市場和企業(yè)的情況,比對出市場的優(yōu)勢和不足,并給出相應的前瞻性建議,使得國家能夠更好地對市場進行宏觀調控,最后達到促進國民經濟發(fā)展的目的。
3.5 ?個性化創(chuàng)新領域
由于思維的開放、思想上的兼收并蓄,現代人不再滿足于古代的千篇一律,而是更加追求極致的美和個性化的發(fā)展。從生活到工作、從工作到學習,現代人的價值觀都較從前發(fā)生了很大的改變。計算機文本信息挖掘技術在一定程度上滿足了現代人這種追求個性的愿望,可以從多個角度出發(fā),分析現代人不同的行為性格色彩,解析不同人的不同心理追求,并給出針對性更強的建議,為其提供專業(yè)性更強的個性化服務,這也使得現代人對它的認同感更加強烈起來。但在利用計算機文本信息挖掘技術進行個性化創(chuàng)新時,同樣也需要注意幾點問題:
(1)由于個性化具有獨立性和不相關性,所以用戶與用戶之間的個性化創(chuàng)造并沒有一定的關聯性,這也就在一定的程度上增大了對個性化創(chuàng)新管理的難度,可能會引起一些較為嚴重的網絡安全事故。
(2)對于計算機文本信息挖掘技術來說,創(chuàng)建個性化的前提是要將用戶自身的數據信息毫無保留地傳輸到計算機當中。對于用戶來說,需要確認個性化的服務足夠安全才會將自身的信息進行傳輸,所以,針對用戶信息資源保護就需要投入更多的資源。
3.6 ?信息檢索領域
計算機文本挖掘在當下的信息檢索領域同樣有著極為完善的應用。信息檢索領域涉及的范圍非常廣泛,為人類的生產和生活帶來了極大的便利。它可以僅通過幾個甚至是一個關鍵詞在整個網絡范圍內對信息數據進行搜索,為用戶提供相應的信息查詢服務。在信息檢索的過程當中,用戶具有極大的自主權利,即使在不知道搜索數據具體形式的情況下,也能夠有很大的概率尋找到自身想要的數據信息。同時,計算機文本信息挖掘技術可以利用智能化的系統(tǒng)對用戶搜索的信息進行初步的篩選,通過信息的對比和篩選,將一些不必要的信息或是與搜索關鍵詞相似度較低的數據信息進行過濾,僅留下部分與用戶搜索相似度較高的文本信息,并選取其中相重合的部分為用戶進行標識,以使得用戶的查找更加方便和清晰。除此之外,計算機文本信息挖掘技術還能夠對用戶搜索的信息進行動態(tài)展示,對內容第一時間作出更新,并彈出對話框來對用戶進行更新提醒。
4 ? ?結語
這是一個豐富多彩的時代,也是一個機遇和挑戰(zhàn)并存的時代。這個時代,計算機網絡的安全問題并沒有得到完美的解決,所以就需要進一步豐富計算機文本信息挖掘技術的手段,不斷完善自我,挖掘更多更有價值的網絡內涵,從而保障網絡信息的安全,滿足時代飛速發(fā)展的硬性需求。
[參考文獻]
[1]邢翀.淺析計算機文本挖掘技術在網絡安全中的應用[J].山東工業(yè)技術,2018(11):126,136.
[2]張永東.計算機文本信息挖掘技術在網絡安全中的應用[J].信息與電腦(理論版),2018(14):140-141.