宋勇建
(青島科技大學(xué)高密校區(qū) 山東 青島 261500)
隨著全球經(jīng)濟(jì)和科學(xué)技術(shù)的飛速發(fā)展,信息技術(shù)、互聯(lián)網(wǎng)技術(shù)的發(fā)展也極為快速,其推動(dòng)了數(shù)據(jù)走向大數(shù)據(jù)的時(shí)代。當(dāng)前,我國(guó)已經(jīng)正式邁入了大數(shù)據(jù)時(shí)代,以信息技術(shù)為代表的先進(jìn)技術(shù)對(duì)人們的生活、工作、學(xué)習(xí)等方面產(chǎn)生了深刻的影響。因此,認(rèn)識(shí)大數(shù)據(jù)和大數(shù)據(jù)背景下的一些常見(jiàn)計(jì)算機(jī)信息處理技術(shù),不斷提高計(jì)算機(jī)信息處理技術(shù)水平,便成為諸多技術(shù)人員研究的課題。
所謂大數(shù)據(jù),一般是指互聯(lián)網(wǎng)企業(yè)在日常生產(chǎn)運(yùn)營(yíng)活動(dòng)中所形成并保存的用戶互聯(lián)網(wǎng)行為信息。一般來(lái)說(shuō),這些信息總量非常龐大,雖然學(xué)術(shù)界尚未針對(duì)大數(shù)據(jù)的最低數(shù)據(jù)量進(jìn)行定義,但是對(duì)于現(xiàn)代互聯(lián)網(wǎng)企業(yè)來(lái)說(shuō),只有數(shù)據(jù)總量在10 TB以上時(shí),才能被稱(chēng)之為大數(shù)據(jù)。當(dāng)前,國(guó)內(nèi)市場(chǎng)中所銷(xiāo)售的計(jì)算機(jī)軟件,仍然不能在短期內(nèi)對(duì)大數(shù)據(jù)開(kāi)展收集、處理、傳輸[1]。
實(shí)際上,我國(guó)進(jìn)入大數(shù)據(jù)時(shí)代的時(shí)間并不是很長(zhǎng),但是卻出現(xiàn)了十分顯著的特點(diǎn),可以歸納為以下幾點(diǎn):第一,數(shù)據(jù)量巨大,這是基于大數(shù)據(jù)技術(shù)的基本定義便可知曉的,指的是大數(shù)據(jù)技術(shù)背景下,擁有巨大的數(shù)據(jù)資源。值得注意的是,伴隨著信息量的驟增,當(dāng)前所采用的信息處理技術(shù)可以完成的數(shù)據(jù)處理比例卻呈現(xiàn)出逐漸下降的趨勢(shì);第二,數(shù)據(jù)類(lèi)型多元化,伴隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展與成熟,互聯(lián)網(wǎng)技術(shù)已經(jīng)在國(guó)人生活、工作、學(xué)習(xí)等方面高度普及,數(shù)據(jù)資源的種類(lèi)自然也會(huì)變得越來(lái)越豐富,其直接體現(xiàn)了大數(shù)據(jù)信息類(lèi)型多元化特征;第三,大數(shù)據(jù)信息高速化,數(shù)據(jù)資源的大幅度增加讓計(jì)算機(jī)用戶提升了對(duì)數(shù)據(jù)進(jìn)行處理的需求,與之相對(duì)應(yīng)的,便是針對(duì)數(shù)據(jù)信息的處理速度也要得到提升;第四,變異性提升,在大數(shù)據(jù)背景下,數(shù)據(jù)擁有了多層結(jié)構(gòu),體現(xiàn)出多種樣式、多個(gè)種類(lèi),同傳統(tǒng)商業(yè)信息數(shù)據(jù)對(duì)比,大數(shù)據(jù)展現(xiàn)出了更加顯著的模糊性以及無(wú)規(guī)律性特征,這導(dǎo)致采用原有的應(yīng)用軟件對(duì)數(shù)據(jù)開(kāi)展分析工作的難度提升,甚至可能出現(xiàn)原有數(shù)據(jù)軟件無(wú)法完成等情況,原來(lái)的信息數(shù)據(jù)隨著時(shí)間的變化具有其對(duì)應(yīng)的格式標(biāo)準(zhǔn),能夠憑借標(biāo)準(zhǔn)化的商用智能軟件來(lái)對(duì)其進(jìn)行判定。當(dāng)前,我國(guó)在大數(shù)據(jù)技術(shù)應(yīng)用過(guò)程中所面對(duì)的問(wèn)題的本質(zhì)便是針對(duì)各類(lèi)信息的提取和處理,以此實(shí)現(xiàn)大數(shù)據(jù)價(jià)值的最大化。
在大數(shù)據(jù)背景下,對(duì)計(jì)算機(jī)硬件設(shè)備性能的整體要求也變得越來(lái)越高,因此,計(jì)算機(jī)信息處理技術(shù)的核心要求,也在悄然發(fā)生著變化,大數(shù)據(jù)背景下各種計(jì)算機(jī)信息處理技術(shù)的核心內(nèi)容,可以歸納如下。
針對(duì)計(jì)算機(jī)信息處理技術(shù)的核心內(nèi)容便是針對(duì)數(shù)據(jù)信息開(kāi)展收集、處理以及傳播,在大數(shù)據(jù)技術(shù)背景下,巨大且復(fù)雜的信息數(shù)據(jù)并非是100%的有效數(shù)據(jù),而計(jì)算機(jī)信息處理技術(shù)的應(yīng)用是建立在有效信息得到提取的情況下才能發(fā)揮作用的,所以,計(jì)算機(jī)信息處理技術(shù)在大數(shù)據(jù)時(shí)代背景下,最為關(guān)鍵的便是在這些巨大且復(fù)雜的信息中迅速找出有價(jià)值的信息,然后對(duì)這些有價(jià)值的信息進(jìn)行監(jiān)測(cè)和歸納整合,從而保障信息在處理過(guò)程中的準(zhǔn)確性、時(shí)效性、全面性。需要注意到的是,在針對(duì)這些有價(jià)值信息進(jìn)行收集之后,必須要在第一時(shí)間對(duì)這些信息開(kāi)展處理,在對(duì)信息進(jìn)行分類(lèi)歸納之后,依靠數(shù)據(jù)傳輸技術(shù)把結(jié)果傳送到制定用戶的計(jì)算機(jī)設(shè)備當(dāng)中。綜上,只有在數(shù)據(jù)收集的準(zhǔn)備工作中把數(shù)據(jù)信息進(jìn)行科學(xué)有效地處理、歸納以及傳播,才能讓大數(shù)據(jù)技術(shù)最大程度發(fā)揮其自身的價(jià)值[2]。
在大數(shù)據(jù)時(shí)代背景中,各類(lèi)資源信息的流通呈現(xiàn)著互動(dòng)的趨勢(shì),不再獨(dú)立存在,在數(shù)據(jù)共享的大前提下,各類(lèi)數(shù)據(jù)之間能夠相互影響并產(chǎn)生相關(guān)聯(lián)系,人們?cè)谑褂么髷?shù)據(jù)的過(guò)程中,便利性也開(kāi)始變得越來(lái)越強(qiáng)。這些資源信息在加深彼此關(guān)聯(lián)的過(guò)程中,也必將造成一些不能夠忽視的問(wèn)題,若整個(gè)數(shù)據(jù)庫(kù)中某一個(gè)數(shù)據(jù)存在有問(wèn)題,那么該數(shù)據(jù)庫(kù)都會(huì)存在有問(wèn)題,大規(guī)模的數(shù)據(jù)問(wèn)題也會(huì)導(dǎo)致數(shù)據(jù)信息發(fā)生安全隱患。當(dāng)下我國(guó)的計(jì)算機(jī)信息管理工作,已經(jīng)淘汰了部分單一信息管理的設(shè)備和方式,但更為重要的是,要對(duì)網(wǎng)絡(luò)信息安全系統(tǒng)開(kāi)展實(shí)時(shí)監(jiān)測(cè),才能有效保障數(shù)據(jù)信息安全。綜上,我國(guó)仍需要不斷研發(fā)并創(chuàng)新信息安全技術(shù),并對(duì)現(xiàn)有的網(wǎng)絡(luò)信息安全監(jiān)測(cè)系統(tǒng)進(jìn)行優(yōu)化完善,相關(guān)行業(yè)的從業(yè)人員需要具備更加全面的專(zhuān)業(yè)技能,才能讓大數(shù)據(jù)時(shí)代下的網(wǎng)絡(luò)信息系統(tǒng)安全穩(wěn)定運(yùn)行,讓信息安全得到全方位有效保障。還有一點(diǎn)需要認(rèn)識(shí)到的是,若相關(guān)從業(yè)人員想要迅速長(zhǎng)期對(duì)現(xiàn)有的信息安全技術(shù)進(jìn)行更新,在大數(shù)據(jù)時(shí)代背景下,數(shù)據(jù)信息龐大且更新速度極快,只有基于大數(shù)據(jù)技術(shù)的發(fā)展趨勢(shì),開(kāi)展最前沿的大數(shù)據(jù)網(wǎng)絡(luò)信息技術(shù)的學(xué)習(xí),才能保障此項(xiàng)工作得到有效開(kāi)展。
在大數(shù)據(jù)時(shí)代中,網(wǎng)絡(luò)中的各種信息資源呈現(xiàn)出多樣化、復(fù)雜化的特征,并且還存在有數(shù)量十分龐大的虛擬信息,同時(shí)相關(guān)數(shù)據(jù)容量也逐漸增加,各類(lèi)用戶對(duì)計(jì)算機(jī)設(shè)備的存儲(chǔ)容量要求也變得越來(lái)越高,原有的計(jì)算機(jī)設(shè)備在對(duì)信息進(jìn)行存儲(chǔ)的過(guò)程中,因?yàn)閿?shù)據(jù)容量并沒(méi)有現(xiàn)在那么大,對(duì)于信息的存儲(chǔ)速度和存儲(chǔ)量沒(méi)有過(guò)高的要求。但是到了大數(shù)據(jù)時(shí)代以后,現(xiàn)有的信息存儲(chǔ)技術(shù)已經(jīng)無(wú)法達(dá)到大數(shù)據(jù)背景下的大容量要求,因?yàn)閿?shù)據(jù)容量的問(wèn)題,若繼續(xù)采用原來(lái)的儲(chǔ)存技術(shù),極有可能引起存儲(chǔ)速度的降低,資源在存儲(chǔ)過(guò)程中的損耗增加。因此,應(yīng)當(dāng)基于大數(shù)據(jù)時(shí)代的基本特征,設(shè)計(jì)出對(duì)應(yīng)的信息儲(chǔ)存技術(shù),保障各類(lèi)計(jì)算機(jī)設(shè)備可以更為有效地實(shí)現(xiàn)信息的存儲(chǔ)。
以上便是大數(shù)據(jù)背景下計(jì)算機(jī)信息處理技術(shù)的核心內(nèi)容,總得來(lái)說(shuō),針對(duì)核心內(nèi)容的發(fā)展,現(xiàn)有的計(jì)算機(jī)信息處理技術(shù)無(wú)法為大數(shù)據(jù)時(shí)代進(jìn)行全方位服務(wù)。因此,為了提升大數(shù)據(jù)技術(shù)的使用價(jià)值引領(lǐng)大數(shù)據(jù)技術(shù)的發(fā)展方向,創(chuàng)新和優(yōu)化計(jì)算機(jī)信息處理核心技術(shù),將會(huì)是今后的一項(xiàng)重要工作。
分布式數(shù)據(jù)儲(chǔ)存技術(shù)也被叫做行列整合式數(shù)據(jù)儲(chǔ)存技術(shù),從目前的情況來(lái)看,此項(xiàng)技術(shù)以谷歌公司的GFS技術(shù)為代表。此項(xiàng)技術(shù)能夠以行與列的形式來(lái)對(duì)各種信息進(jìn)行傳輸,不同圖像當(dāng)中含有不同的元素信息,并單獨(dú)存在于系統(tǒng)之中,有不同的種類(lèi)。通過(guò)大量的數(shù)據(jù)研究證明,將信息在行列中進(jìn)行儲(chǔ)存時(shí),數(shù)據(jù)信息在循環(huán)過(guò)程中具有更加顯著的優(yōu)勢(shì)。行儲(chǔ)存需要花費(fèi)更多的檢索時(shí)間,適合在數(shù)據(jù)信息量較大的信息存儲(chǔ)中進(jìn)行使用,實(shí)現(xiàn)對(duì)計(jì)算機(jī)設(shè)備中磁盤(pán)空間的優(yōu)化使用,讓計(jì)算機(jī)設(shè)備的存儲(chǔ)能力得到有效地增強(qiáng)[3]。
數(shù)據(jù)感應(yīng)技術(shù),通常是指DEEP WEB數(shù)據(jù)感應(yīng)技術(shù),此項(xiàng)技術(shù)可以在互聯(lián)網(wǎng)環(huán)境中的深層空間內(nèi)進(jìn)行迅速感應(yīng)。通過(guò)大量的數(shù)據(jù)信息來(lái)獲得所需要的內(nèi)容,此項(xiàng)技術(shù)的優(yōu)點(diǎn)是數(shù)據(jù)轉(zhuǎn)換速率非常優(yōu)秀,數(shù)據(jù)感應(yīng)技術(shù)的訪問(wèn)形式與普通訪問(wèn)技術(shù)相比具有十分顯著的優(yōu)勢(shì),其應(yīng)用數(shù)據(jù)是采用期數(shù),能夠讓數(shù)據(jù)信息實(shí)現(xiàn)高質(zhì)量整合,在數(shù)據(jù)調(diào)整與抽樣調(diào)查過(guò)程中將會(huì)發(fā)揮十分重要的意義。
目前,谷歌工作的BIGTA BLE技術(shù)是最為先進(jìn)的數(shù)據(jù)檢索技術(shù)。針對(duì)此項(xiàng)技術(shù)的使用主要體現(xiàn)在兩個(gè)方面。第一是此項(xiàng)檢索技術(shù)是能夠相互補(bǔ)充的,第二是此項(xiàng)檢索技術(shù)是局促性的。相互補(bǔ)充表能夠基于之前的檢索副本開(kāi)展對(duì)相關(guān)數(shù)據(jù)信息的檢索,聚簇型是把全部的檢索內(nèi)容基于存儲(chǔ)順序,在索引側(cè)開(kāi)展數(shù)據(jù)檢索[4]。
大數(shù)據(jù)時(shí)代的到來(lái),讓不少行業(yè)產(chǎn)生新的變化,與之相對(duì)應(yīng)的是必須要實(shí)現(xiàn)計(jì)算機(jī)信息處理技術(shù)的同步進(jìn)步。當(dāng)下,計(jì)算機(jī)信息處理技術(shù)仍然和大數(shù)據(jù)時(shí)代的整體要求存在差距,因此,基于差距探尋優(yōu)化路徑,將會(huì)是大數(shù)據(jù)時(shí)代計(jì)算機(jī)信息處理技術(shù)進(jìn)步的重要前提。