仝方平
(云南電網(wǎng)有限責(zé)任公司信息中心 云南省昆明市 650000)
由于數(shù)據(jù)質(zhì)量本身和信息質(zhì)量本身的概念存在外延、內(nèi)涵方面的大部分關(guān)聯(lián),導(dǎo)致上述二者之間定義和界定過程十分模糊,造成信息質(zhì)量方面的實(shí)際研究者常常發(fā)現(xiàn)不知所云的感覺,同時(shí)在現(xiàn)實(shí)生活中也很難進(jìn)行區(qū)別,常常互相之間進(jìn)行通用。
在不同階段,數(shù)據(jù)質(zhì)量本身存在不同的概念含義和標(biāo)準(zhǔn)要求。在以前,加強(qiáng)數(shù)據(jù)質(zhì)量就是加強(qiáng)數(shù)據(jù)方面的準(zhǔn)確性要求,基本是指在數(shù)據(jù)實(shí)際生產(chǎn)過程中產(chǎn)生的質(zhì)量情況,包括精度情況、一致性情況、完整性情況等方面,也可以叫做本征質(zhì)量。
周東教授認(rèn)為數(shù)據(jù)質(zhì)量本身是通過數(shù)據(jù)的一致性特點(diǎn)、準(zhǔn)確性特點(diǎn)到相關(guān)性特點(diǎn)等具體參數(shù)共同決定。陳遠(yuǎn)教授等指出,數(shù)據(jù)質(zhì)量能夠根據(jù)正確性特點(diǎn)、準(zhǔn)確性特點(diǎn)、不矛盾性特點(diǎn)、一致性特點(diǎn)、完整性特點(diǎn)和集成性特點(diǎn)進(jìn)行描述。然而隨著數(shù)據(jù)資源信息的不斷積累與廣泛應(yīng)用,數(shù)據(jù)質(zhì)量本身含義的不斷發(fā)展,數(shù)據(jù)質(zhì)量的相關(guān)概念得到擴(kuò)展,對其定義的認(rèn)識也開始從狹義層次向廣義層次轉(zhuǎn)變,具體要求從各類數(shù)據(jù)實(shí)際提供者、生產(chǎn)者和廣大用戶等多個(gè)研究角度共同確定制定數(shù)據(jù)質(zhì)量的使用標(biāo)準(zhǔn)。準(zhǔn)確性方面不再作為衡量數(shù)據(jù)質(zhì)量本身的唯一可靠標(biāo)準(zhǔn),而對廣大用戶要求的使用滿意程度正在成為衡量數(shù)據(jù)實(shí)際質(zhì)量的關(guān)鍵指標(biāo)。向上教授認(rèn)為,高使用質(zhì)量數(shù)據(jù)主要指那些能夠充分滿足用戶使用要求的各類數(shù)據(jù)。Strong 教授等指出,數(shù)據(jù)質(zhì)量本身就是要求數(shù)據(jù)能夠有效適合使用。數(shù)據(jù)質(zhì)量內(nèi)部概念研究分析主要涵蓋兩個(gè)方面。首先,關(guān)注從數(shù)據(jù)實(shí)踐方面開展衡量數(shù)據(jù)質(zhì)量情況,也就是通過用戶角度實(shí)施判定,適應(yīng)廣大用戶的滿意度,同時(shí)從數(shù)據(jù)實(shí)際生產(chǎn)者和管理者角度開展考慮;其次,關(guān)注從面向數(shù)據(jù)系統(tǒng)的角度開展具體評價(jià),數(shù)據(jù)質(zhì)量本身屬于綜合性概念,作為一個(gè)具有多維度的抽象概念,應(yīng)該從多方面開展衡量數(shù)據(jù)的各項(xiàng)基本質(zhì)量要素。
從大量文獻(xiàn)中對數(shù)據(jù)質(zhì)量方面的實(shí)際定義來看,現(xiàn)在對數(shù)據(jù)質(zhì)量本身含義的具體解釋和相關(guān)理解還是存在不少的分歧。針對數(shù)據(jù)質(zhì)量本身應(yīng)包括哪幾個(gè)方面內(nèi)容,現(xiàn)在還沒有完全統(tǒng)一的標(biāo)準(zhǔn)規(guī)定,常常出現(xiàn)不同的研究分析者、不同的咨詢機(jī)構(gòu)提供了完全不同的回答。數(shù)據(jù)質(zhì)量本身定義沒有統(tǒng)一,造成人們對實(shí)際數(shù)據(jù)質(zhì)量內(nèi)容理解方面的多樣性區(qū)別,不能提出切實(shí)有效的處理解決方法。
信息質(zhì)量本身目前仍然沒有世界公認(rèn)的標(biāo)準(zhǔn)要求。現(xiàn)在對信息質(zhì)量本身的實(shí)際定義,基本從下面三方面展開認(rèn)識。首先,理論方面上抽象的標(biāo)準(zhǔn)定義,從具體用戶角度進(jìn)行相關(guān)定義,通常認(rèn)為信息質(zhì)量基本就是對各類信息用戶使用過程方面的滿足程度。信息質(zhì)量主要是指對各方面信息產(chǎn)品能夠有效滿足信息消費(fèi)者各種需要的實(shí)際程度的具體衡量。其次,關(guān)注信息本身存在的豐富多樣性情況,從定義基本要素特征方面出發(fā),實(shí)現(xiàn)進(jìn)一步了解信息質(zhì)量的具體特征。最后,從信息質(zhì)量的多維特征開始,深入認(rèn)識信息質(zhì)量的定義。信息質(zhì)量作為一個(gè)全方面多維度的抽象概念,對信息質(zhì)量的深入認(rèn)識基本采用對信息質(zhì)量眾多衡量維度的實(shí)際選擇和標(biāo)準(zhǔn)要求進(jìn)行判斷,這是完全有別于以往傳統(tǒng)的各類質(zhì)量管理工作方式。從各方面相關(guān)定義能夠看到,大部分對信息質(zhì)量的定義基本是按照研究者本身的主觀直覺方面、經(jīng)驗(yàn)判斷方面、行業(yè)領(lǐng)域方面和文獻(xiàn)資料方面進(jìn)行匯總研究分析得到的綜合性定義,不存在通用的標(biāo)準(zhǔn)定義,也不能有效聯(lián)系到日常實(shí)際工作中。由此可見,信息質(zhì)量本身并不屬于一個(gè)簡單的絕對的抽象概念,按照不同的研究主體以及相同研究主體中不同的現(xiàn)實(shí)需求,經(jīng)常展示出完全不同的重要意義。信息質(zhì)量本身常與現(xiàn)實(shí)用戶的具體需求緊密相連,存在十分強(qiáng)的應(yīng)用特點(diǎn)。
信息質(zhì)量的具體研究工作起于以前較早的數(shù)據(jù)質(zhì)量方面研究工作,屬于數(shù)據(jù)質(zhì)量研究的必然延伸內(nèi)容,是當(dāng)今隨著先進(jìn)的計(jì)算機(jī)技術(shù)的快速發(fā)展而持續(xù)加強(qiáng),是對信息管理內(nèi)容單純通過技術(shù)的改進(jìn)發(fā)展出來的新認(rèn)識。傳統(tǒng)的數(shù)據(jù)質(zhì)量內(nèi)容研究工作往往按照技術(shù)角度的方面關(guān)注數(shù)據(jù)本身的準(zhǔn)確性,同時(shí)經(jīng)常依附于具體的產(chǎn)品質(zhì)量管理過程。自從上個(gè)世紀(jì)40年代開始,隨著各類計(jì)算機(jī)的大量出現(xiàn),信息科學(xué)技術(shù)開始被迅速地應(yīng)用于各方面的數(shù)據(jù)管理過程中,導(dǎo)致數(shù)據(jù)本身的實(shí)際準(zhǔn)確性大大加強(qiáng)提高,對于生產(chǎn)和處理各類數(shù)據(jù)的實(shí)際能力大大提升。另外,數(shù)據(jù)方面的實(shí)際質(zhì)量問題也日益開始受到人們的高度關(guān)注重視。在上個(gè)世紀(jì)70年代期間,人們已經(jīng)正式開始研究如何實(shí)現(xiàn)高效存取大批量各類數(shù)據(jù)的具體問題,導(dǎo)致數(shù)據(jù)庫技術(shù)開始出現(xiàn)。數(shù)據(jù)庫技術(shù)能夠在一定程度方面進(jìn)一步改進(jìn)數(shù)據(jù)質(zhì)量情況,不斷拓展對數(shù)據(jù)質(zhì)量內(nèi)容的全面理解。除了應(yīng)該考慮數(shù)據(jù)本身準(zhǔn)確性情況之外,還應(yīng)進(jìn)一步考慮數(shù)據(jù)本身的完整性情況、一致性情況和及時(shí)性情況等方面。在實(shí)踐過程中,通常發(fā)現(xiàn)數(shù)據(jù)庫技術(shù)本身即使存在十分嚴(yán)格的科學(xué)理論基礎(chǔ),然而僅僅通過這些科學(xué)理論還是難以加強(qiáng)數(shù)據(jù)質(zhì)量。因此,人們開始探索根據(jù)現(xiàn)有的數(shù)據(jù)庫技術(shù)開展實(shí)時(shí)有效的數(shù)據(jù)測量、數(shù)據(jù)分析和完善數(shù)據(jù)質(zhì)量等方面。這一時(shí)期主要通過技術(shù)手段加強(qiáng)數(shù)據(jù)本身的質(zhì)量,基本從技術(shù)方面和對數(shù)據(jù)本身外部質(zhì)量情況等方面開展分析研究工作。隨著目前信息社會的不斷發(fā)展,信息化開始正式成為一項(xiàng)直接影響社會經(jīng)濟(jì)未來發(fā)展的核心因素。
社會的快速發(fā)展與不斷進(jìn)步已經(jīng)開始和高質(zhì)量高速度的信息資源內(nèi)容緊密相連。之所以高度關(guān)注信息概念,是由于不僅高度關(guān)注數(shù)據(jù)的實(shí)際內(nèi)容,更十分關(guān)注數(shù)據(jù)本身存在的語義內(nèi)容。即使像數(shù)據(jù)庫技術(shù)等先進(jìn)的信息科學(xué)技術(shù)開始逐步正式運(yùn)用,促使在低成本實(shí)際要求下實(shí)現(xiàn)獲得大量信息,加強(qiáng)數(shù)據(jù)質(zhì)量情況,得到各類高附加值信息內(nèi)容等要求已經(jīng)成為現(xiàn)在的可能。能夠在技術(shù)方面提供滿足標(biāo)準(zhǔn)要求的高質(zhì)量信息數(shù)據(jù),然而用戶還是不能感到有真正價(jià)值意義的數(shù)據(jù)信息。通常所謂達(dá)到高質(zhì)量要求的信息數(shù)據(jù)不一定就真的屬于高質(zhì)量信息內(nèi)容。目前純技術(shù)方式的數(shù)據(jù)內(nèi)容質(zhì)量處理解決辦法開始出現(xiàn)大量問題和嚴(yán)重缺陷,很難完全符合信息社會發(fā)展過程的實(shí)際需求,因此人們已經(jīng)開始實(shí)現(xiàn)不斷拓展、持續(xù)加深了對信息質(zhì)量內(nèi)容的全面認(rèn)識,目前信息質(zhì)量內(nèi)容管理工作開始正式形成一個(gè)豐富獨(dú)立的學(xué)科研究范疇。
在大量文獻(xiàn)資料研究分析中,經(jīng)常出現(xiàn)難以明確有效區(qū)分?jǐn)?shù)據(jù)質(zhì)量概念、信息系統(tǒng)質(zhì)量概念和信息質(zhì)量概念,一般把明顯應(yīng)該屬于信息系統(tǒng)質(zhì)量方面的評價(jià)指標(biāo)內(nèi)容直接歸納在信息質(zhì)量方面的評價(jià)指標(biāo)內(nèi)容中,從而導(dǎo)致概念理解的混亂和評價(jià)指標(biāo)體系歸屬情況存在交叉不清的問題。
對數(shù)據(jù)質(zhì)量方面和信息質(zhì)量方面之間的概念進(jìn)行界定,現(xiàn)在主要有著兩種基本看法。
(1)通常認(rèn)為上述二者之間只是屬于前后時(shí)間延續(xù)邏輯關(guān)系,在信息系統(tǒng)到具體的信息用戶之間屬于信息質(zhì)量范疇的問題,因此能夠常用數(shù)據(jù)質(zhì)量深入解釋系統(tǒng)建設(shè)過程中存在的各類質(zhì)量問題;
(2)通常認(rèn)為二者屬于包含的邏輯關(guān)系,數(shù)據(jù)質(zhì)量內(nèi)容是信息質(zhì)量內(nèi)容的核心基礎(chǔ)。
信息質(zhì)量內(nèi)容是一個(gè)主要包含數(shù)據(jù)質(zhì)量內(nèi)容、信息系統(tǒng)質(zhì)量內(nèi)容的更大范圍的定義概念,這其中部分?jǐn)?shù)據(jù)能夠直接影響信息質(zhì)量情況,另一部分?jǐn)?shù)據(jù)內(nèi)容的實(shí)際質(zhì)量主要通過信息系統(tǒng)方面實(shí)現(xiàn)間接影響信息質(zhì)量。
對上述二者之間相互聯(lián)系,能夠可從縱向方面和橫向方面的概念關(guān)系進(jìn)行充分認(rèn)識。從縱向方面之間的概念關(guān)系進(jìn)行分析,數(shù)據(jù)質(zhì)量與信息質(zhì)量在實(shí)際層次上存在相對區(qū)別的情況,有著邏輯遞進(jìn)關(guān)系,能夠有效反映了認(rèn)知發(fā)展的不斷深化過程,數(shù)據(jù)質(zhì)量是信息質(zhì)量的基礎(chǔ)內(nèi)容和前提體現(xiàn),信息質(zhì)量是數(shù)據(jù)質(zhì)量的不斷抽象與持續(xù)升華。從橫向方面之間的概念關(guān)系進(jìn)行分析,能夠把數(shù)據(jù)質(zhì)量看成是信息質(zhì)量的一個(gè)子集,彼此之間存在包含的邏輯關(guān)系。因此,信息質(zhì)量最終還是要通過數(shù)據(jù)質(zhì)量內(nèi)容和信息系統(tǒng)質(zhì)量內(nèi)容進(jìn)行共同保證的。
在過去的一段時(shí)間,數(shù)據(jù)信息生產(chǎn)者在開展數(shù)據(jù)質(zhì)量的研究工作時(shí),往往只是按照自己的工作角度不斷了解信息系統(tǒng)中各類信息資源內(nèi)容的客觀實(shí)際狀況,采取專業(yè)化、技術(shù)性的科學(xué)指標(biāo)和評價(jià)方法,實(shí)施一系列有效精確的數(shù)據(jù)質(zhì)量方面的控制要求和規(guī)定標(biāo)準(zhǔn)。正是由于這些規(guī)范要求和規(guī)定標(biāo)準(zhǔn),這些數(shù)據(jù)信息生產(chǎn)者能夠有效構(gòu)建一個(gè)完整系統(tǒng)的全方面質(zhì)量管理工作體系。但是如果上述這些規(guī)范要求和規(guī)定標(biāo)準(zhǔn)沒有滿足用戶的實(shí)際評價(jià)和具體需要,那么數(shù)據(jù)信息生產(chǎn)者實(shí)際提供的信息數(shù)據(jù)就不一定屬于實(shí)際用戶真正需要的信息數(shù)據(jù),就難以達(dá)到信息價(jià)值的目的。因此數(shù)據(jù)質(zhì)量方面的規(guī)定標(biāo)準(zhǔn)應(yīng)該與信息質(zhì)量方面提供的信息結(jié)論有機(jī)進(jìn)行結(jié)合時(shí),才能達(dá)到更好地為廣大用戶進(jìn)行服務(wù),進(jìn)一步提升用戶使用過程的滿意度。
(1)認(rèn)識數(shù)據(jù)質(zhì)量和信息質(zhì)量之間的區(qū)別和聯(lián)系,首先關(guān)鍵在于對產(chǎn)生過程的深入認(rèn)識。數(shù)據(jù)質(zhì)量大部分考慮的是從信息數(shù)據(jù)源到信息數(shù)據(jù)管理者之間存在的質(zhì)量問題,屬于數(shù)據(jù)生產(chǎn)過程質(zhì)量管理控制方式。而信息則按照用戶實(shí)際需求,實(shí)施分析信息出現(xiàn)過程,屬于具有適用性特點(diǎn)的質(zhì)量管理控制方式。從數(shù)據(jù)質(zhì)量向信息轉(zhuǎn)變的實(shí)際過程也是相應(yīng)的質(zhì)量觀念從具有符合性特點(diǎn)的質(zhì)量管理方式向具有適用性特點(diǎn)的質(zhì)量管理方式轉(zhuǎn)變的具體過程,也就是說從數(shù)據(jù)質(zhì)量實(shí)現(xiàn)到信息質(zhì)量的實(shí)際轉(zhuǎn)變是一個(gè)從按照數(shù)據(jù)生產(chǎn)開發(fā)者為執(zhí)行主體、根據(jù)數(shù)據(jù)信息系統(tǒng)的研究角度認(rèn)真審視信息資源的方式,到按照用戶為執(zhí)行主體、根據(jù)用戶的研究角度認(rèn)真審視信息數(shù)據(jù)資源的管理方式的具體轉(zhuǎn)變。
(2)認(rèn)識數(shù)據(jù)質(zhì)量和信息質(zhì)量之間的區(qū)別應(yīng)該充分界定二者具體的適用范圍。根據(jù)數(shù)據(jù)質(zhì)量的內(nèi)涵概念進(jìn)行分析,通常更加關(guān)注數(shù)據(jù)本身的外在特點(diǎn)的規(guī)定標(biāo)準(zhǔn),然而因?yàn)閿?shù)據(jù)信息來源范圍廣泛、類型多變繁雜、形式豐富多樣,難以有效從中凝煉具有共同特點(diǎn)的數(shù)據(jù)質(zhì)量特征指標(biāo),進(jìn)一步開展分析數(shù)據(jù)內(nèi)部的質(zhì)量問題。如果只是通過數(shù)據(jù)質(zhì)量本身概念的不斷外延擴(kuò)展來實(shí)現(xiàn)問題的有效解決,則會導(dǎo)致部分分析方法、管理手段的完全失效。采取信息質(zhì)量概念將按照數(shù)據(jù)信息內(nèi)容的內(nèi)在質(zhì)量情況,開展信息質(zhì)量內(nèi)容維度的細(xì)致篩選,從信息質(zhì)量的表現(xiàn)形式、基本內(nèi)容和具體效用三個(gè)角度具體分析信息質(zhì)量概念的內(nèi)在結(jié)構(gòu),達(dá)到揭示信息共享過程中的信息質(zhì)量問題和掌握質(zhì)量管理過程規(guī)律,同時(shí)從關(guān)注廣大用戶信息內(nèi)在需求開始入手,真正建立具有適用性特點(diǎn)的信息數(shù)據(jù)質(zhì)量管理模式。
(3)有效理解是真正區(qū)分?jǐn)?shù)據(jù)質(zhì)量和信息質(zhì)量的關(guān)鍵步驟,信息數(shù)據(jù)就是那些能夠有效引導(dǎo)人們不斷思考和深入理解的具體數(shù)據(jù)。從長遠(yuǎn)角度進(jìn)行分析,廣大信息用戶真正關(guān)心的是信息數(shù)據(jù)本身的價(jià)值,而不單單是各類信息數(shù)據(jù)。因此,各種信息數(shù)據(jù)系統(tǒng)建設(shè)工作的基本目的都是要按照廣大用戶提供的存在使用價(jià)值的信息數(shù)據(jù),這種信息數(shù)據(jù)不單單是基礎(chǔ)信息數(shù)據(jù),而且還涵蓋根據(jù)基于一次數(shù)據(jù)開發(fā)實(shí)際基礎(chǔ)上開展的二次數(shù)據(jù)開發(fā)、三次數(shù)據(jù)開發(fā)過程中加工的具體信息,造成信息質(zhì)量將是上述過程中十分關(guān)鍵的部分,應(yīng)該充分關(guān)注廣大用戶的信息數(shù)據(jù)質(zhì)量需求情況,按照用戶實(shí)際需求作為開展信息質(zhì)量管理工作的標(biāo)準(zhǔn)要求。
因此,對信息質(zhì)量方面的深入研究,不僅要有效防止將數(shù)據(jù)質(zhì)量概念出現(xiàn)盲目擴(kuò)大化情況,又不能簡單將數(shù)據(jù)質(zhì)量完全進(jìn)行排除。對數(shù)據(jù)質(zhì)量的部分研究成果和具體實(shí)踐方法、操作手段將對信息質(zhì)量的加強(qiáng)存在特別關(guān)鍵的重要意義。