單軍亭+單昱+單晨+瞿晶珠
摘 要 大數(shù)據(jù)是互聯(lián)網(wǎng)信息時代的發(fā)展趨勢,小數(shù)據(jù)是大數(shù)據(jù)的基礎,二者相輔相成,相得益彰。本文通過探討大數(shù)據(jù)與小數(shù)據(jù)之間的關(guān)系,建立內(nèi)控測試例外事項數(shù)據(jù)庫的目的與意義,簡述用大數(shù)據(jù)思維建立例外事項Excel小數(shù)據(jù)庫的程序和方法,以及數(shù)據(jù)庫的使用方式。
關(guān)鍵詞 大數(shù)據(jù) 數(shù)據(jù)庫 建設程序
大數(shù)據(jù)思維是目前企業(yè)關(guān)注和熱議的話題,正在影響或改變傳統(tǒng)的企業(yè)模式。運用大數(shù)據(jù)新型技術(shù)從海量的數(shù)據(jù)庫中提取可用數(shù)據(jù),通過對結(jié)構(gòu)性和非結(jié)構(gòu)性數(shù)據(jù)進行全面、關(guān)聯(lián)和快速分析,精準預測未來發(fā)展趨勢,已成為互聯(lián)網(wǎng)信息時代的共識和不爭的事實。大數(shù)據(jù)的運行,離不開數(shù)據(jù)資源的支持,沒有各類數(shù)據(jù)庫資源的匯集,大數(shù)據(jù)就無數(shù)據(jù)來源。因此,在大數(shù)據(jù)思維下建立相應的小數(shù)據(jù)庫,不僅是大數(shù)據(jù)有效運行的基礎,更是應用大數(shù)據(jù)新型技術(shù)的保障。
一、對數(shù)據(jù)、信息和數(shù)據(jù)庫的理解
百度百科和360百科均把數(shù)據(jù)(data)解釋為,數(shù)據(jù)是對客觀事物存在事實或觀察的結(jié)果和邏輯歸納,是表示客觀事物未被加工和處理、原汁原味的原始素材。數(shù)據(jù)是計算機信息技術(shù)的術(shù)語,是信息的表現(xiàn)形式和載體,可以是符號、文字、數(shù)字、語音、圖像、視頻等。信息是數(shù)據(jù)的內(nèi)涵,數(shù)據(jù)是信息的表達。數(shù)據(jù)本身并無意義,只有對實體行為產(chǎn)生影響時才成為信息,數(shù)據(jù)和信息不可分離。①
筆者認為,數(shù)據(jù)是對各類事物誕生、發(fā)展和消亡等各個時序節(jié)點全過程運行軌跡,用各種各樣能被人和機器等認識、甄別和記憶,用不同的語言文字、影像圖形、符號標識等進行描述匯總和統(tǒng)計分析的一維或多維記錄。單個記錄的匯集可以形成一組或一個緯度,多個緯度的聚集便可形成一個庫。記錄數(shù)量按照“積水成淵、積土成山”規(guī)則,即可形成大、中、小等不同層級的庫。由于記錄的是各種類型的信息,通常這些信息又被稱為數(shù)據(jù),所以這些信息數(shù)據(jù)記錄形成的庫就被稱為數(shù)據(jù)庫。
不言而喻,數(shù)據(jù)量小的是小數(shù)據(jù)庫,數(shù)據(jù)量大的是大數(shù)據(jù)庫(介于中間的是中控數(shù)據(jù)庫)。單個或多個小數(shù)據(jù)庫的匯集可以形成大數(shù)據(jù)庫。由此可知,小數(shù)據(jù)庫是大數(shù)據(jù)庫的基礎,大數(shù)據(jù)庫是小數(shù)據(jù)庫的集合,沒有小數(shù)據(jù)庫就形成不了大數(shù)據(jù)庫,沒有小數(shù)據(jù)就形成不了大數(shù)據(jù)。
二、大數(shù)據(jù)與小數(shù)據(jù)之間的關(guān)系
網(wǎng)絡技術(shù)的不斷進步和信息載體飛速發(fā)展,為大數(shù)據(jù)的崛起提供了機遇和平臺。數(shù)據(jù)庫是按照一定的數(shù)據(jù)結(jié)構(gòu),集成、記錄、存儲和管理數(shù)據(jù)資源的倉庫,結(jié)構(gòu)性和非結(jié)構(gòu)性信息層級分明,使用方便、操作簡單。
(一)大數(shù)據(jù)和小數(shù)據(jù)之間存在層級關(guān)系
數(shù)據(jù)庫可以分為三個層級:第一層級是集團層面,處于數(shù)據(jù)庫的頂層;第二層級是地區(qū)公司層面,處于數(shù)據(jù)庫的中層;第三層級是地區(qū)公司所屬層面,處于數(shù)據(jù)庫的底層。大數(shù)據(jù)是小數(shù)據(jù)的集合,集團層面可視同為大數(shù)據(jù)。小數(shù)據(jù)是業(yè)內(nèi)不同部門各相關(guān)數(shù)據(jù)的集成,地區(qū)公司所屬層面可視同為小數(shù)據(jù)。小數(shù)據(jù)是大數(shù)據(jù)的基礎和來源,沒有小數(shù)據(jù)就沒有大數(shù)據(jù);大數(shù)據(jù)是小數(shù)據(jù)的匯集,沒有大數(shù)據(jù),小數(shù)據(jù)就沒有價值取向,二者相輔相成,相得益彰。
(二)大數(shù)據(jù)和小數(shù)據(jù)之間的數(shù)據(jù)取值不對稱
大數(shù)據(jù)的數(shù)據(jù)來源于小數(shù)據(jù),而小數(shù)據(jù)是各行業(yè)部門投入大量的人、財、物資源,把長期積累的各類資源轉(zhuǎn)換成數(shù)據(jù)資源的結(jié)果,是企業(yè)內(nèi)部勞動成果和辛勤付出的平臺和血汗,一般只限制在有權(quán)限的內(nèi)部使用,不會輕易外傳。由于受考核指標的影響,不同層級的單位上報數(shù)據(jù)時,在考慮和權(quán)衡自身利弊的情況下,基本都會對關(guān)鍵指標進行加工和處理,對下真實可靠,對上卻受到懷疑。這種背景下的大數(shù)據(jù),因其數(shù)據(jù)取值不對稱,就具有了一定的欺騙性。
(三)大數(shù)據(jù)和小數(shù)據(jù)的數(shù)據(jù)使用都有權(quán)限限制
大數(shù)據(jù)背景下,業(yè)內(nèi)數(shù)據(jù)屬于內(nèi)部資料,一般不會對外開放。業(yè)外人員要想獲得相應的數(shù)據(jù),必須經(jīng)過逐級審批,且有限制權(quán)限。比如,人事、財務、合同、采購和審計等部門的非內(nèi)部人員想獲取相關(guān)數(shù)據(jù),如同非內(nèi)部人員想查看淘寶、微信、銀行或醫(yī)院等相關(guān)數(shù)據(jù)一樣,一般只能在對外開放的平臺上查看對外披露的數(shù)據(jù),但這些數(shù)據(jù)都經(jīng)過了加工和處理。要想收集到最原始的數(shù)據(jù)進行數(shù)據(jù)分析和預測,必須有相應的權(quán)限,并且經(jīng)過允許。由此可知,大數(shù)據(jù)只是供內(nèi)部有權(quán)限人員使用的平臺,外部想實現(xiàn)數(shù)據(jù)挖掘、采集、篩選和運算,用大數(shù)據(jù)分析和預測,基本無能為力。
三、建立內(nèi)控測試例外事項數(shù)據(jù)庫的目的與意義
在大數(shù)據(jù)背景下,集團公司作為國有大型企業(yè),已經(jīng)建立了一系列的數(shù)據(jù)體系。由于受使用權(quán)限等影響,人事、財務、合同、采購和審計等部門的非內(nèi)部專業(yè)人員一般無法獲取相應的數(shù)據(jù)資料。建立業(yè)內(nèi)小型數(shù)據(jù)庫,能夠擴大非內(nèi)部專業(yè)人員的使用范圍,為非專業(yè)人員提供一個通暢的查詢平臺。由于各業(yè)務之間存在一定的瓶頸,加上內(nèi)部之間互相涉密,系統(tǒng)間使用的框架、平臺和接口不統(tǒng)一,限制了大數(shù)據(jù)分析者運用大數(shù)據(jù)算法進行挖掘和統(tǒng)計分析的能力。在此,筆者以本公司內(nèi)控測試例外事項數(shù)據(jù)為例,簡述建立小型數(shù)據(jù)庫的目的和意義。
(一)梳理存在問題,方便查詢分析
按照內(nèi)控手冊要求,公司每年至少開展一次內(nèi)控測試,查找內(nèi)控體系設計和運行中存在的問題,修訂失效控制,維護內(nèi)控管理手冊。所屬單位完成例外事項整改任務后,大多數(shù)情況下都不會再去翻閱和查看,給日后使用帶來了不便。梳理內(nèi)控測試例外事項,建立數(shù)據(jù)庫可以為后續(xù)的查詢分析提供方便。
(二)提醒關(guān)注事項,避免重復發(fā)生
內(nèi)控測試例外事項數(shù)量是考核內(nèi)控體系運行情況的一項指標,建立內(nèi)控測試例外事項數(shù)據(jù)庫,可以提醒崗位人員及時關(guān)注相關(guān)事項,統(tǒng)計分析和查找存在問題的根源,有利于主管部門結(jié)合實際情況制定切實可行的防控措施,從而避免內(nèi)控例外事項的重復發(fā)生。
(三)防范潛在風險,推進控制執(zhí)行
內(nèi)控測試例外事項的產(chǎn)生是未能按照控制要求執(zhí)行的結(jié)果,內(nèi)部控制的關(guān)鍵是控制對應的風險。產(chǎn)生例外事項說明控制措施執(zhí)行不力或者失效,其對應風險造成的影響,雖然沒有立刻顯現(xiàn),但確實存在,如不認真對待,潛在風險一旦爆發(fā),后果和影響或不可估量。內(nèi)控例外事項數(shù)據(jù)庫對應了風險防范和懲處重復發(fā)生措施,為全面提升內(nèi)控執(zhí)行力提供了依據(jù)和支持。endprint
四、數(shù)據(jù)庫建設的程序方法
搭建數(shù)據(jù)庫的方法多種多樣,有系統(tǒng)、有軟件、也有表單。如前所述,系統(tǒng)數(shù)據(jù)庫由于內(nèi)部之間互相涉密,系統(tǒng)間使用的框架、平臺和接口不統(tǒng)一,限制了大數(shù)據(jù)分析者運用大數(shù)據(jù)算法進行挖掘和統(tǒng)計分析的能力。軟件建庫需要學習相關(guān)的專業(yè)技術(shù),Access也要具備相應技能。相比之下,筆者認為還是Office Excel表單結(jié)構(gòu)簡單、使用方便。這里,筆者以微軟Office Excel為例,簡述本公司內(nèi)控測試例外事項結(jié)構(gòu)性數(shù)據(jù)庫的建設程序和方法,其他不同類型小數(shù)據(jù)庫的建立,如人事、財務、合同、采購和審計等方法與此大同小異。
一是設計數(shù)據(jù)庫結(jié)構(gòu),整理統(tǒng)一表格。結(jié)合年度測試情況,根據(jù)需要歸類數(shù)據(jù)內(nèi)容,把各年度例外事項測試層級、測試主題內(nèi)容和領域名稱,例外事項問題及產(chǎn)生原因、問題根源,問題解決措施,重復發(fā)生例外事項懲處措施,提升內(nèi)控執(zhí)行力建議等統(tǒng)計分析內(nèi)容,一并設計納入數(shù)據(jù)庫結(jié)構(gòu)之中,形成統(tǒng)一的Excel表格,在征求意見的基礎上,修訂、完善數(shù)據(jù)庫結(jié)構(gòu),整理設計格式統(tǒng)一的內(nèi)控測試例外事項數(shù)據(jù)庫。
二是下發(fā)統(tǒng)計分析通知,指導表格填寫。在公司網(wǎng)頁上發(fā)布關(guān)于開展內(nèi)控測試例外事項分析工作的通知,明確分析期間、范圍、內(nèi)容和上報時間。組織所屬單位開展例外事項統(tǒng)計分析業(yè)務培訓,指導業(yè)務骨干分項填寫相關(guān)內(nèi)容,把建庫要求落實到基層對應部門,自下而上制定問題解決措施和重復發(fā)生例外事項懲處措施,經(jīng)存在問題的對應部門簽字確認后,提交主管領導審核。
三是收集反饋資料,審查對應內(nèi)容。例外事項統(tǒng)計分析業(yè)務主管部門相關(guān)人員在規(guī)定時間收集所屬單位上報的反饋資料,逐一審查對應內(nèi)容,發(fā)現(xiàn)不符合要求等問題及時溝通并返回修訂,直至全部合格后,把例外事項統(tǒng)計分析表整理匯總為統(tǒng)一文檔。之后調(diào)整表格順序,編制鏈接庫文件目錄。
四是制作VBA窗體,測試運行效果。首先,打開Excel數(shù)據(jù)表,主界面如未顯示開發(fā)工具,可在Office按鈕主菜單下選擇Excel選項,之后選擇常用,然后選擇勾選開發(fā)工具;其次,在主界面點擊開發(fā)工具,之后選擇錄制宏,完成宏錄制后打開開發(fā)工具,左側(cè)點擊Visual Basic,在視圖中點擊工程資源編輯器,在對象下點擊This Workbook,然后雙擊并編程;第三,在主界面插入中選擇用戶窗體,出現(xiàn)窗體和控件工具箱,之后設計窗體,然后雙擊窗體在UserForm1編程;第四,完成編程后設計圖片和文字格式,在主界面運行欄中選擇運行子過程/用戶窗體,出現(xiàn)運行界面后,輸入用戶名和密碼,之后進入查詢導航,然后調(diào)試程序并完成測試。
非結(jié)構(gòu)性數(shù)據(jù)庫的建設程序和方法與結(jié)構(gòu)性數(shù)據(jù)庫基本相同,只是編程、表單引用等更加煩瑣和復雜。
五、數(shù)據(jù)庫的使用方式
為有效防范潛在風險,全面提升內(nèi)控執(zhí)行力,制作完成例外事項統(tǒng)計分析數(shù)據(jù)庫后,可及時在公司網(wǎng)頁上發(fā)布,所屬單位崗位人員進入查詢系統(tǒng)后,可進行查詢和分析。
綜上所述,在大數(shù)據(jù)思維下建立例外事項小數(shù)據(jù)庫(內(nèi)控測試例外事項Excel統(tǒng)計分析小數(shù)據(jù)庫),是發(fā)展并應用大數(shù)據(jù)新型技術(shù)的前提和基礎,大數(shù)據(jù)和小數(shù)據(jù)相輔相成,相得益彰。
注釋:①百度百科、360百科。
(單軍亭單位為青海油田企管法規(guī)處(內(nèi)控與風險管理處);單昱單位為中國石油大學(華東)儲運與建筑學院;單晨單位為青海油田井下作業(yè)公司試油測試大隊;瞿晶珠單位為青海油田社區(qū)管理中心物業(yè)一公司)
[作者簡介:單軍亭(1964—),男,本科,畢業(yè)于北京科技大學工商管理專業(yè),云南大學經(jīng)濟管理研究生結(jié)業(yè),高級項目管理師,青海油田企管法規(guī)處(內(nèi)控與風險管理處)業(yè)務部門負責人,研究方向:企業(yè)內(nèi)部控制,綜合風險管理。單昱,中國石油大學(華東)儲運與建筑學院工程力學專業(yè)本科在讀。單晨,大專,石油工程專業(yè)。瞿晶珠,大專,計算機應用專業(yè)。]
參考文獻
[1] http://baike.so.com/doc/5387430-7565065.html[OL]. 360百科.
[2] http://baike.baidu.com/link?url=k40A0wYoiB74deIK8UI7sqpkm_xjBpQt4t6jxSj6AlF
ZZ-SOSrx_Y3OjMpvRZCslSGDFXaifIdpySL5MV2UY38CQmTYwqf3lAkl5kQNTYE7[OL].百度百科.
[3] 青山. Excel窗體設計制作方法[OL]. http://club.excelhome.net/forum.php?mod=viewthread&tid=137671&page=1&authorid=76888,2005-12-02.
[4] 單軍亭,單晨.淺談用大數(shù)據(jù)思維建立內(nèi)控測試例外事項小數(shù)據(jù)庫[J].青海油田企業(yè)文化,2016(2):61-62.endprint