張志恒+張顯庫+楊光平馬超+馮永孝
摘要摘要:利用Excel手動處理大量數據時工作量大、繁瑣,難以及時、準確篩選數據。用VC++(Visual C++)編程實現工作簿數據處理,能夠快速、準確地篩選出所需要的信息。以每年公布的1 1000余種SCI(Science Citation Index)期刊數據為例,編程實現對所需領域SCI期刊數據的快速篩選,便于科研工作者獲得領域具有高影響因子的SCI期刊數據信息,方便科研工作開展。
關鍵詞關鍵詞:VC++;數據處理;Excel工作簿;SCI期刊
DOIDOI:10.11907/rjdk.162170
中圖分類號:TP319文獻標識碼:A文章編號文章編號:16727800(2017)001013502
引言
美國科學情報研究所出版的《科學引文索引》(Science Citation Index,簡稱SCI)是世界核心期刊文獻檢索的主要工具,其收錄了全世界最重要和最具影響力的研究成果。具有高影響因子的SCI論文對于科研具有極高的參考價值。SCI數據庫內容繁多,快速、準確地篩選所需要的SCI期刊相關信息,對于科研人員具有重要意義。Excel是Office家族中功能強大的辦公軟件,使用廣泛。SCI數據可以通過Excel直接導出,大多數科研人員采用Excel手動篩選,以獲得所需的內容。人工處理SCI數據庫工作量大、易發生誤刪,影響最終結果的準確性。用VC++編程對Excel工作簿進行數據處理可以較好地解決這一問題。
VC++是Microsoft開發環境Visual Studio Professional 的一部分[1],VC++是常用的可視化界面開發工具,具有界面設計靈活多樣、代碼執行效率高、數據處理速度快等優點。利用VC++操作Excel,將兩者結合起來使用,對于快速處理數據具有重要意義[2]。
使用本文程序在Window10系統中利用VC++2013對Excel 2013的處理、編譯,達到了預期效果。
1Excel接口與對象模型
COM(Component Object Model)是一種面向對象的編程模式,它定義了對象在單個應用程序內部或多個應用程序之間的行為方式。VC++編譯的外部程序通過接口與Excel對象模型進行交互,從而實現對Excel的操作,相比早期2003版本,該程序接口和對象模型發生了一定變化,程序中用到的對象主要有Application、Workbook、Worksheet等[3]。
首先插入一個類:按2013版的Excel安裝位置對應地選擇為Excel.exe。選中常用的類對象:Application、Workbook、Workbooks、Worksheet、Worksheets、Range、Font,注釋類的頭文件#import。
3軟件介紹
3.1軟件設計原理
首先根據相關領域業關鍵詞進行初步篩選,篩選出含有此關鍵詞的所有SCI論文;然后在此基礎上,利用程序收集的關鍵詞庫作進一步篩選,刪除含有這個詞匯同時含有其它專業核心詞匯的一行數據;最后較為準確地篩選出所需要的論文數據。程序流程如圖1所示。
自定義篩選原理:通過學科關鍵字刪除不含有該學科的無關數據,通過自定義篩選之后還有一部分含有學科關鍵字詞根,同時明顯屬于其它學科的數據、例如“disease”中含有“sea”關鍵字,但明顯與航海交通無關,需要通過關鍵詞庫進一步刪除。
關鍵詞庫中含有10個學科的主要專業詞匯。部分關鍵詞如下[78]:
圖1程序流程 交控類:traffic;ocean;isa;ship;navig;Transport;model;automat
醫學類:Medic;diabet;psycho;toxicolog;dermatolog;cardiolog;nurs
生物類:Bio;parasitolog;nutrit;entomolog;metabolism;Anthropo
人文類:Cultur;publi;manage;
market;famil;child;Sociolog
環境類:Water;geographclimat;environ;ecolog;earth;geolog
物理類:material;nano;molecular;physic;nuclear
化學類:Combustion;carbon;oil;chem; tobacco;plastic;algebra;steel;
經濟類:Business;econom;financ;invest
農林類:Forest;fish;agr;struct;sphere;geomet
天文類:astronomy;osmos ;solar;Venus;lunar;meteor。3.2軟件界面介紹
系統界面如圖2所示。點擊“選擇”按鈕調取需要處理的Excel文件,可自定義關鍵字(系統有默認關鍵字,同時支持自定義填寫),勾選需查詢的領域,系統會在自定義篩選的基礎上重新刪除明顯與該領域無關的論文,界面中設有進度條,可以顯示數據處理情況,方便使用者獲得數據處理進度。點擊開始按鈕,進行篩選。