葛 川,王玉峰
(蘇州市科學(xué)技術(shù)情報研究所,江蘇蘇州 215021)
事實型數(shù)據(jù)是對客觀世界中事物的描述,可客觀地反映事物發(fā)展的過程和結(jié)果。對于科技領(lǐng)域來說,事實型數(shù)據(jù)是指長期積累形成的與科技創(chuàng)新全過程相關(guān)的各類科技信息資源,涉及客觀描述科技創(chuàng)新決策和具體的科技創(chuàng)新活動全過程的各類科技信息資源[1],具體可涵蓋科技政策、技術(shù)開發(fā)成果、知識產(chǎn)權(quán)信息等內(nèi)容以及其他有支撐作用的信息資源。為此,本文在分析蘇州市科技事實型數(shù)據(jù)建設(shè)現(xiàn)狀的基礎(chǔ)上,提出相關(guān)對策建議,對提升該市科技計劃項目的發(fā)展和決策具有十分重要的意義。
目前,科技情報機構(gòu)往往采用的是購買商業(yè)數(shù)據(jù)庫的方式來提供服務(wù)。但是,我們可以看到,商業(yè)數(shù)據(jù)庫提供的都是普遍性服務(wù),數(shù)據(jù)大部分主要集中于期刊、學(xué)術(shù)論文和學(xué)位論文等內(nèi)容,并且在使用上有很多限制,功能也比較單一(見表1)。要想在研究工作中形成優(yōu)勢,科技情報機構(gòu)必須構(gòu)建服務(wù)于特定對象和目標的事實型數(shù)據(jù)資源庫,對資源實現(xiàn)最大化利用,提升數(shù)據(jù)的使用價值。
科技事實型數(shù)據(jù)中有一部分數(shù)據(jù)主要貫穿于科技計劃項目管理的整套流程中,如項目指南發(fā)布、項目申報、項目評審、項目立項、簽訂項目合同、項目中期檢查、項目驗收、資料歸檔[2]。在各個階段,項目申報系統(tǒng)都會產(chǎn)生大量的事實型數(shù)據(jù),對這些數(shù)據(jù)的積累、使用和分析將會對我市的產(chǎn)業(yè)分布以及科技領(lǐng)域的發(fā)展情況有非常大的幫助作用。

表1 蘇州市科技情報機構(gòu)采購的商業(yè)數(shù)據(jù)庫比較
目前,科技情報機構(gòu)的業(yè)務(wù)很大程度上成為科技管理部門的職能延伸,承擔(dān)著越來越多的外圍性工作,成為科技管理部門的得力助手。我們搭建并維護著市科技計劃項目信息管理系統(tǒng),具有科技事實型數(shù)據(jù)庫數(shù)據(jù)整合和建設(shè)的獨有優(yōu)勢[3]。科技計劃項目管理系統(tǒng)雖然包含了從項目申請到項目驗收等流程中的很多數(shù)據(jù),但是,這些數(shù)據(jù)基本上還是處于一種分散的狀態(tài),沒有連結(jié)性。同時,這些數(shù)據(jù)還僅僅局限于科技計劃類別所包括的范疇,對于科技決策的支撐力度還遠遠不夠。
此外,科技情報機構(gòu)盡管采用自建或者與其他單位合作的方式開展科技發(fā)展動態(tài)研究、產(chǎn)業(yè)發(fā)展問題研究、科技發(fā)展戰(zhàn)略研究、科技發(fā)展跟蹤研究和科技發(fā)展預(yù)見研究等研究工作。但是,這些研究通常限于一隅,和當(dāng)?shù)貙嶋H情況結(jié)合的力度顯得不足,或者欠缺相關(guān)方面的事實數(shù)據(jù)導(dǎo)致研究成果不夠全面,從而不能對上級主管部門起到有效的輔助決策作用。
科技情報機構(gòu)建立完善的科技事實型數(shù)據(jù)庫不僅能提高自身能力建設(shè),還能對上級主管部門在進行項目決策時提供有依據(jù)的支撐。因此,科技情報機構(gòu)應(yīng)著重建設(shè)以下5 類科技事實型數(shù)據(jù)庫,為上級主管部門進行科技發(fā)展的決策和科技政策的實施奠定基礎(chǔ)。
(1)建設(shè)科技查新類事實型數(shù)據(jù)庫
科技查新是文獻檢索和情報調(diào)研相結(jié)合的情報研究工作,它以文獻為基礎(chǔ),以文獻檢索和情報調(diào)研為手段,以檢出結(jié)果為依據(jù),通過綜合分析,對查新項目的新穎性進行情報學(xué)審查,寫出有依據(jù)、有分析、有對比、有結(jié)論的查新報告[4]。因此,查新有較嚴格的年限、范圍和程序規(guī)定,有查全、查準的嚴格要求,要求給出明確的結(jié)論,查新結(jié)論具有客觀性和鑒證性。基于這些事實型數(shù)據(jù),我們可以有效積聚、整合和保存科技查新事實型數(shù)據(jù)資源,建立科技查新數(shù)據(jù)庫,分析科技成果的分布以及科技創(chuàng)新的發(fā)展態(tài)勢,從而更有效地支持科技計劃項目的管理和實施。
(2)建設(shè)科技項目類事實型數(shù)據(jù)庫
科技項目管理包括發(fā)布項目指南、項目申報、項目評審、中期檢查、項目驗收等過程[5]。在每個過程中都會產(chǎn)生大量的事實型數(shù)據(jù),如項目申報書、中期檢查報告、結(jié)題報告、驗收報告以及學(xué)術(shù)論文、學(xué)術(shù)專著和軟件著作等。基于這些事實型數(shù)據(jù),不僅可以進行科技發(fā)展趨勢的分析以及科研機構(gòu)的評價等基礎(chǔ)性研究工作,還可以進行技術(shù)發(fā)展預(yù)測與分析等服務(wù)。例如,基于項目申報書,就可以了解當(dāng)前的研究熱點,建立技術(shù)領(lǐng)域的發(fā)展演化模式等[6]。基于中期檢查報告和驗收報告,可以掌握項目的進展狀況,如各種參數(shù)指標的考量等,對產(chǎn)業(yè)或技術(shù)發(fā)展進行一些趨勢走向分析工作。
(3)建設(shè)政策類事實型數(shù)據(jù)庫
科技情報機構(gòu)在為上級主管部門對某些產(chǎn)業(yè)或者地區(qū)發(fā)展進行調(diào)研時,經(jīng)常需要了解某個國家或地區(qū)在某一時期的科技政策,如果平時沒有積累這些數(shù)據(jù),則很難對需要調(diào)研的內(nèi)容提供令人信服的數(shù)據(jù)支撐。因此,科技情報機構(gòu)應(yīng)有意識地、長期地收集并加工國家、省、市科技政策類數(shù)據(jù),具體包括科技政策、產(chǎn)業(yè)政策、稅收政策、投資政策以及人才政策等,以提高科技政策制定的權(quán)威性[7]。基于這些事實型數(shù)據(jù),能夠直觀、清晰地看出國家、省、市在科技發(fā)展方面的走向和態(tài)勢,同時能夠進行比較,引領(lǐng)國家、省、市向有利于區(qū)域發(fā)展的產(chǎn)業(yè)過渡。
(4)建設(shè)產(chǎn)業(yè)類事實型數(shù)據(jù)庫
當(dāng)前,隨著科技服務(wù)業(yè)在經(jīng)濟發(fā)展中占的比例越來越高,各級政府都紛紛將其列為政府的工作重點,與第一和第二產(chǎn)業(yè)一起支撐著區(qū)域的經(jīng)濟發(fā)展。由于業(yè)務(wù)密切聯(lián)系著科技主管部門,科技情報機構(gòu)能夠更深刻地感受到科技服務(wù)業(yè)在經(jīng)濟發(fā)展中發(fā)揮的作用。產(chǎn)業(yè)類數(shù)據(jù)包括一些宏觀統(tǒng)計數(shù)據(jù),如產(chǎn)業(yè)發(fā)展情況、投資情況,還包括產(chǎn)業(yè)統(tǒng)計數(shù)據(jù),如產(chǎn)業(yè)內(nèi)企業(yè)數(shù)量、企業(yè)銷售情況等,以及企業(yè)自身數(shù)據(jù),如企業(yè)基本情況、技術(shù)創(chuàng)新情況等等。基于這些事實型數(shù)據(jù),科技情報機構(gòu)可以對產(chǎn)業(yè)發(fā)展態(tài)勢、企業(yè)發(fā)展方向、區(qū)域經(jīng)濟發(fā)展情況進行分析,形成專題報告,以供上級主管部門在進行科技發(fā)展的決策時作為參考。
(5)建設(shè)專利信息事實型數(shù)據(jù)庫
專利信息作為科技創(chuàng)新成果的重要成果,對于科技戰(zhàn)略研究具有更加重要的意義。通過對專利信息的分析,可以獲取大量的情報,可以反映出技術(shù)發(fā)展趨勢、專利申請的經(jīng)濟利益趨向,以及專利申請者的研究開發(fā)方向、能力和經(jīng)濟實力等內(nèi)容[8]。科技情報機構(gòu)可以通過技術(shù)手段整合中國國家知識產(chǎn)權(quán)局、美國專利商標局、歐洲專利局、日本專利廳的多種專利數(shù)據(jù)源,并綜合專利題錄信息數(shù)據(jù)源、專利法律狀態(tài)信息發(fā)明說明書等內(nèi)容進行統(tǒng)計分析技術(shù),對這些數(shù)據(jù)進行深加工,形成高質(zhì)量的專利信息數(shù)據(jù)庫。基于這些事實型數(shù)據(jù),不僅可以對某一領(lǐng)域的發(fā)展情況進行分析,并用可視化的表達方式繪制出來,如專利地圖,從而能夠直觀地反映出歷年專利動向、專利技術(shù)分布和技術(shù)發(fā)展趨勢等信息;還可以對某一專利的研發(fā)人員進行跟蹤,掌握研發(fā)態(tài)勢,挖掘高精尖人才為企業(yè)發(fā)展助力。
科技事實型數(shù)據(jù)庫的建設(shè)將對今后的科技情報工作帶來充分便利,而大樣本、全樣本的分析,將為今后的科技項目決策提供強有力的支持。對這些數(shù)據(jù)的進一步分析和整合,可以實現(xiàn)如下的信息分析服務(wù)內(nèi)容。
(1)立項監(jiān)測。基于項目類事實型數(shù)據(jù),可以對項目負責(zé)人承擔(dān)項目情況進行分析,避免項目負責(zé)人同一年承擔(dān)多個項目的情況;同時,還可以對項目承擔(dān)單位進行監(jiān)測,避免承擔(dān)單位在多個計劃類別下進行申報造成的重復(fù)立項,為科技主管部門提供立項管理。
(2)產(chǎn)業(yè)研究。基于項目類事實型數(shù)據(jù)和產(chǎn)業(yè)類事實型數(shù)據(jù),可以分析區(qū)域內(nèi)不同行業(yè)或領(lǐng)域的發(fā)展變化情況,還能夠反映出區(qū)域?qū)Ω鞣N行業(yè)或領(lǐng)域的支持變化情況。而且,通過橫向和縱向比較,可以建立動態(tài)的產(chǎn)業(yè)地圖,直觀地顯示出區(qū)域產(chǎn)業(yè)發(fā)展情況,為科技主管部門在進行產(chǎn)業(yè)規(guī)劃時提供輔助決策參考。
(3)創(chuàng)新能力評估。基于項目類事實型數(shù)據(jù)和專利信息事實型數(shù)據(jù),可以對企業(yè)的歷年承擔(dān)項目、取得成果、科研人員構(gòu)成和專利著作等情況進行分析,從而能夠更好地判斷企業(yè)的發(fā)展情況,如研發(fā)實力和產(chǎn)出水平等,并能對真正具有創(chuàng)新的企業(yè)在經(jīng)費支持方面時有一定的提升,從而能夠更好地推動企業(yè)的發(fā)展以及區(qū)域的經(jīng)濟發(fā)展。
(4)技術(shù)預(yù)見。結(jié)合科技查新類事實型數(shù)據(jù)、產(chǎn)業(yè)類事實型數(shù)據(jù)和專利信息類事實型數(shù)據(jù),可以反映未來可能的發(fā)展趨勢及帶來這些發(fā)展變化因素的認識,為主管部門和企業(yè)決策者提供實施決策的基礎(chǔ)信息。
科技事實型數(shù)據(jù)庫建設(shè)是一項長期性的基礎(chǔ)工作,需要上級科技主管部門的重視和支持,同時也需要科技情報機構(gòu)采取有效的機制和開發(fā)新技術(shù),一同來推動這一項工作的開展。
(1)主管部門應(yīng)統(tǒng)籌規(guī)劃科技事實型數(shù)據(jù)庫建設(shè)工作
科技查新類、科技項目類和科技政策類事實型數(shù)據(jù)是基礎(chǔ)性資源,目前大多數(shù)都以數(shù)字化形式呈現(xiàn),如果不及時收集、加工和集中保存,數(shù)據(jù)就可能丟失。因此,上級主管部門應(yīng)統(tǒng)籌規(guī)劃科技事實型數(shù)據(jù)建設(shè)工作,加大科技事實型數(shù)據(jù)收集加工整合的經(jīng)費投入,推動科技事實型數(shù)據(jù)庫建設(shè)工作有序地開展。
(2)采用合作共建機制推動科技事實型數(shù)據(jù)庫建設(shè)工作
科技事實型數(shù)據(jù)通常都缺乏連結(jié)性,而且還需要長期的積累,加上科技情報機構(gòu)自身業(yè)務(wù)依托上級主管部門的性質(zhì),往往都很難做到全面、完整地收集和加工這些事實性數(shù)據(jù)。因此,科技情報機構(gòu)需要與其他機構(gòu)協(xié)作共建科技事實型數(shù)據(jù)庫,拓寬合作渠道,一方面既可以提升自身能力,另一方面也可以有效地提高數(shù)據(jù)建設(shè)的質(zhì)量,從而能夠很好地支撐科技情報研究能力的整體提升。
(3)研究開發(fā)新技術(shù)支撐事實型數(shù)據(jù)庫建設(shè)工作
利用新技術(shù)來開發(fā)高效的服務(wù)平臺,連通這些數(shù)據(jù)之間的關(guān)系,才能有效地對這些數(shù)據(jù)源進行整合,從而能夠更好地提升這些數(shù)據(jù)的使用價值。以往的數(shù)據(jù)庫建設(shè)方法和技術(shù)已不適應(yīng)目前的環(huán)境,信息技術(shù)的快速發(fā)展,需要我們利用各種技術(shù),如數(shù)據(jù)分布處理的技術(shù)、數(shù)據(jù)的抽取、數(shù)據(jù)的清洗、數(shù)據(jù)的標引、數(shù)據(jù)的索引等來對這些科技事實型數(shù)據(jù)進行加工整理。而一旦隨著這些數(shù)據(jù)量達到一定的級別,則需要使用大數(shù)據(jù)及相關(guān)技術(shù),如Hadoop,NoSQL,Mongo DB 來對數(shù)據(jù)進行處理,提升數(shù)據(jù)使用和運轉(zhuǎn)的效率。
[1]賀德方.基于事實型數(shù)據(jù)的科技情報研究工作思考[J].情報學(xué)報,2009(5):764-770.
[2]劉軍,范文虎.初探山西省科技計劃項目科學(xué)數(shù)據(jù)的匯交管理[J].中國科技資源導(dǎo)刊,2010(5):37-42.
[3]劉軍.科技計劃項目事實型數(shù)據(jù)庫建設(shè)研究[J].中國科技資源導(dǎo)刊,2013(3):97-99.
[4]李萬倫,黃文斌.我國科技查新工作存在的問題與對策[J].中國科技成果,2005(21):10-11.
[5]李海峰,黨延忠.科技項目管理中知識的界定與表示方法研究[J].項目管理技術(shù),2010(2):29-34.
[6]黨延忠.科技管理及科研項目管理——我國基礎(chǔ)性研究科研管理中的知識管理[R].大連:2009.
[7]賀德方.事實型數(shù)據(jù):科技情報研究工作的基石[J].情報學(xué)報,2010(5):771-776.
[8]吳元良,黃雍,唐順梅,等.淺析專利信息利用在企業(yè)專利預(yù)警分析中的應(yīng)用[A].武漢市科學(xué)技術(shù)協(xié)會.科技創(chuàng)新與國家中心城市建設(shè)——武漢市第五屆科學(xué)年會論文集[C].武漢:武漢大學(xué)出版社,2013.