科技網站信息質量形式評價理論模型研究*

2016-10-19 08:05:08范佳佳葉繼元

圖書館論壇 2016年10期

范佳佳，葉繼元

科技網站信息質量形式評價理論模型研究*

范佳佳，葉繼元

文章以科技網站為研究對象，以文獻計量學和全評價為理論基礎，運用假設、推理方法研究科技網站信息質量形式評價指標，利用灰色關聯度法構建科技網站信息質量形式評價理論模型。研究發現：形式評價作為內容與效用評價的補充，可以將內容評價指標作為形式評價標準，將主題特征度、權威度、新穎度、準確度、熱度等單一指標作為形式評價指標，以簡化指標體系、優化評價模型。

科技網站信息質量形式評價評價模型

引用本文格式范佳佳，葉繼元.科技網站信息質量形式評價理論模型研究［J］.圖書館論壇，2016（10）：41-48.

AbstractThis paper is mainly about science and technology websites on the basis of literature metrology and“full evaluation”.It uses the hypothesis and reasoning method to study formal evaluation indexes of science and technology websites’information quality，and uses the method of grey correlation degree to construct the formal evaluation theoretical model of the information quality of science and technology website.The study finds that formal evaluation can be used as the supplement to content and effectiveness evaluation，content evaluation indexes as the formal evaluation standards，and single indexes like subject characteristics，authority，novelty，accurate，and heat degree as formal evaluation indexes，so as to achieve the goal of simplifying the index system and optimizing the evaluation model.

Keywordsscience and technology website；information quality；formal evaluation；evaluation model

0　引言

葉繼元在《人文社會科學評價體系探討》一文中首次提出全評價體系，構建起“六位一體”的全評價體系框架。他認為：“人文社會科學學術評價涉及許多方面，是個復雜的體系，評價主體、評價客體、評價目的、評價標準與指標、評價方法和評價制度至少六大要素構成了評價體系的第一層結構?！薄靶问皆u價是評價主體對評價客體外部特征的評價?！薄皟热菰u價指評價客體內含特征，是關于質量的評價?！薄靶в迷u價是實踐、時間與歷史對評價客體實際作用和價值的驗證或最終評價?！薄皬闹R的三要素可以推論出，所有的評價都可以分成形式評價、內容評價和效用評價三種方式或評價指標的三個方面?！保?］筆者認為，由于主觀感受的相對粗糙和不準確，依據全評價理論框架，從內容與效用兩個主觀維度評價科技網站信息質量存在準確性、權威性和客觀性欠佳等問題。因此，單純從用戶主觀判斷來評價網站并不可靠，需要結合客觀數據，從外在形式角度對網站進行形式評價。本文重點論述科技網站信息質量形式評價理論模型的構建過程。

1　文獻計量學是網站形式評價的理論根基

所謂形式評價，是“對評價客體內含知識的外部特征的評價”，“最終的評價可用數字、數據反映”，是“精細評價”的基礎［1］?？萍季W站信息質量形式評價是對反映網站信息質量的可觀測外部特征的評價，這些可觀測外部特征可以量化，而且形式評價可以作為科技網站信息質量全評價體系的基礎。網絡計量學的網絡資源分布規律、網絡資源老化規律、Web鏈接測度指標等定律和指標是網站量化指標評價的基礎，對科技網站信息質量形式評價起指導作用。Rousseau、Ingwersen和Cui［2-4］等通過研究證實：網絡資源分布規律深受文獻計量學的集中分布規律影響；網絡資源老化規律的半衰期概念來源于文獻計量學被引半衰期和引文半衰期；Web鏈接分析也同樣來源于科學引文思想。因此，可以認為網絡計量學起源于文獻計量學，文獻計量學是網站形式評價的理論根基。綜上所述，可以利用文獻計量學測度指標對科技網站信息質量作形式評價。

2　形式評價標準的來源

匈牙利學者貝克在《一種測量科學成果質量的方法》中提出一種測量科學成果質量的新方法［5］，將科學認識論結構作為依據，并可以測量42個等級的破除性成果和創建性成果。他認為，科學思維模式可分為6個階段，即設立公理、建立定理、聯結理論模型及現實、獲得經驗事實、探索性實踐、程序性實踐。貝克通過對40項成果的實際測量得出結論：該測量科學成果質量的方法適用于任何一門學科。由此推斷，可以將專家的評價意見進行分解和量化，實現內容與效用評價定量化，彌補單純主觀評價的人為因素干擾。但在實際操作中，還需根據評價目的和實際情況選擇適宜的定性評價量化方法，不能一味追求精細評價而犧牲效率，也不能貪圖實施方便而簡化內容和效用評價過程。所以，當利用貝氏模式將專家意見量化有一定難度的情況下，選擇替代方法不失為好的選擇。張詠在其博士論文中談到，“網絡信息資源評價的核心問題是判斷網絡信息資源是否滿足特定用戶群的特定的與潛在的信息需求”［6］。這與內容和效用評價有關，而形式評價標準也應從用戶滿意的角度選取，可以選擇將內容與效用評價指標量化處理的方式進行形式評價。本文中的科技網站信息質量形式評價是以用戶滿意為主導的全評價，在形式評價標準的選擇上同樣遵循用戶主導和用戶滿意的原則。科技網站信息質量內容與效用評價指標的選擇來自專業網站資深用戶，而專業網站資深用戶從某種程度上說就是某個專業的專家。用戶選擇的內容與效用評價指標反映了影響用戶滿意的主要因素，以往利用專家問卷和打分制方法構建的評價指標體系與本文的內容和效用評價在調查對象上具有同質性，均屬專家主導。所以，科技網站信息質量形式評價指標實質上是內容和效用指標的量化，即對科技網站信息質量用戶滿意度影響因素指標的量化。在內容指標足可量化充分的前提下，效用評價這一事后評價指標若較難量化，可以不作為形式評價的備選標準。本文采取這一方法。

3　形式評價指標的選擇

3.1形式評價指標選取的注意事項

（1）形式評價研究對象是科技網站相關主題的網頁。訪問科技網站的用戶一般是某個主題領域的研究人員或學生，其訪問目的基本相同且明確，即瀏覽或查找相關主題科研信息，以期提高自身研究水平和能力。網站中不相關的非主題網頁基本不是用戶訪問的根本目標，所以科技網站信息質量形式評價對象是該類網站的相關主題網頁，所得評價結果是相關主題網頁信息質量的總和。這一結果最終反映了科技網站信息質量形式評價測度水平。

（2）形式評價指標選取的原則是全面性、簡單性、易操作性?？偨Y以往文獻，用定量方法評價學術網站信息質量的指標主要有主題相關網頁量、主題特征度、被文獻引用量、作者權威度、共鏈強度［7］、網絡影響因子［8］、外部鏈接數［9］、鏈接密度、頁面平均鏈接數［10］、網站更新周期［11］、特定用戶需求滿足程度［12］、信息資源內容廣度和深度、反映事物或系統屬性的客觀程度［13］、網站同被引量［14］等。上述評價指標基本涵蓋了反映學術網站信息質量的所有因素。本文的形式評價指標是所選評價標準的細化，需根據評價標準制定下位評價指標，以上總結的經驗性評價指標可作為備選參考。本文制定評價指標的原則是既要做到全面，能基本涵蓋反映科技網站信息質量的各個方面，又要保證指標的簡單化，用最少的指標反映評價標準，在數據獲取時能做到易于操作、方便易行，即每個形式評價標準配備一個評價指標，并且該指標能充分反映標準的內在含義。

（3）形式評價實證研究對象的計量單位具有相對性。評價在字面上有排名、排序的涵義，所以評價結果是相對的。這就決定了評價對象的計量單位是相對的，即可以根據每個評價指標的實際情況選擇不同的計量單位，既可以選擇平均主題網頁的計量結果、計量結果的百分比，也可選擇全部相關主題網頁的計量結果等。本文比較傾向前兩種方法，原因在于，這樣可以規避因網站規模和成立時間的差異而造成的評價誤差。

（4）對數據量大的網站采用抽樣方法采集數據。袁毅認為評價網站準確性可采取下列方法：“抽樣檢查網站中的概念解釋、原理解釋、試驗方法、結論是否與百科全書、教科書相符?！保?］所以，本文對數據量大的網站采用抽樣的方法采集評價樣本。同時，注意到網站用戶瀏覽和查詢的內容主要是最新科技信息，并且網站建設水平和信息容量不斷變化，最新的數據更能反映網站建設現狀和信息質量，而歷史性數據對評價網站現實狀況意義不大。所以，本文采用整體分層抽樣，局部簡單隨機抽樣的方法對近1-2年的數據進行重復抽取采樣。樣本量參考沈浩提出的：不同規模的總體在P=0.5時，使用簡單隨機抽樣，且以誤差界限為0.05、置信度為95%的標準估計P所需的樣本容量［15］（參見表1）。采用的隨機抽樣工具參考段宇鋒的代碼，并進行了修改，在Microsoft Internet Explorer環境下運行［10］。

表1　不同總體規模數據所需的樣本量

（5）各評價指標值在實證階段需進行統一標準化的處理。本文擬運用灰色關聯度方法和層次分析法構建科技網站信息質量形式評價模型，由于各評價指標值計量單位不同，在評價模型中需要進行歸一化處理，以保證評價結果的正確性。

（6）形式評價實證研究中，數據抓取的欄目限定在科技信息范圍內。形式評價實證研究需要對評價客體進行網站數據批量獲取，抓取范圍包括有關主題科技信息的所有欄目；而有關招聘、期刊論文數據庫、相關機構鏈接、友情鏈接、合作伙伴鏈接、論壇鏈接、在線調查、圖片、視頻、廣告等欄目不在評價對象之列，不予以抓取。

3.2形式評價備選指標討論

根據信息內容質量評價指標，結合上文提到的經驗性形式評價指標，下文用假設和推理方法討論形式評價可能選擇的指標，即假設形式評價采用以下評價指標作為評價標準。根據文獻計量學理論，結合核心期刊評價方法，討論各評價標準下可選的評價指標，通過比較，選擇唯一具有全面性、簡單性、易操作性的評價指標。

3.2.1主題相關性標準

主題相關性即網站的主題覆蓋度，用于表達網站涉及主題的深度和廣度。主題相關性的概念來源于網絡資源分布定律，而網絡資源分布定律深受文獻計量學三大集中分散定律的影響，即布拉德夫定律、洛特卡定律、齊普夫定律。所以，可用文獻計量學的三大集中分散定律指導主題相關性下位指標的選擇。袁毅提出用相關網頁量和主題特征度兩個定量指標測度網站的主題相關性［7］。相關網頁量是網站主題相關網頁的數量；主題特征度是指網站擁有主題特征詞的總和。相關網頁量法源自核心期刊評選的載文量分析方法，這是一種粗略估計的方法，并且會受主題搜索技術、主題忠實表達程度的影響。所以本文選擇袁毅提出的以主題特征度作為主題相關性的評價指標。主題特征詞是“能體現某學科、專業或主題內容特征并能區別于其他學科、專業或主題內容的關鍵詞”［7］。對主題特征詞的提取，本文借鑒了袁毅的方法并加以改進：首先，以主題、題名、關鍵詞、文摘為檢索入口，在權威數據庫中檢索主題相關文獻，合并主題文本，統計高頻詞，制作詞頻共現矩陣，統計高共現詞；檢索相關會議信息，提取主題特征詞；檢索近年綜述文章以獲取主題特征詞；在相關主題網站提取主題特征詞。然后，將提取的主題特征詞進行去重、篩選過濾，再利用最終獲取的主題特征詞對實證網站進行主題抓取。

本文的主題特征度計量方法與袁毅提出的有所不同：鑒于網站建設規模、網站功能屬性、成立時間的差異性，計量各網站總體主題特征度無法做到科學對比和排名。而且，部分主題特征詞在同一網頁會重復出現，造成重復計算的問題。所以，根據前文所述計量單位的相對性原理，本文用網站含有主題特征詞的網頁數與網站總網頁數的比值表示“主題特征度”。

主題特征度指標相比相關網頁量指標的主題覆蓋度更高，是相關網頁量指標的有力補充。相關實驗表明“大多數網站的相關網頁量指標與主題特征度指標評價結果是一致的”［7］。所以，本文僅選擇主題特征度一個指標測度主題相關性。

3.2.2權威性標準

網站權威性代表信息的可靠性和可信性，可以參考已有研究結論，從信息作者、編輯、責任者或信息本身的權威性角度度量網站的權威性。需要說明的是，網站是由一個個網頁構成的，網頁的權威性總和構成了網站的權威性。所以，需要以網頁作為網站權威性研究的基本單位，而不能簡單靠網站的責任者、創辦者的權威性來考察。

袁毅從作者權威度和用鏈接衡量的網站權威度兩個角度考察網站的權威性［7］。但隨著網站建設的不斷發展，現在很多學術網站的科技新聞并不注明來源作者，而以信息的來源機構代替，并且新聞編輯的權威性更無從查起。因此，在新的網絡環境下，作者權威度對本文不太適用。

同樣，目前許多網站上的鏈接并不鏈接到具體網頁，而是直接與網站首頁鏈接，有的則刻意與權威網站建立鏈接，以提高知名度。袁毅也認為，一個網站可能因為建站機構的現實權威性而獲得更多的鏈接。她通過大量的文獻研究得出結論：不能簡單地將鏈接或其他相關測度作為評價網站的指標，必須提取反映網站質量的實質性鏈接才能有效評價網站。其實，研究學術網站的鏈接情況需要以學術網站的學術主題相關網頁的被鏈接情況為研究對象。然而，由于數據抓取手段的限制，往往很難將非主題學術網頁的鏈接剔除。更重要的是，網頁的學術價值并不能憑被鏈接次數反映。有的網頁被鏈接次數多，原因在于它有助于進一步查找并獲取豐富信息，其本身并不具備很高的學術價值。段宇鋒在他的博士論文中也詳細論述了關于利用鏈接指標評價網站的局限性，他認為：網絡鏈接方法應用網絡計量理論存在爭議，商業搜索引擎并不是開展網絡鏈接研究的最佳工具，網絡鏈接抽取會出現不全面和不準確的現象［10］。鏈接機理的復雜性和鏈接數據獲取的不穩定性，導致利用鏈接指標，包括網絡影響因子來評價網絡資源有一定的局限性。

根據PageRank算法原理，本文認為利用其判斷網頁的質量有一定的可信性和可行性。由于不同語言網頁的PageRank值沒有可比性，且PageRank也并非為評價中文網頁而設計，同時其評價學術網站的算法并未考慮網頁的日期和域的價值，所以，應慎重考慮將PageRank值作為網站權威性指標。

袁毅提出利用網站被文獻引用量來測量學術網站的實用性，即通過統計學術文獻引用網站信息的數量評價網站的實用性，實質是考察網站主題覆蓋度的深度問題。該觀點為后人的研究提供了啟示，但由于受備檢學術數據庫、引用動機、檢索策略設計等方面的制約，在實際操作上有一定的局限性。本文受此啟發，將期刊引用定律引入到學術網站權威性評價指標的選擇中。

本文認為，期刊文獻引用定律可以作為網站權威性評價的指導原理。核心期刊的評選方法之一即是統計期刊被引量，被引次數多的刊物一般是某個領域的核心刊物，在此領域內具有一定的權威性。由此推理，學術網站信息被引用（轉載）次數多，也代表此網站在某個學術領域的權威地位。由于網站是由網頁構成的，可轉化為評價網頁的被引用（轉載）次數。

網站內的信息或新聞有的以一個網頁存儲，有的分成幾個網頁，但信息或新聞標題只有一個。每條信息或新聞頁面一般都標有“來源”，這個“來源”分為兩種：一種是來自網站原創；另一種是引用（轉載）其他網站。一個標題只有一個原創來源。所以，本文的思路是：以抓取數據的標題為單位，計量該標題被全網引用（轉載）的總次數（不包括原創來源的自引），次數越多說明該條信息或新聞的權威性越強。在評價時按被引次數計分，如被引用1次記為1，2次記為2。特別說明的是，在被引次數相同情況下，網站原創信息或新聞得到的計分要更高，因為它不依賴轉載權威性高網站的內容來賺取權威性，屬于原創，具有自身的權威性。對于抓取數據量大的網站可以考慮采用總體分層、各欄目簡單隨機抽樣的方法，利用抽樣樣本評價總體。將抽樣數據的計分總和/抽取樣本數量作為網站權威性評價的指標，命名為權威度。

權威度指標是依據核心期刊評選方法中引文量指標而設置的，來源于歷史驗證的經驗性指標，具有一定的可靠性和全面測量性，并且這一指標在實際操作上可以依靠檢索和抓取方式獲得，較為簡單、易操作。所以，本文只利用權威度一個指標測評網站的權威性。

3.2.3準確性標準

網站的準確性表示網站信息可靠和沒有錯誤的程度。袁毅采用內容分析方法觀測網站準確性，從字、句、概念、試驗方法、聯系信息、數據、圖表、日期等諸多關鍵點進行評判。內容分析方法具有精確評價的優點，但實施起來較為復雜，可操作性不強。另一種方法則是借用語義網技術，利用元數據制作XML結構化網絡文檔，使機器能自動代替人工識別關鍵點信息，進行比較并作出評價，但這種方法明顯將問題復雜化了。

Fritch等認為網站信息本身的權威性可從信息的準確性來判斷［16］。本文也認同網站權威性與準確性有一定聯系，兩者之間往往是相關的。所以從某種意義上說，網站的準確性可以用權威性來測量。本文選擇的測量方法與權威性基本相同。不同在于，相同被引次數的原創信息不再區分地單獨打分。對不注明信息來源的新聞或網頁記0分，原因在于沒有標注來源，其準確性有待考察。本文將這一平均準確性的指標命名為準確度。

3.2.4時效性標準

信息的效用由時間決定，并有一定的期限。信息價值的大小與發布信息的時間密切相關。信息一經形成，發布速度越快，其價值越大。筆者認為，信息時效性并不是簡單指信息發布時間遠近和更新速度，而是網站信息發布時間與事件發生時間的時間差，差值越小，信息的時效性越強。

信息時效性強的網站被用戶瀏覽和利用的次數顯然比時效性弱的多，文獻老化定律即說明了這點。用定量方法測量信息時效性的研究中，王玉斌根據信息老化計算方法和信息被點擊或者關注的次數構建老化模型，通過網站信息在各時刻影響力的變化測量網站的時效性［17］。他通過編制算法，實現了對信息時效性的觀測。但在實際應用上，獲取特定時間段內的點擊數量、關注次數和評論數量等歷史數據有一定難度。同時，該研究將信息時效性與信息價值之間建立直接相關關系，不考慮其他影響信息質量的因素，本文不宜采用。另外，崔鑫鑫研究了應急衛生防疫保障信息時效性的影響因素，包括信息傳輸者、信息傳輸渠道、信息接收者和外部環境［18］。這一研究深入挖掘了測量信息時效性的各個維度，但方法過于復雜，對于本文的研究可借鑒性不強。

筆者認為，應牢牢把握信息時效性的內涵，用網站信息發布時間與信息事件發生時間的時間差值測量時效性。將差值按大小分成不同等級區間進行打分，以打分總和作為網站時效性觀測值。鑒于信息事件發生時間隱藏在網頁字里行間，沒有固定位置，機器干預有一定難度，需要人工逐條打開網頁仔細閱讀，進行內容分析。此方法操作較為復雜、繁瑣，對于抓取數據量大的網站，可以考慮采用抽樣評價，即將抓取數據進行時間倒序排列，采用各欄目分層抽樣，欄目內簡單隨機抽樣相結合的方式來抽取樣本。分析樣本時間差值，將樣本時間差總和/含有時間差值的樣本網頁數作為網站信息時效性初步評價結果。

具體操作上需注意的是，網站新聞或信息標題鏈接旁的時間一般為網站更新時間或信息發布時間，有的發布時間則顯示在打開鏈接后的頁面題頭或結尾。通常以“時間、發布時間、日期或發表時間”等字樣標注，或無文字提示，只列出時間。信息事件發生時間一般存在于頁面文字內容之中；對于一些特殊情況，如網頁引用專業文獻，應以原文發表時間作為信息事件發生時間。預報性消息的時間差用負數表示。如無法找到信息事件發生時間，如學者發表的小品文，則不計入評價范圍，樣本的空缺用后面網頁補充。

特別說明的是，測量網站信息時效性要考慮網站的更新頻率。更新頻率除了依賴于網站日常維護，還與網站性質有關。比如，研究機構網站報道內部新聞較多，若沒有新事件發生則不會更新。所以，更新頻率不是評價網站信息時效性的決定因素。在實證階段，篩選出的網站與主題高度相關，用戶對其充分了解，網站更新頻率有一定保障。因此本文以網站各欄目最后一次更新時間的均值為評價標準。如果此值沒有超過一定時限，則認為該網站信息時效性在更新頻率上通過。若不通過，則將其時效性減半。本文將1/［（樣本時間差總和/含有時間差值的樣本網頁數）（更新頻率不通過的乘以2）］定義為觀測科技網站信息質量時效性的指標，命名為新穎度。

新穎度是把握信息時效性含義而設置的科技網站信息時效性評價指標，已具有全面測量時效性的功能，所以本文只利用這一指標衡量時效性。

3.2.5科技前沿性標準

科技前沿性指網站能反映科技前沿信息的程度，即網站包含科技前沿信息的數量。與主題相關性類似，文獻計量學三大集中分散定律同樣指導科技前沿性下位指標的選擇，同樣可以將載文量指標引用到科技前沿性的評價中。袁小姍在科技信息網站內容特色性評價標準下設置的一個指標是“科技特色信息含量”，主要指網站科技特色欄目所包含的信息數量［19］，但這一指標在概念上有些模糊，比如何為“特色欄目”？如何把握？“信息數量”采用的計量單位是篇數還是網頁數？另一種評價科技前沿性的方法是直接對網站內科技前沿信息數量進行統計，如會議信息、基金項目信息等，但缺點是由于這種信息在網站中分布比較分散，在查找時較易遺漏，較難操作。

參照主題特征詞，本文提出“熱詞”的概念，即網站中包含反映科技前沿性信息的主題詞，是“能體現某學科、專業或主題內容特征并能區別于其他學科、專業或主題內容的，且能代表最前沿科技信息的關鍵詞”。［7］熱詞的選擇首先以主題、題名、關鍵詞、文摘為檢索入口，在權威數據庫中檢索主題相關文獻，合并主題文本，按年代排序統計高頻詞；檢索最新會議信息，提取會議關鍵詞；檢索近年綜述文章，獲取最新關鍵詞；從相關主題網站提取新詞。而后將提取的高頻詞、關鍵詞、新詞等去重、篩選過濾，得到熱詞。參照本文主題特征度的計量方法，提出“熱度”這一概念，以測度科技前沿性下位指標，即網站含有熱詞的網頁數與網站總網頁數的比值。

上文提到的諸多測度網站科技前沿性的指標和方法與熱度的測度功能相同，在實踐中，熱度測量能較易做到抓取全面、準確和易于操作。筆者認為，熱度基本能比較全面地計量網站科技前沿的程度。因此本文僅選擇熱度一個指標測度網站科技前沿性。

3.2.6其他標準

除以上5個信息內容質量評價指標外，內容與效用評價模型中還有啟發性、交流性和廣泛性3個指標。啟發性標準反映網站對用戶的正面作用，很難從客觀的角度進行量化；交流性標準可以通過網站提供的交流平臺的數量、用戶發帖和回帖的頻次度量；廣泛性表示網站涉及主題的廣度，可利用主題覆蓋度指標測量。此外，參考以往文獻，其他較常見的網站信息質量形式評價標準還有實用性標準、原創性標準、客觀性標準等。參考袁毅［7］對實用性的理解，實用性標準下可設置引文指標；通過信息來源判斷原創信息數量，可觀測網站原創性；客觀性標準要通過較復雜的內容分析手段，如對比教科書或權威網站、咨詢專業人員等。對于以提供鏈接為主的網站，則要評價其出鏈質量。網站中包含較多自創軟件的，還要分析其軟件性能的稀有性。

4　形式評價指標權重的確定方法

本文運用層次分析法確定科技網站信息質量形式評價指標權重?；舅悸啡缦拢旱谝?，構造判斷矩陣。采用美國運籌學家T·L·薩蒂教授提出的1-9標度法對不同評價指標進行兩兩比較，構造判斷矩陣。筆者利用專家打分的方法對各判斷矩陣中的指標進行兩兩比較。第二，求解判斷矩陣A的特征根，找出最大特征根λmax及其對應的特征向量W，即得到同一層各指標相對于上一層指標的相對重要性的權重排序。第三，用T· L·薩蒂的平均隨機一致性指標對判斷矩陣進行一致性檢驗。根據各個平均一致性指標，求出判斷矩陣的一致性指數CI=（λmax-n）/（n-1）、隨機一致性比率CR=CI/RI。若CR＜0.10，則認為矩陣具有滿意的一致性；否則必須重新調整矩陣，直至矩陣具有滿意的一致性［20］。

5　科技網站信息質量形式評價理論模型

利用層次分析法確定指標權重后，應用灰色關聯度分析方法構建科技網站信息質量形式評價模型。本文形式評價指標體系共分為3層，即目標層、判斷準則層和措施層等3級指標。目標層為“科技網站信息質量形式評價”用字母“A”代表；其下有判斷準則層，即評價標準；措施層，即評價指標。首先確定參考序列，記為x0k，（k=1，2，...，n）。關聯分析中與參考序列作關聯程度比較的序列稱之為比較序列，記為x1k，x2k，...xmk。這m個比較序列與參考序列之間的關聯度r0i可按式公式1計算：

其中εik是第k個時刻比較序列xik與參考序列x0k的關聯系數，計算方法見公式2：

公式2中的△ik=|x0k-xik|稱為參考序列x0k與比較序列xik在第k時刻的絕對值；△min=ρ稱為分辨系數，是為了削弱因最大絕對差值過大而失真的影響，以提高關聯系數之間的差異顯著性而人為給定的系數，一般取0＜ρ＜1。關聯度分析的主要目的是對影響參考序列的諸多比較序列的影響程度依大小進行排序，稱為關聯序。那么記：

上式中，R=［r1，r2，r3…rm］T，為m個被評對象的綜合評判結果向量；W=［w1，w2，w3…wn］T，為n個評價指標的權重分配向量，其中這樣，R=WET可作為科技網站信息質量形式評價參考模型。結合可確定的模型構成因素，科技網站信息質量形式評價理論模型可如下表達：

圖1　科技網站信息質量形式評價理論模型

6　研究結論

本文將全評價和文獻計量學作為基礎理論，以主題相關性、權威性、新穎性、準確性、科技前沿性、啟發性、交流性和廣泛性等內容與效用評價指標作為科技網站信息質量形式評價標準。通過假設推理，設計主題特征度、權威度、新穎度、準確度、熱度等單一指標作為形式評價指標，利用灰色關聯度方法構建科技網站信息質量形式評價理論模型，達到簡化指標體系、優化評價模型的目的。同時，形式評價作為主觀評價的有力補充，可與內容、效用評價相結合，并為實證證明“全評價”的科學性打下理論基礎

［1］葉繼元.人文社會科學評價體系探討［J］.南京大學學報（哲學·人文科學·社會科學），2010，47（1）：97-110.

［2］Rousseau R.Sitations：an exploratory study［J］.Cybermetrics，1997，1（1）：1.

［3］Ingwersen P.The calculation of web impact factors［J］. Journalofdocumentation，1998，54（2）：236-243.

［4］Cui L.Rating health Web sites using the principles of citation analysis：A bibliometric approach［EB/OL］.［2003-03-19］.http：//www.jmir.org/1999/1/e4/.

［5］貝克.一種測量科學成果質量的方法［J］.科學、技術與辯證法，1987（2）：79-86.

［6］張詠.環境科學網絡信息資源評價研究［D］.南京：南京大學，2002.

［7］袁毅.核心網站評選的理論與方法［M］.北京：北京圖書館出版社，2005.

［8］曹梅.教育網站評價的網絡計量模式初探［J］.開放教育研究，2011（5）：103-107.

［9］劉友華，戚愛華，杜佳，等.學術網站評價指標體系的構建與應用［J］.情報科學，2008（1）：64-68.

［10］段宇鋒.網絡鏈接分析與網站評價研究［D］.武漢：武漢大學，2004.

［11］張詠.網絡信息資源評價的方法及指標［J］.圖書情報工作，2001（12）：25-29.

［12］劉雁書，方平.網絡信息質量評價指標體系及可獲取性研究［J］.情報雜志，2002（6）：10-12.

［13］查先進，陳明紅.信息資源質量評估研究［J］.中國圖書館學報，2010（2）：46-55.

［14］邱均平，楊思洛.基于被引的學術網站評價探析［J］.情報理論與實踐，2009（7）：69-73.

［15］沈浩.樣本量的確定［R］.北京：北京廣播學院新聞傳播學院調查統計研究所課程講義，2001.

［16］Fritch J W，Cromwell RL.Evaluating Internet resources：Identity，affiliation，and cognitive authority in anetworked world［J］.Journalofthe American Society for Information Science and Technology，2001，52（6）：499-507.

［17］王玉斌.基于信息內容時效性改進推薦算法的策略研究與實驗［D］.北京：北京郵電大學，2013.

［18］崔鑫鑫.軍隊應急防御保障信息時效性研究［D］.重慶：第三軍醫大學，2006.

［19］袁小姍.科技信息網站評價研究［D］.吉林：吉林大學，2011.

［20］范佳佳，高潔.外語類院校核心競爭力評價模型構建——以高校T為例［J］.重慶大學學報（社會科學版），2012（6）：91-95.

（責任編輯：沈麗霞）

Research on the Formal Evaluation Theoretical Model of Information Quality of Science and Technology Websites

FAN Jia-jia，YE Ji-yuan

范佳佳，女，博士，上海社會科學院信息研究所助理研究員；葉繼元，男，博士生導師，南京大學信息管理學院教授。

2016-04-27

*本文系國家社會科學基金重點項目“我國戰略性新興產業的信息資源保障體系與服務模式研究”（項目編號：11AZD082）研究成果之一

科技網站信息質量形式評價理論模型研究*

0 引言

1 文獻計量學是網站形式評價的理論根基

2 形式評價標準的來源

3 形式評價指標的選擇

4 形式評價指標權重的確定方法

5 科技網站信息質量形式評價理論模型

6 研究結論

0　引言

1　文獻計量學是網站形式評價的理論根基

2　形式評價標準的來源

3　形式評價指標的選擇

4　形式評價指標權重的確定方法

5　科技網站信息質量形式評價理論模型

6　研究結論