古籍數字資源服務效能評價指標體系*

2020-07-22 01:24:44趙洪雅

圖書館論壇 2020年7期

趙洪雅

0 引言

古籍數字資源是運用現代信息技術對古籍文獻進行加工、整理后形成的各種信息資源的總和。古籍數字資源服務是我國公共文化服務體系建設的重要組成部分，是利用信息技術拓展古籍資源服務能力和傳播范圍的重要途徑。所謂效能，則是指系統在規定條件下達到規定使用目標的能力[1]。服務效能一般包括能力、效率、質量及效益等因素。能力指服務提供方的能力范圍，如信息資源的存儲量；效率指在一定時間內的信息處理能力，如查詢效率、咨詢交互效率；質量指滿足讀者閱讀需求的綜合水平，如目標內容的豐富程度；效益則指在信息資源建設投入的前提下服務提供方所獲得的成果，如用戶滿意度的增長。在這一研究范疇中，古籍數字資源服務效能即是指服務提供方集合文獻資源、設備設施、專業人員、技術手段、資金投入等各種硬件和軟件條件，通過提升服務能力、效率、質量和效益的各項相關因素，為用戶提供服務的水平的程度[2]。古籍數字資源服務效能評價就是通過設定的指標體系對古籍數字資源服務的功能實現程度進行測量。目前，基于我國古籍數字資源的研究已呈多元發展態勢，研究重點主要有基礎理論研究、技術問題研究、實踐應用研究、標準體系研究和專題古籍數字化研究[3]等。具體針對古籍數字資源服務的研究[4-5]則大多屬于經驗總結、理論探討等定性思考，尚缺乏基于調研和實證的定量研究。相較于國內公共數字文化服務評價的豐碩成果[6-9]而言，古籍數字資源服務研究無論在評價主客體、評價方法與工具、評價指標體系、實證研究等方面都尚未開展，仍處于萌芽狀態。本文以廣義的古籍數字資源為研究對象，包括但不限于：各類型古籍數字資源庫、線上古籍展覽、與古籍相關的電子資源、視頻講座、科普知識、新聞報道、行業動態等。通過實際調查與數據分析，從用戶感知的角度構建古籍數字資源服務效能評價模型。本文還將探索性地回答以下問題：哪些因素將影響用戶對古籍數字資源服務質量的感知？這些因素具體是怎樣構成的？以及服務提供方將如何應對當今數字化時代的新要求。

1 古籍數字資源服務效能評價框架

為使評價能夠反映客觀事實，本研究在獲取各項評價指標之前，首先進行了問卷調查與專家咨詢。問卷發放時間從2019年2月開始，歷時一個月，主要發放對象為古籍工作相關從業者、高校師生、科研人員、古籍收藏者及普通社會公眾，并對具有豐富經驗的資深古籍工作從業者和專家進行了咨詢與結構式訪談。經預調查，古籍數字資源服務效能評價框架由“內容價值”“功能價值”“平臺性能”和“服務品質”4個一級指標組成。這4個一級指標基本涵蓋當前古籍數字資源服務的各個維度，既包含古籍數字資源的客體屬性標準，也包含用戶的主觀需求和實際心理體驗，能夠反映出用戶的真實判斷。

2 構建古籍數字資源服務效能評價模型

2.1 評價假設模型指標的選取、整合與修正

以古籍數字資源服務效能評價框架為基礎，進行預測試。通過對開放性問題答案的收集與整理，刪除三級指標中重復或同質的要素，并對二、三級指標進行分類調整，最終評價假設模型有一級指標4 個，二級指標7 個，三級指標30個，如表1所示。

2.2 評價假設模型的數據分析與檢驗

為判斷上述評價假設模型是否科學合理、評價指標設計及各級指標劃分是否符合用戶的真實感受，對數據作進一步分析與檢驗。研究設計路線見圖1。

將評價假設模型中的三級指標要素轉換成調查問卷中的問題項，在更廣泛的群體內進行第二輪數據采集，調查問卷由兩部分構成：一是被訪者個人信息；二是古籍數字資源服務效能評價模型的調研內容。問卷共有39個題項，全部為封閉性問題，其中指標要素測量采用李克特五分量表法，以5～1分表示評價指標要素的影響程度，5分表示評價指標要素在用戶感知中影響很大，1分表示對評價沒有影響。

表1 古籍數字資源服務效能評價假設模型

圖1 古籍數字資源服務效能評價模型研究路線

2.2.1 數據采集與描述性統計分析

依據古籍數字資源服務對象的特點以及研究情況，通過“問卷星”在線問卷調查平臺制作問卷，通過網站、微信、QQ、各省級古籍保護中心、圖書館古籍閱覽室發放和回收調查問卷，共回收問卷326份，其中有效問卷318份，有效率為97.5%，符合預定樣本規模。

(1)樣本描述性統計分析。在有效樣本中，被訪者特征描述包括性別、年齡、學歷、職業以及使用目的5個方面。詳細統計數據見表2。

表2 調查樣本基本情況描述性統計

由表2可見，男女比例為36.8%和63.2%，表明參與調查的古籍數字資源用戶女多男少。在年齡分布上，50 歲以下的樣本比例達到81.1%，表明用戶以中青年為多。與中國互聯網絡信息中心(CNNIC)發布的第43次《中國互聯網絡發展狀況統計報告》[10]中的網民年齡結構橫向比較，30～39歲與40～49歲這兩個年齡組的人數比例偏高，說明古籍數字資源用戶與一般網民相比年齡結構偏大。樣本的受教育程度主要集中于本科(含大學專科)、研究生及以上，比例高達96.8%，表明古籍數字資源用戶普遍具有較好的教育背景和信息素養。從樣本的職業來看，將近六成的受訪者為古籍相關工作從業者，學生、教師及科研人員占17.6%，普通公眾占21.7%。由此可見，古籍數字資源的服務對象較為集中[11]，當然，這也與本次調查問卷的發放范圍主要聚焦于古籍界業內、高等院校及圖書館古籍閱覽室不無關聯。鑒于古籍相關工作從業者與教學科研人員自身專業程度較高，更能根據實際使用經驗和感受作出評價，從而也在一定程度上確保了此次調查的真實性。從使用目的來看，“學習或研究古籍內容”“學習或研究古籍版本”“了解古籍保護相關知識”是被選頻率最高的3個選項，說明用戶使用古籍數字資源的主要目的仍是學習研究。據此可見，此次調查的樣本具有女多男少、年齡結構偏大、受教育程度較高的特點，使用目的主要為學習或研究，符合以往對古籍讀者特征的基本預判。

(2)觀測變量描述性統計分析。利用IBM SPSS20.0軟件對古籍數字資源服務效能評價假設模型中三級指標變量進行描述性統計，得到各指標變量的平均值和標準差，由此可以看出被訪者對假設模型中各評價指標的整體感觀，見表3。從表3可見，30項被調查指標中，平均值大于3的指標共有28項，其中“內容知識性”“內容特色化”“內容優質性”平均值位列前3，表明用戶對目前古籍數字資源內容的質量、品類和知識性有較高的評價觀感。各評價指標的標準差統計顯示，有9項標準差大于1，主要集中于“功能價值”與“服務品質”兩個一級指標中，表明用戶對各平臺的功能和服務質量的評價存在較大差異。究其原因，一是用戶對服務和功能的體驗具有較強的主觀性，評價差異較大；二是各平臺在服務品質和功能設計上確實水平不一，良莠不齊，導致用戶主觀評價差異較大。

表3 三級指標統計量

2.2.2 模型檢驗與分析

運用探索性因子分析法，對提出的假設模型進行檢驗與分析，從而構建古籍數字資源服務效能評價模型。

(1)信度分析。信度分析的目的在于研究樣本數據是否真實可靠，即研究受訪者是否真實地回答了各個題項。本研究使用Crobach α系數(即內容一致性系數)檢驗問卷的可靠性與有效性。Crobach α系數表示量表的信度質量，即測量樣本真實回答的程度，通常α系數大于0.7即表示信度良好。CITC代表題項之間的相關情況，通常此值大于0.4即可。項已刪除的α系數代表當某題項被刪除時其對應變量的α系數。經檢驗，在30項指標中，只有“內容時效性”的CITC值低于0.4，但“一般價值”的整體α系數為0.745，信度良好，刪除“內容時效性”后的α 系數為0.747，對“一般價值”的整體α系數僅提升了0.002，影響微乎其微，故保留“內容時效性”不予刪除。由表4可見，所有7個二級指標的整體α系數均高于0.7，其中5個高于0.8，表明問卷可信度非常高，可以對假設模型作進一步分析。

(2)效度分析。在內容效度方面，本研究問卷中所有測量題目均依據相關領域的實證研究與前期預調研結果，并根據預調研數據進行修正后得到，可以保證問卷基本科學有效。且經過以上的信度分析，仍顯示各變量具有可靠性，因此可以判斷本研究題項設計合理，內容效度較高。在結構效度方面，采用探索性因子進行驗證。首先進行因子分析適用性檢驗。采用取樣足夠的KMO(Kaiser-Meyer-Olkin)度量數和巴特利球形檢驗(Barlett Test of Sphericity)驗證樣本數據是否適合進行因子分析。檢驗結果如表5所示，取樣足夠的KMO值為0.916，大于0.7，表明30個指標間的共同因子足夠多，適合進行因子分析。一般來說，Barlett 球形檢驗顯著水平值越小(＜0.05)，表明原始變量之間越可能存在有意義的關系。本研究樣本Barlett球形檢驗的近似卡方值為6705.518(自由度為435)，顯著性水平為0.000＜0.01，表明母群體相關矩陣間有共同因素存在，再次證明適合進行因子分析。

表4 信度分析匯總表

表5 KMO和Bartlett的檢驗

(3)因子分析。在探索性因子分析中，公共因子提取利用主成分分析法(Principle Component Analysis，PCA)，以特征值大于1為標準提取因子，使提取出的公共因子可以至少解釋一個變量，并采用最大方差法正交旋轉，根據旋轉后的載荷因子矩陣歸并與整合指標變量來確定公共因子。

經檢驗，共得到5個因子，與古籍數字資源服務效能評價假設模型構想的7個因子之間的對應關系有較大出入。其中“內容時效性”被單獨劃分為一個因子；“檢索功能”的各項指標被打散；“通用功能”與“服務品質”被歸并為一個因子。

2.2.3 模型修正與正式評價模型的建立

根據驗證結果，對假設模型進行修正。據上文分析，“內容時效性”與其他指標之間共同聯系太小，應予以剔除。修正過程中，“檢索功能易用性”混入了“內容價值”指標聚集的公因子中，也予以剔除，最終得到變量共同度(公因子方差)，見表6。共同度值通常以大于0.4 作為標準，如小于0.4則說明因子不能很好地表達題項信息。根據Kaiser準則，各項的平均共同性最好在0.7以上，如果樣本數大于250，平均共同度在0.6以上亦符合要求。如表6顯示，樣本的共同度值(即“提取”列數據)均高于0.4，平均共同度為0.656，符合要求，說明所提取的公共因子對指標變量的描述程度較好，各個指標變量的信息丟失在可接受范圍內。

以特征值大于1為標準提取因子，共提取出5個公共因子，其KMO值為0.916，累計方差解釋率為65.603%，旋轉后的方差解釋率均大于10%。與調試前相比，5個因子對整個模型有了更好的解釋力，基本可以代表原始指標變量的信息。采用最大方差正交旋轉，所有三級指標的最高因子載荷系數均高于0.4，說明效度較好。最終檢驗結果如表7、表8、表9所示。

表6 公因子方差(修正后)

載荷因子1 共計7 個變量。與假設模型相比，包含了“通用功能”中的全部指標，“檢索功能”中的“檢索途徑多樣性”，以及“服務品質”中的“服務多樣化”“服務個性化”“咨詢有效性”3 個指標。這些指標側重于用戶對功能與服務的需求，如文本挖掘、地理信息系統、人物關系可視化、多途徑檢索、及時有效的參考咨詢以及個性化的信息推送、界面定制等，體現了用戶對智能化功能和個性化服務的極大需求。因此，將載荷因子1 重新定義為“服務品質”一級指標。這些指標聚集于第一個載荷因子中，也反映了在用戶認知中，這些指標的滿足程度對評價古籍數字資源服務效能有很大影響。

表7 KMO和Bartlett的檢驗(修正后)

表8 解釋的總方差(修正后)

表9 旋轉成分矩陣(修正后)*

載荷因子2 共計5 個指標。與假設模型相比，包含了“界面設計”的全部指標，以及“系統性能”中的“端口多樣性”和“服務品質”中的“幫助易用性”指標。這些指標側重于界面設計因素，如功能布局、色彩搭配等。“幫助易用性”指標強調“古籍數字資源平臺上的各類幫助功能和工具設置明顯突出、易于使用”，在此次調試中被歸入“界面設計”因子，具有很大的合理性。據此，可以將載荷因子2重新定義為“界面設計”一級指標。這一因子在用戶評價中的重要程度僅次于“服務品質”。

載荷因子3 共計7 個指標。與假設模型相比，包含“內容價值”的全部指標，不再細分為“一般價值”與“擴展價值”兩部分。故將載荷因子3命名為“內容建設”指標。可以看出，作為古籍閱覽基礎的“內容價值”的重要性開始弱化，但這并不意味著內容不重要，而是在數字化、智能化、個性化浪潮下，用戶評價更側重于強大的使用功能和友好的用戶體驗。

載荷因子4 共計4 個指標。與假設模型相比，包括“系統性能”的大部分指標和“服務品質”中的“交流互動性”指標。這些指標側重于古籍數字資源平臺的系統特性，故仍將載荷因子4定義為“系統性能”指標。此次調試中“交流互動性”指標被歸入“系統性能”，則更多強調的是平臺系統需具備交互屬性，能夠在功能上支持用戶與平臺、用戶與用戶間的互動。

載荷因子5 共計5 個指標。與假設模型相比，包括“檢索功能”的大部分和“系統性能”中的“平臺可用性”和“系統兼容性”。這些指標側重于數字資源平臺的檢索能力，故仍將載荷因子5定義為“檢索功能”指標。“平臺可用性”指標側重于“古籍數字資源切實可用，鏈接有效”，被歸入“檢索功能”具有一定的合理性，側重于檢索結果切實可用。“系統兼容性”則更側重于檢索結果的資源格式等兼容性高，適用于各種瀏覽器或操作系統。

2.2.4 古籍數字資源服務效能評價模型指標釋義

與假設模型相比，修正后的評價模型由三級簡化為二級，包括一級指標5 個，二級指標28個，層次更加清晰，指標間內在關系更強，邏輯更為合理，較全面地反映了古籍數字資源服務效能的各個方面。根據修正后的評價模型中指標所屬級別及其內在聯系，對各評價指標進行重新解釋與描述，如表10所示。

2.2.5 成分得分與指標權重

采用回歸法(Regression)計算因子得分系數，根據因子得分系數矩陣各因子得分(Factor Score)寫出因子得分函數：

對數據匯總后，得到權重最終結果如表11所示。從指標權重可以看出，服務品質一級指標權重占總權重的三分之一。“功能智能化”“功能自動化”“功能完備性”“服務多樣化”“界面簡潔性”“內容知識性”6項指標的權重超過0.05。說明用戶對古籍數字資源的使用需求上升到一定層次，就會從之前只關注內容本身轉而向服務智能化、定制化等方向發展。

表11 古籍數字資源服務效能評價模型權重得分表

3 結論與啟示

本研究構建的古籍數字資源服務效能評價模型，從用戶視角綜合衡量了古籍數字資源服務的效果和用戶滿意度。該評價模型由二級指標體系構成，簡潔明了，易于衡量。通過探索性因子載荷，該模型還給予當代數字環境下用戶需求變化的一些啟示。

(1)服務品質是以用戶感知與期望值比較為基礎的整體性認知評價[11]，該指標是用戶在使用古籍數字資源時最重要的影響因素，也是影響用戶評價古籍數字資源服務效能最重要的指標。不同于傳統紙質資源，用戶更看重古籍數字資源智能化、自動化、個性化的功能以及服務的多元、質量與效率。早在2002 年，李國新教授就指出，古籍數字化應具備四大特征：一是文本字符的數字化，二是基于超鏈接的瀏覽閱讀環境，三是具有強大的檢索功能，四是具備研究支持功能[12]。這實際上已經指明了古籍數字資源的發展方向：除了轉移媒介以外，后3個特征越來越成為亟待深耕的領域。而所謂“研究支持功能”，恰恰也與近年來方興未艾的數字人文理念相吻合。數字人文的理論邏輯與技術體系，能夠為古籍文獻的組織、標引、檢索與利用提供新的方法與模式，使古籍數字資源平臺集資料查詢、計量分析、知識發現等功能為一體[13]。如張旭等將《植物名實圖考》進行知識點切割和文字識別，經過編號、命名、標引，形成專題性知識服務系統[14]。朱鎖玲、王明峰以《方志物產》為數據源，用GIS技術把物產分布、物產傳播等相關分析結果以地圖形式展示[15]。此外，為構建以用戶為中心的服務體系，個性化定制平臺也已不可或缺，如現已開發的My Library 以及清華同方開發的PIS(Personalized Information System)等[16]。人們已逐漸意識到，未來的古籍數字資源只有同時符合這四大特征，才能稱為真正的古籍數字化產品，才能滿足用戶越來越多樣化的服務需求。

(2)界面設計是用戶評價過程中另一重要指標。界面設計必須考慮古籍文獻閱覽和使用的特點。對圖文型古籍數據庫而言，一個好的瀏覽頁面應該可以在全文閱讀、原文圖像、檢索結果及相關知識支持系統之間自由切換；同時，目錄、正文和注釋應分級顯示，使用戶通過目錄樹就可以直接跳躍到需要閱讀的正文部分[17]。對圖像型古籍數據庫而言，大多數都可以對圖像進行縮放、上下翻頁、目錄設置、古籍冊次選擇及當前頁顯示；部分還可以進行頁面跳轉、附件查找、添加隨筆、全屏閱讀、縮略圖、首末頁跳轉等[18]。此外，古籍數字資源用戶普遍帶有較明確的訪問目的，界面設計應遵循簡單易懂和一致性等原則，使用戶能夠通過頁面的布局或語義預知下一步操作，在最短時間內、通過最簡單的步驟、經過最少的頁面達到自己想要實現的目的[19]。

(3)“內容建設”指標不再是首要評價因素，但用戶對古籍最普遍、最首要的需求仍來自于古籍內容。因此，在建設古籍數字資源時，首先需要規范古籍數字化作業中的工序和標準，對古籍源頭版本進行選擇，提供有內容保障的原始信息[20]。2012年，國家古籍保護中心編制了《古籍數字化工作手冊》(試用本)，規定了珍貴古籍數字化的一系列指導原則和七大實施步驟，在一定程度上確保了內容建設的基礎質量。更值得注意的是，用戶本身也是內容的積極創造者。例如，當用戶對文獻中的某個詞或句子感興趣時，便可通過涂抹、批注和轉發留下標記，作為深度交互數據進行保存利用[21]。例如，上海圖書館開發的眾包管理及服務平臺(CDS)曾邀請讀者對相關歷史文獻進行人工識讀，調動社會大眾積極參與古籍數字化建設[22]。這種對內容資源深度開發的做法，可以匯聚和利用讀者的認知盈余，將讀者從被動的信息接收者轉變為主動的信息提供者和建設者。

(4)系統是否能夠運行穩定、響應迅捷、方便使用，是用戶使用數字資源的基礎保障。當前，古籍數字資源呈現出數據量大、數據類型復雜、服務器平臺種類多、讀者需求復雜等新特點。采用傳統的存儲模式永遠無法滿足存儲容量不斷增長的需要[16]。余玲等提出采用存儲區域網格戰略建立古籍數字化模型，全面解決海量、異構和動態存儲問題[23]。此外，由于網絡的即時性特點，交互的頻度越高，服務的智慧程度也越高；交互過程中對請求方響應越快，即響應時間越短，服務滿意度就越好[21]，缺乏交互性的數據不足以形成用戶滿意的服務體系。因子分析結果也顯示，“交流互動性”已成為用戶對“系統性能”的一項較明確的要求，說明古籍數字資源平臺需要更多地融入社交屬性，改善交互環境質量，加快交互響應過程，增強響應處理能力。

(5)檢索功能是幫助用戶獲取目標信息的手段與途徑，但檢索功能在指標排序上卻相對靠后，這主要是因為目前古籍數字資源平臺一般只支持字段檢索等簡單的檢索方式，深度只停留在文獻層面，而沒有對文獻中的具體信息進行有效地組織、分類和整合，更沒有深入的挖掘與揭示[5]，無法滿足用戶較深層次的檢索需求。數字人文的關聯數據技術與GIS技術能夠對古籍文獻進行知識層面的組織管理，并在此基礎上實現語義檢索。如上海圖書館利用關聯數據技術建立并發布家譜數據，極大地拓展了家譜類古籍的檢索深度[24]。北京大學圖書館建設的“秘籍琳瑯——北京大學數字圖書館古文獻資源庫”引入GIS檢索技術，為讀者提供時空檢索，結果可以通過地圖直觀顯示。隨著用戶對檢索能力越來越高的需求，平臺應把不同時間、用不同技術開發的、具有不同內容和形式的數字資源系統整合起來[25]，強化檢索技術和內容的開發深度，為用戶實現數據化增值[3]。

服務具有無形性、異質性、不可分割性和易逝性的特征，且現有的古籍數字資源平臺類型各異，用途不一，因此，對古籍數字資源服務效能的評價也是一項復雜的工程。本研究僅通過測量指標變量，對用戶感知古籍數字資源服務這一整體概念進行探索，以期為當前移動、智能環境下的古籍數字資源服務方式的改進提供借鑒。