楊超翔,徐茵苡,葉俊男
(華東理工大學,上海 200237)
后臺系統界面有別于傳統用戶界面,具有承載信息量大、交互邏輯復雜和業務理解成本高的特點[1]。正因如此,后臺系統界面可用性評估應最大限度符合用戶的感知特點和使用需求。在后臺系統界面評估中將產品可用性要素考慮在內,將很大程度上提升用戶體驗和產品競爭力。文獻[2]以感性意象詞匯為基礎,構建兒童產品可用性多維度指標模型,并對設計方案進行可用性評價。文獻[3]利用眼動追蹤實驗,提出無意識評估產品的方法,并以電飯鍋人機交互界面為例進行評估。文獻[4]利用眼動測試來模擬用戶在工作環境中的認知過程,并研究測井車中控艙人機界面的可用性。文獻[5]提出基于虛擬仿真分析的高速列車駕駛界面評估方法,以某標準動車組駕駛界面設計方案為例進行人機工效評估。文獻[6]建立了沉浸感指標評價體系,提出改進FAHPTOPSIS方法,并對數控機床進行界面評價。設計用戶友好型后臺系統界面可以最大程度的提升使用效率和滿意度,帶來良好的用戶體驗[7]。
Jakob Nielsen提出用來評估產品和系統的十個可用性交互原則,具體包含狀態可見原則、貼近場景原則、人性化幫助原則、靈活高效原則、一致性原則、易掃原則、易取原則、防錯原則和容錯原則[8]。這些原則是產品與用戶體驗設計評估的重要理論依據,為設計師在進行相關人機界面交互設計時提供了重要參考標準。目前運用Nielsen原則的研究多采用直接評估[9]和整合可用性原則構建可用性評估指標進行評估[10]。
界面可用性評估研究通常采用3種方式,即主觀、客觀法和多維評估法。主觀評估主要有通過問卷調查構建可用性評估模型[10]、模糊層次分析法構建評估指標模型[11]。客觀評估主要借助眼動實驗、腦電實驗等對生理指標進行分析評估[12]。多維評估指整合主觀和客觀評估,如將眼動實驗與問卷調查相聯系[13]。可用性評估的角度包括界面設計的結構布局[14-15]、圖標色彩[16]、界面層級[17]等多個角度。
后臺系統面向企業或特定專業用戶群體[1],其界面上組織了大量的復雜和生僻的專業信息,增加了用戶完成任務的視覺和認知的處理過程。同時,信息在后臺系統中的以多樣化的形式呈現,視覺層級較多且界面布局相對復雜[18]。目前針對于后臺系統產品多為功能設計與實現研究和設計流程研究[19],缺乏對界面設計的可用性評估。
后臺系統需要滿足企業日常工作的需求,能幫助企業級用戶高效地完成任務。用戶體驗差的后臺系統會讓用戶在重復性的工作中喪失耐心,降低創造的價值。因此使用戶高效、滿意地完成任務,是評估后臺系統界面交互設計可用性的基礎。本文在Nielsen原則[20]的基礎上,選取效率和滿意度兩維度構建后臺系統界面可用性評估指標,如圖1所示。

圖1 以Nielsen原則為基礎的后臺系統界面可用性評估指標Fig.1 Usability Evaluation Index of Background System Interface Based on the Nielsen Principle
以主客觀測量[21]為基礎構建多維可用性評估模型對后臺界面進行測量,如圖2所示。客觀可用性評估指標由眼動指標和行為指標構成。采用眼動跟蹤技術測量的眼動指標包括注視點數(Fixation count)、首次注視時間(First fixation duration)和平均注視時間(Average fixation duration)。

圖2 后臺系統界面多維度可用性評估方法Fig.2 Multi-Dimensional Usability Evaluation Method of Background System Interface
注視點數指實驗參與者落在區域內的所有注視點數量總和。注視點數過多表示界面元素排列乏合理性,降低用戶瀏覽效率。首次注視時間指第一個進入興趣區域的注視點的持續時間。該時間越長表示用戶對該具有濃厚的興趣,用戶的工作效率因此提高。平均注視時間指區域內所有注視點的持續注視時間的平均值。平均注視時間越長,反應了操作者在該任務中識別信息的難度越大,效率越低[22]。任務完成時間指用戶完成任務的總時間,較短的任務完成時間通常預示著更高的任務完成效率。
被試者在實驗結束后完成問卷調查,通過問卷調查數據獲得用戶對后臺系統界面設計的使用滿意度。問卷采用李克特五級量表法進行設計,內容包括功能元素清晰程度、完成任務難易、整體喜愛程度。界面清晰程度越高、完成任務難度越低、喜愛程度越高,則表示滿意度越高,界面設計的可用性越高。
因為評估指標的量綱不同,數量級相差較大,很難對數據指標進行客觀的分析,需要使用熵權法對效率評估指標進行客觀賦權[23]。熵權法用來評估比較多個方案的優劣,對不同設計方案中多個評估指標的初始得分來計算各指標權重,再對初始得分加權,從而得出設計案例的優劣排序。
假設選取n個設計方案作為樣本、m個評估指標。xij表示第i個樣本的第j個評估指標值(i=1,2,3…,n;j=1,2,3…,n),熵權法的運用步驟如下:
(1)歸一化處理。消除原始數據由于數量級懸殊造成的影響。負相關指標使用式(1),正相關指標使用公式進行計算。

(2)特征比重fij計算。計算第j個指標中的第i個樣本的特征比重fij。

(3)熵值計算。計算第j項指標的熵值。

(4)差異系數計算。
g=1-ej
(5)權重計算呢。確定評估指標的權重wj。

本實驗使用采樣率為60Hz的SMI-iView型眼動追蹤儀作為實驗設備,如圖3所示。由專業軟件Begaze 采集并記錄實驗數據,如圖4所示。改變護理床后臺界面中視覺元素的相對位置構建S1、S2、S3和S4設計方案,為排除顏色、圖形和圖像對實驗結果產生的不良影響,實驗材料均采用無圖形的灰度界面,如圖5所示。

圖3 SMI-iView型眼動追蹤儀Fig.3 SMI-iView Eye Tracker

圖4 數據采集和處理軟件SMI BegazeFig.4 Data Collection and Processing Software SMI Begaze

圖5 眼動實驗材料Fig.5 Materials of Eye-Tracking Experimental
本實驗根據后臺系統的用戶群體特征,隨機選擇32名年齡在(20~40)歲之間的用戶作為被試者,其中16名男性,16名女性,裸眼視力或矯正視力為1.0以上,并且沒有色盲或色弱等眼睛疾病。所有實驗參與者均有借助計算機瀏覽網頁的經驗。
參與者需要在網頁上完成兩個的任務,如表1所示。任務一是瀏覽任務,要求參與者自由瀏覽頁面15s,被試可以任意查看界面中吸引他們注意的元素。任務二是操作任務,包含任務A和任務B兩個子任務。任務A要求參與者使用篩選功能查找到符合要求的數據,任務B要求參與者在網頁上新增一條需求。以上兩個任務的設置基于實際用戶的真實工作場景。

表1 實驗任務和指標采集Tab.1 Experimental Tasks and Index Collection
被試者在實驗中的數據采集,如圖6所示。實驗程序,如圖7所示。實驗參與者佩戴移動眼動儀完成后進行3點校準以降低實驗誤差,觀察眼動數據無誤后,開始記錄眼動數據。測試者在第一個設計方案中進行瀏覽任務和操作任務。任務完成后,填寫關于后臺界面可用性的問卷調查,進行主觀評估。接下來在另外3個設計方案中分別完成實驗任務和填寫調查問卷。為了降低因實驗順序不同造成的偏差,設計方案隨機出現。

圖6 實驗數據采集Fig.6 Experimental Data Collection

圖7 實驗程序Fig.7 Experimental Procedure
對比實驗將采取對比分析法,對比4個設計方案的界面數據,分析其優劣并選擇優勢較多的方案。但在構建的后臺系統界面設計可用性評估體系中,數據指標的數據量綱差距較大,難以對數據指標進行客觀的分析。為了客觀地分析實驗數據,使用熵權法客觀地權衡每個數據指標,得到后臺系統的設計可用性綜合評估。
效率指標通過眼動數據和行為數據進行度量。眼動數據包括注視點數、首次注視時間和平均注視時間。行為數據包括“查找數據”任務(任務A)的完成時間和“新增需求”任務(任務B)的完成時間。在以上測量的指標中注視點數、平均注視時間和任務完成時間與效率指標呈負相關,而首次注視時間與效率指標呈正相關。實驗結果,如表2所示。

表2 效率指標數據Tab.2 Efficiency Index Data
使用SPSS 軟件對眼動數據和行為數據進行單因素方差分析,結果顯示這5項數據指標顯著性均小于0.05,說明這5項數據與后臺界面設計方案評分相關,可用于后續分析。
利用熵權法逐步處理實驗數據。使用式(1)和式(2)將初始數據矩陣歸一化,得到處理后的標準化矩陣y。

為了使數據處理有意義,有必要對無量綱數據進行整體轉換以消除零值的影響,即xij=xij+a,但為了不破壞原始數據的內在規律,最大限度保留原始數據,a的取值必須盡可能的小,這里取a=0.001。再利用公式計算指標比重值,得到矩陣f。

根據式(4)計算第i個指標熵值Ej。再通過式(5)計算出每個指標的權重w。

將眼動實驗中的標準化的數據指標與相應指標權重i相結合,得到各方案在效率指標方面的綜合評估,如表3所示。

表3 效率指標評估結果Tab.3 Efficiency Index Evaluation Results
從效率指標評估結果可以看出效率從高到低依次是方案S4、S2、S3、S1。S4和S2效率指標評估結果較接近,只相差0.0427。S2優于S30.4684,S3優于S10.3335。
(1)從瀏覽任務中獲取的眼動數據分析,S4和S2注視點數較少,平均注視時間較短,則說明界面布局較合理。S1的注視點數(52.8000 個)最多,較S2高出4.4000 個,平均注視時間(0.2811s)最長,較S4增加0.0107s,顯示出實驗參與者提取信息難度較大。4個方案自由瀏覽任務中注視點軌跡圖,如圖8所示。視覺路徑呈現出“Z”形分布,這一結果與Norman提出的人類視覺邏輯結構相似。從圖中可以看出S1頁面右側按鈕區域注視點較多,掃描路徑復雜交錯,表明界面邏輯性差。根據Gestalt理論,人類會將位置靠近和內容接近的的元素聯系起來。S1中查找按鈕組和新增按鈕組相近且相似,可能對用戶造成認知上的誤導,造成效率指標較低。

圖8 完成任務A軌跡圖Fig.8 Complete Mission A Track Diagram
(2)從操作任務中獲取的行為數據分析,對于任務A,S2的完成時間最短,32人平均用時0.4340s,S1的完成時間最長,平均用時0.9334;對于任務B,S3的完成時間最短,平均用時0.2983s,S1的完成時間最長,為1.1217s。綜合所有任務,S4平均用時最短為1.8000s,S1平均用時最長為2.0551s。根據眼動模式處理加工網頁信息,在瀏覽界面時傾向于從上到下,從左到右的視線掃描順序進行加工[24],所以在這項研究中,當新增需求按鈕位于頁面左上角時,被試對按鈕的搜索時間較短。
因此S3完成任務B的時間最短。S3的任務A的完成時間卻長于S2,造成這一結果的原因是左上角的新增需求按鈕對位于網頁右側的查詢按鈕的視覺搜索效率造成干擾,導致完成任務時間較長。S4、S3和S2的兩個任務的平均完成時間均不到1.000s,而S1的任務完成時間最長為1.02755s。猜測造成此結果的原因是在S1中新增按鈕組和查找按鈕組距離接近,被試者在完成操作任務時,需要進行深度思考和決策才能確定多個按鈕的功能。這一結果與Hick-Hyman 定律相同,由于人的心理特點,信息傳遞時間與信息量之間呈現線性關系[25],即信息量越大,人類選擇過程的反應時間越長。
被試在實驗完成后,填寫關于后臺界面可用性的調查問卷,對界面清晰程度、難易程度、喜愛程度3項問題進行評分。所有被試者的主觀評估平均結果的平均值,如表4所示。使用SPSS計算了問卷的內部一致性,Cronbach’s α系數為0.905,說明該問卷具有較高的一致性和穩定性,能對調查問卷數據進一步剖析。在問卷中,界面清晰程度評分和喜愛程度評分越高,難易程度評分越低代表滿意度越高。采用前文中的步驟使用熵權法對滿意度指標進行客觀賦權處理,得到結果,如表5所示。

表4 問卷調查數據Tab.4 Survey Data

表5 滿意度指標評估結果Tab.5 Satisfaction Index Evaluation Results
從滿意度指標結果來看,S3和S4滿意度評估結果較高,分別為0.9520 和0.8232,其次為S2,滿意度結果為0.3213,與S4相差0.5019,S1滿意度結果最低。
(1)從難度程度來看,S1平均得分最高為3.6667。多個按鈕排列在右側,界面視覺復雜程度較高,認知負荷較高,導致被試認為完成任務困難。
(2)從清晰程度來看,S4和S3平均得分較高,分別為3.7500和3.6667,元素排列清晰,被試者能以短距離的搜索路線找到所需的信息并進行整合。
效率指標和滿意度指標與可用性呈正相關。通過對效率指標和滿意度指標評估進行客觀賦值的處理,得到4種方案的界面設計可用性的綜合評估,如表6所示。

表6 可用性評估結果Tab.6 Usability Evaluation Results
設計方案綜合可用性指標結果是S4>S3>S2>S1。S4方案優于S3方案0.2196,S3方案優于S2方案0.00614,S2方案優于S1方案。設計方案S4因信息層級結構清晰、重點突出等優點,具有較好的綜合可用性。基于可用性評估結果,得出界面視覺元素的相對位置對界面可用性具有顯著影響的結論。針對醫護床后臺界面按鈕位置的設計提出以下幾點建議:
(1)操作按鈕的位置接近與之相關聯元素,有助于用戶理解并讀取信息。功能不同的按鈕避免過于接近,從而造成的知覺結構上相似。
(2)應根據數字信息的特點和用戶任務的特點選擇適當的視覺元素呈現方式。需求導向的差異以及使用場景的差異會影響按鈕的位置設計。在需要強烈引導用戶行為的目標下,按鈕放置在網頁左上角,提升按鈕點擊效率;在無須強烈引導點擊操作的場景下,按鈕放置在網頁右側,能減輕頁面視覺復雜度。
以智能醫護床后臺界面為案例,綜合運用Nielsen原則構建了包含多維主客觀可用性指標的后臺系統界面可用性評估模型,對32名被試進行眼動實驗和問卷測量,以此獲取主客觀數據,并使用熵權法對實驗數據進行統計運算,探究4種后臺系統界面方案的綜合可用性,最終達到篩選出可用性較高的后臺系統設計方案的目的。通過理論與實踐結合的研究,驗證了研究理論和方法的可行性和可靠性。提出的研究方法和得出的研究結論為后臺系統界面量化評估提供可靠依據,為提高后臺系統界面可用性起到一定的指導作用。