周橙旻,黃婷,羅欣,Jake Kaner
(1.南京林業大學,南京 210037;2.諾丁漢特倫特大學,諾丁漢 NG1 4FQ)
視覺過程有難易、級別高低之分。簡單的視覺過程,包括對物體形狀基本要素的感受(如點、線、角、紋路等),以及感知色彩梯度、光流強度、物體深度等信息[1-2]。高層級的視覺感知可以實現對物體輪廓、形狀、邊緣的感知,如感知對象的整體亮度特征可通過結合物體的顏色和形狀,感知運動狀態可通過改變光的流動,感知三維形狀可結合物體的形狀和深度等[3-4]。老年用戶在產品界面人機交互過程中,精準摘取信息的速度受尺寸、數量、間距等因素的影響[5-6]。
產品界面的人機交互過程中,老年用戶的視覺匹配范圍是設計痛點[7-9]。
1)尺寸,以直接方便的形式實現信息的傳遞,在識別方面有著不可取代的優勢。
2)布局,有限的空間中需要展現出五花八門的信息,需要通過邏輯算法將這些無關聯的信息進行串聯,讓用戶在有限的時間里找到相關信息,提高信息的準確識別。
3)位置,空間有限就要求設計人員進行合理的板塊劃分,以提升信息處理的連貫性和邏輯性。
多級菜單面板布局的出現,要求用戶花費更多的時間并執行更復雜的操作來提取有效的信息。值得關注的是部分老年用戶在認知操作的前一步,即視覺搜索的感知過程中便存在困難和障礙。例如Lindberg等[10]進行了圖標能力感知的測試研究,結果表明,圖標間間距需大于自身尺寸,顯示尺寸不小于0.7 cm,以確保老年用戶的操作績效。鄂明順[11]從設計學角度針對人機界面,確立了視覺記憶和工作記憶為兩大關鍵因素,以此建立不同交互視覺要素的設計法則。
界面的搜索能力一般指代用戶排除外界干擾因素準確搜尋目標界面的能力[12]。老年用戶對科技產品了解甚少,缺乏操作經驗,因此在產品多級界面下對目標信息進行精準搜索變得愈發困難。數量、尺寸、形狀等都會成為影響老年用戶精準搜尋界面信息的影響因素。測評老年用戶界面視覺搜索能力的方法主要分為以下兩種:
1)績效評估[13-14]。現有的績效評價指標通常可分成三種:操作準確率(Action Accuracy rate,ACC),指用戶在完成測試任務過程中正確操作數量和總操作數量的比,如將操作正確率作為一項績效指標;反應時間(Reaction Time,RT),指用戶完成測試任務所耗費的時長,如將任務完成的時間作為一項指標;正確率與完成時的復合評估(ACC&RT),正確率是判別任務完成與否的唯一指標,發生正確率無明顯差別的情況,依據完成時間進行輔助評估,如將操作正確率和反應時兩者復合為評價指標。
2)眼動評估[15-18]。眼動評估指標主要有兩種:熱點圖(Attention Heat Map),眼動儀捕捉下,利用熱點反應測試者關注區域的時長;注視次數(Fixation Count),注視次數的數量反映界面的繁簡程度[19]。
20 種風格相近、色彩類似的家具產品圖標,在尺寸、布局、間距的自變量下,依據被試的水平設定參數范圍,進行三次重復實驗最終選取平均值。圖標尺寸分別為24*24、32*32、40*40、48*48 和56*56五種(單位:px2)。布局分為兩種,分別為列表式排列、宮格式排列。界面尺寸為375 px*812 px(一倍圖),圖標間距離分為五種,分別為1/2、1、3/2、2、5/2 圖標尺寸。本次實驗采用5x2x5 種界面配置,在實驗手機界面共展示20 個家居設備圖標。老年感知能力實驗樣本(如表1 所示)圖標尺寸分別為24*24、32*32、40*40、48*48 和56*56 這五種,單位:px2。圖標距為1~2 倍、2~2 倍、3~2 倍、4~2 倍、5~2 倍進行實驗,見表2。

表1 宮格布局尺寸匯總(列數*行數+余數,單位px2)Tab.1 Summary of square layout dimensions (number of columns * number of rows + remainder, unit: px2)

表2 老年感知能力實驗樣本(部分)Tab.2 Experimental sample of perception ability of the elderly (section)
2.2.1 被試
招募實驗被試60 名,29 名男性、31 名女性,年齡為60~80 歲(M=67,SD=6.051),視力正常或者矯正后正常。實驗前,被試會被要求填寫有關基本特征感知的問卷信息,包括姓名、性別、視力辨識能力、色彩喜愛程度等。
2.2.2 設備條件
采用心理實驗軟件E-prime 編寫實驗程序,采用CPU 主頻為3.0 GHz 的計算機。采用6.25 英寸顯示器顯示刺激目標,該設備屏幕分辨率為1520×720 HD,顯示亮度為92 cd/m2。實驗在室內照明條件正常的家居環境中進行,電腦屏幕背景為黑色,被試與屏幕中心的距離為300~350 mm。
2.2.3 實驗流程
實驗具體操作為單獨個體測驗。在測試進行前,被試需要按照實驗要求完成基本的練習實驗;通過計算機顯示屏向被試顯示導語指令,告知實驗流程與需求。正式測試開始時,注視點顯示在屏幕中央,持續時長500 ms。接著一個圖標界面顯現在屏幕中,告知被試要找的圖標名稱,如圖1 所示。
當參與者點擊正確的圖標時,圖標突顯且界面變暗,屏幕會隨機顯示一種測試條件下的界面配置。為了避免被試者的點擊行為對視覺搜索時間造成影響,實驗要求被試者在點擊前大聲說出“找到了”,由實驗員記錄被試者的視覺搜索時間、次數,至此一次測試完畢,屏幕隨即呈現下一個需要查找的圖標,依次類推直到所有測試完畢。每種排列需測試3 次,即進行3 次目標選擇,共150 次,實驗樣本如圖1 所示。實驗結束后,對用戶進行深度訪談,要求用戶給出一個可識別度評分用來評估圖標的辨識度。在測試中,每完成50 次,被試者有5 min 的休息時間。每個被試者完成所有測試的平均時間約為17.9 min。

圖1 老年測試程序界面圖表大小和圖標間距實驗樣本舉例Fig.1 Samples of aging test program interface
2.2.4 因變量說明
正確率與反應時間之間是否存在科學邏輯關系尚未可知,因此利用綜合性績效指標GP 來同時表述這兩種變量。

式中,ACC 為正確率,如全都準確辨認則取1;否則,以正確數除以全部題數。
RT 是指用戶反應所花費的時間(單位:ms),取它的自然對數。GP 與正確率的關系呈線性正相關,正確率越高GP 也越高;而GP 與反應時間的關系呈非線性負相關,反應時間越短,GP 值越高。特別地,當正確率為0 時,GP 與反應時間無關,定值為0 可以排除錯誤數據,不包含在性能統計中。
利用SPSS 軟件對實驗結果進行重復測量方差分析,結果如表3 所示(表中F 值是F 檢驗的統計量,也就是組間和組內的離差平方和與自由度的比值;偏Eta 平方:η2(eta-squared)在方差分析中用于估計獨立變量的效應大小,等于某自變量的方差與總方差的比值)。

表3 多變量檢驗aTab.3 Multivariate test A
多變量檢驗是多變量方差分析中最重要的一個部分。從分析結果中可以看到,對于截距、圖標尺寸、圖標間距,以及圖標尺寸*圖標間距,都采用了比萊軌跡、威爾克Lambda、霍特林軌跡、羅伊最大根四種方法進行檢驗。四種方法的檢驗結果都是一致的,截距顯著性小于0.001,圖標尺寸、圖標間距以及圖標尺寸*圖標間距顯著性也都小于0.001。模型截距一項小于0.001,表示當自變量取值為0 時,因變量的值并不為0,即圖標尺寸或圖標間距為0 時,反應時長、正確率、GP 都不一定為0。圖標尺寸/圖標間距/圖標尺寸*圖標間距顯著性小于0.001,表示不同圖標尺寸/圖標間距/圖標尺寸*圖標間距下的反應時長、正確率、GP 存在極其顯著的差異。
通過表4 主體間效應檢驗可知,不同變量對應的因變量的差異情況。圖標尺寸對應的反應時長、正確率、GP 的p<0.001,存在極其顯著的差異。且偏Eta平方最小為0.655,最大為0.833,表明自變量“圖標尺寸”,能很好地區分反應時長、正確率和GP,可信度較高。圖標間距對應的反應時長、GP 的p<0.001,而正確率的p>0.05,說明圖標間距對正確率沒有統計學差異,且偏Eta 平方一欄,正確率值為0.145,可信度較低。在圖標尺寸與圖標間距的交互作用下,反應時長、GP 的p<0.001,存在極其顯著的差異,而正確率的0.05>p>0.001,存在顯著差異。偏Eta 平方最小為0.518,可信度較高。
結合表4 可以得出,圖標尺寸以及圖標尺寸與圖標間距的交互作用對反應時長、正確率、GP 的影響較大。圖標間距對用戶的反應時長產生影響,從而影響GP。

表4 主體間效應檢驗Tab.4 Test of inter-agent effect
從圖2 反應時長的估算邊際平均值中可知,除圖標間距為圖標5/2 倍這一條折線之外,其余四條(不同圖標間距)折線的谷值圖標尺寸皆為40*40 px,且圖標尺寸越大,間距在3/2 倍及以上的反應時長越長,間距在3/2 倍以下的會出現異常突變。表明在圖標間距小于圖標尺寸2 倍距離的情況下,邊長為32~48 px的圖標,老年用戶的反應時長較短;邊長低于32 px的圖標,老年用戶反應時間會有所加長;邊長高于48 px,受圖標間距影響較大。

圖2 反應時長的估算邊際平均值Fig.2 Marginal average estimated reaction time
估算邊際平均值:是指剔除其他變量影響時算出的均值。例如當自變量唯一時,邊際均值和普通均值是一樣的;當有兩個自變量時,邊際均值和普通均值的結果是不同的。
正確率的估算邊際平均值反映出,老年用戶視覺搜索能力會隨著圖標尺寸增長,呈現正確率增加的情況。總體峰值在圖標尺寸邊長為40 px 時,圖標尺寸邊長為24~40(不包含)px 時,會出現正確率大幅提升情況,大于40 px 會出現波動,正確率皆大于90%,見圖3。

圖3 正確率的估算邊際平均值Fig.3 Marginal mean of accuracy estimation
GP 由反應時長和正確率共同計算得出,是兩者的綜合體現,在一定程度上反應了兩者的特征。如圖4 所示,除圖標間距為圖標5/2 倍這一條折線之外,

圖4 GP 的估算邊際平均值Fig.4 Estimated marginal mean of GP
其他折線的峰值皆在圖標尺寸邊長40 px 上。圖標尺寸邊長為24~40(不包含)px,會出現GP 的大幅提升。當圖標間距尺寸大于圖標尺寸1 倍時,GP會在圖標尺寸邊長大于40 px 的情況下呈下降趨勢。
根據上述分析可得,當圖標間距為圖標尺寸的1/2~5/2 倍,圖標尺寸為40 px*40 px 時測試結果最佳。本研究以探究老年用戶可操作能力范疇下的能力余裕范圍、能力適配范圍、能力不足范圍為主要目的,主要關注能力適配范圍前后的閾值,即能力余裕-適配閾值(Capability Excess to Adaptation Threshold,EA)和能力適配-不足閾值(Capability Adaptation to Inadequate Threshold,AI)。本實驗根據圖5a 圖標尺寸RT/ACC/GP 描述性結果、圖5b 圖標間距RT/ACC/GP 描述性結果,即反應時長、正確率,以及兩種交互作用得出的GP,可將圖標尺寸、圖標間距各分為三檔。

圖5 圖RT/ACC/GP 描述性結果Fig.5 Descriptive results of RT/ACC/GP
根據實驗研究結果,得出能力余裕-適配閾值EA 和能力適配-不足閾值AI 的具體數值后,即可錄入數值,通過邏輯算法最終模擬構建用戶的實際能力梯度,為后續用戶需求的功能難度系數計算與設定提供了理論指導意義。結合圖6a 和圖7a 可知,尺寸“余裕與適配”的轉折點E=32*32 px,“適配與不足”的轉折點A=48*48 px。圖標尺寸編碼的余裕范圍為{ER|ER>48 px},能力適配范圍為{AR|32 px≤AR≤48 px},能力不足范圍為{IR|IR<32 px}。結合圖6(b)和圖7(b)可知,間距“余裕與適配”的轉折點E=1 倍,“適配與不足”的轉折點A=2 倍。圖標間距編碼的余裕范圍為{ER|ER<1 倍},能力適配范圍為{AR|1 倍≤AR≤2 倍},能力不足范圍為{IR|IR>2 倍}。

圖6 實際能力梯度Fig.6 Actual capability gradient

圖7 實際能力梯度示意圖Fig.7 Schematic diagram of actual ability gradient
針對老年用戶群體進行用戶感知與界面視覺匹配的相關研究,選取界面設計中的圖標尺寸、圖標間距為實驗變量,以此進行老年用戶感知能力梯度構建實驗,利用綜合績效指標GP 反映老年用戶的信息抓取準確率。試驗結果如下:圖標尺寸,余裕范圍為{ER|ER>48 px},能力適配范圍為{AR|32 px≤AR≤48 px},能力不足范圍為{IR|IR<32px};圖標間距,余裕范圍為{ER|ER<1 倍},能力適配范圍為{AR|1 倍≤AR≤2 倍},能力不足范圍為{IR|IR>2 倍}。研究表明,在面向老年用戶的界面設計中需要更多關注圖標尺寸、圖標間距兩種設計因素,圖標尺寸要控制在32~48 px 且不低于32 px,圖標間距要控制在1~2 倍,且不超過2 倍距。