徐尚英,劉 晶,陳冬林,王 蕾
(1.武漢理工大學經濟學院,湖北武漢 430070;2.湖北省電子商務大數據工程技術研究中心,湖北武漢 430070)
隨著傳統科技服務行業轉型升級與新興科技服務行業迅速發展,科技服務平臺(以下簡稱“平臺”)將成為科技服務業提供服務的重要渠道。科技服務平臺是為企業等各類創新主體提供專業服務的平臺,企業是其中的一大主力用戶。目前,由于平臺中不同企業用戶具備的創新能力、所處的發展階段都不相同,因此對科技服務的需求呈現復雜化、多樣化的特點;此外,隨著平臺中功能相似的科技服務數量變得越來越多,企業用戶愈發難以快速匹配到符合自身需求的科技服務資源。因此,實現滿足企業用戶需求的科技服務資源推薦是目前科技服務平臺亟待解決的問題。
目前有關科技服務資源推薦的研究不多。而科技服務推薦與云制造服務推薦有相似之處:二者均是通過一個共享的服務平臺為用戶提供按需使用、安全可靠的服務資源;同時也存在著平臺開放性、服務提供方廣泛性和用戶需求的復雜特點,以及面臨用戶如何從海量服務資源中選擇滿意的服務資源的問題。在現有關于云制造服務匹配推薦問題研究中,大多是從服務方角度來進行服務推薦,比如,馬仁杰等[1]考慮了服務的類型、描述和質量信息,基于匹配相似度對服務資源進行綜合服務匹配;李成海等[2]考慮了服務資源屬性及特點,設計了服務資源屬性字典集進行屬性匹配;李慧芳等[3]根據服務類型、狀態信息、功能屬性和服務質量進行概念相似度的綜合匹配。有部分文獻從用戶需求方進行服務推薦,比如,李穎新等[4]提出一種云制造環境下基于用戶行為的個性化知識服務方法,對用戶行為分類并評價,構建用戶行為模型;高志強等[5]針對資源提供端和消費端分別進行功能分析和需求分析,利用協同過濾方法進行匹配與推薦;禹春霞等[6]分別從用戶和服務商兩個角度確定需求偏好和服務能力,利用相似度距離公式為用戶提供最終的服務商推薦;劉晶花等[7]充分考慮分析用戶自身需求和動態環境下候選服務的歷史數據,對用戶需求進行差異化分類,將區間型服務質量(QoS)屬性值轉換為精確數,對候選服務進行過濾和篩選。但由于服務資源數量大、用戶需求多樣化,雙方的需求難以量化,國內外學者大多采用模糊模型處理此類不確定性問題,比如,Bai 等[8]利用模糊集理論描述服務資源,基于模糊規則進行服務匹配;Li 等[9]采用了雙猶豫模糊集來描述偏好信息,并進行供應方和需求方的雙面匹配;Roy 等[10]提出用模糊技術處理決策者的模糊性,并確定相應因素的權重對應用進行排名,最終選出高效的應用。也有考慮供需雙方角度的相關研究,如趙金輝等[11]、胡雨等[12]是針對服務方和需求方各自的描述信息,結合功能和非功能要求,基于服務質量和綜合模糊相似度進行服務的雙向匹配。
觀察現有相關文獻可知:(1)在云制造服務推薦研究中,一般從基本信息、行為信息和歷史數據中獲取用戶需求并進行評價處理,但評價處理方法主觀性較強,不能有效準確地反映用戶需求,同時用戶需求也難以量化;(2)有關服務推薦模型構建大多從服務類別、服務狀態、服務描述以及服務質量上進行改進并匹配推薦,但在云制造服務推薦研究中并未考慮不同類型服務含有的特殊屬性。服務的特殊屬性是區分不同類型服務的核心特性,是衡量服務質量最有力的指標,也是服務需求方最關注的指標。在科技服務資源中引入特殊屬性可以達到快速匹配服務資源的效果,但目前的服務推薦算法大多是單一算法或改進現有傳統推薦算法。基于此,本研究引入企業背景信息獲取企業用戶需求并用模糊模型量化需求偏好,以達到需求準確化的效果,同時引入“本體”概念和余弦相似度兩種相似度算法進行綜合加權相似度的算法,以提高服務推薦結果的準確率;最后選取基于QoS 的算法和基于內容(CB)的推薦算法,對不同科技服務類型的服務推薦準確率和召回率做對比實驗,以驗證基于企業用戶需求的科技服務資源綜合推薦(EURSTS)算法的可行性和有效性。
科技服務平臺中包含了服務類型、QoS 要求等基本信息,反映了科技服務資源的基本特征。在考慮雙方需求信息的科技服務資源選擇中,科技服務平臺綜合考慮企業用戶背景信息和不同類型科技服務的特殊屬性,并根據服務提供方和用戶需求方的QoS 要求以及實際需求對企業用戶需求和科技服務資源類型、QoS 信息進行匹配,綜合考慮兩部分的相似度值,選擇最滿意的科技服務資源。科技服務資源綜合推薦模型如圖1 所示,其中ω為設定的閾值。

圖1 科技服務資源綜合推薦模型
科技服務資源綜合推薦模型中,匹配的過程中存在兩方主體:一是服務機構即服務提供方;二是企業用戶即服務需求方。匹配的屬性分別為[type,QoS],type 表示科技服務資源的類型;QoS 表示科技服務資源質量要求。
(1)定義服務機構方的科技服務資源集合為S={S1,S2,…,Sj},Sj表示 第j(j=1,2,…,k)個 服務;Stype表示服務機構提供的科技服務資源類型;SQoS={SQoS1,SQoS2,…,SQoSn}是服務方對需求方要求的屬性指標集合,SQoSn是第n(n=1,2,…,q)個指標。
(2)定義企業用戶的需求偏好集合為P={P1,P2,…,Pj},Pj表示 第j(j=1,2,…,t)個 需求;Ptype表示需求方所需的科技服務資源類型;PQoS={PQoS1,PQoS2,…,PQoSt}是需求方對科技服務資源QoS的屬性指標集合,PQoSt是第t(t=1,2,…,d)個指標。
具體的匹配過程分為兩個部分:第一部分的主要目的是依據企業用戶背景信息獲取企業用戶需求偏好,并用模糊模型進行量化處理;第二部分的目的是建立企業用戶需求偏好與科技服務資源的綜合匹配,并完成服務推薦。針對企業用戶需求偏好和科技服務資源分別進行科技服務類型、包含特殊屬性的科技服務QoS 要求計算相似度Simt、Simq,每一步都篩除相似度較低的科技服務,并采用剩余的科技服務集合進行下一步計算,最終計算綜合相似度Sim(P,S),將相似度較高的結果,即Sim(P,S)≥ω,保留排序后并輸出。
科技服務平臺由用戶需求者和服務提供商兩方角色組成。企業用戶的需求偏好是用戶提出對目標服務的要求,從而在科技服務資源中匹配到最合適的服務資源,實現平臺中用戶和服務資源的高效匹配。由于企業用戶一般使用文字語言來詳細描述自己對某項科技服務的需求,但較難量化自身的服務需求偏好,因此在實際的服務推薦過程中,需要將定性文字指標轉化為定量指標,以便后續的計算。平臺中的企業用戶與普通用戶存在一個明顯的相異點,即企業擁有自己的行業背景。面向企業的平臺會根據企業的經營范圍對其分類,基于此,同行業的企業對于科技服務的購買需求也相同或者相近,區別在于企業對于科技服務價格的定位不同,實力雄厚的企業可能會購買一些質量更高的服務,而一般的企業則購買性價比較高的服務。因此,可以利用企業的行業背景信息作為找到企業用戶需求偏好的搜索條件。
針對企業用戶行業背景信息描述,通過企業所屬行業類型、規模大小、資金情況等信息映射得到企業用戶所關注的問題,即用戶在選擇服務資源的過程中反映了自身需求。將科技服務的特點和用戶所關注的問題進行對應,如表1 所示。

表1 企業用戶需求偏好屬性
表1 中企業信息的描述對應著企業用戶在選擇科技服務時所關注的問題,可以用來刻畫科技服務的需求偏好屬性。目前關于科技服務的評價研究主要采用成本、價格、時間、安全性、可用性等指標,結合企業用戶所關注的問題,本研究采用可經營性(P1)、穩定性(P2)、購買力(P3)等3 個維度來刻畫企業用戶的需求偏好(preference),并定義企業用戶需求偏好集為P={P1,P2,P3}。這3 個需求偏好的具體含義解釋如下:
(1)可經營性:由企業經營范圍和行業類型決定。
(2)穩定性:由企業行業規模決定。
(3)購買力:由企業的注冊資金、經營費用方面決定。
上述需求偏好指標既有定量指標,又有定性指標,采用三角模糊評價法衡量企業用戶的需求偏好程度。三角模糊評價法是指對給定事物的多個屬性、指標進行程度性、文字性的判斷,一般包括3~7個不同程度的等級,每個等級可以通過匹配各自的隸屬方程進行量化[13]。對于用戶評價的不確定性,可以采用三角模糊數的形式給出判斷值。可將三角模糊數M記為(l,m,u),l≤m≤u,l和u分別表示M的上界和下界,m為M的中值。M(l,m,u)表示M相對于m的偏離程度。
基于三角模糊數的模糊評價法,選取非常低、低、中等偏低、適中、中等偏高、高、非常高7 個等級來量化企業用戶的需求偏好。根據隸屬函數,7 個等級能夠分別實現量化,相對應的量化轉換關系見表2。用戶可從7 個程度中選擇出恰當的選項,對其需求偏好的重要性程度進行主觀評價,然后根據表2 轉化成三角模糊向量其中,Pt為用戶對需求P以三角向量表示偏好程度,從而構建企業用戶需求偏好集P={P1,P2,…,Pj}。

表2 用文字描述的用戶需求與三角模糊數組之間轉換關系

表2 (續)
3.2.1P-S服務類型匹配
根據《國務院關于加快科技服務業發展的若干意見》,將企業的需求偏好分成科學技術普及、科技咨詢、檢驗檢測、科技金融、研究開發、創業孵化、技術轉移、知識產權共8 類。根據馬仁杰等[1]的研究,服務的“本體”概念有5 種關系,如圖2 所示。

圖2 服務的本體關系
利用服務本體的5 種關系對科技服務資源類型進行匹配,計算出科技服務資源匹配相似度。計算公式如下:

當Ptype和Stype為Mismatch 關系,表明科技服務不能滿足企業用戶方需求偏好,因此,在該步驟將此類匹配即Simt=0 的科技服務剔除,并將剩下科技服務交由下一步的科技服務資源QoS 匹配。
3.2.2P-S服務QoS 匹配
3.2.2.1 匹配指標屬性
科技服務資源QoS 匹配實際上是一個多屬性的決策過程。QoS 屬性有較多種類,包括一些共同屬性和特殊屬性。共同屬性是所有服務都具備的屬性,如服務可用性、服務可靠性、服務性價比;特殊屬性則是不同的科技服務所具有的、反映該服務質量的不同屬性[14]。在科技服務業中,8 類科技服務的特殊屬性分別為科普經費、咨詢有效率、檢測結果有效率、融資金額、開發服務數量、孵化企業數、技術成熟度和價值度,且每種科技服務資源均只具有1 個特殊屬性,具體對應情況如表3 所示。

表3 科技服務的特殊屬性
由上述分析可知,企業用戶的需求偏好屬性也是企業用戶需求方的QoS 屬性指標,因此設計QoS指標屬性如下:
(1)企業用戶需求方的QoS 屬性指標PQoS={PQ1,PQ2,PQ3,PQn}(n=4~11)。其中,PQ1表示企業用戶的可經營性,由企業經營范圍和行業類型決定;PQ2表示企業用戶的穩定性,由企業行業規模決定;PQ3表示企業用戶的購買力,由企業的注冊資金、經營費用方面決定;PQn表示某一種科技服務的特殊屬性。
(2)科技服務提供方服務的QoS 屬性指標SQoS={SQ1,SQ2,SQ3,SQn}(n=4~11)。其中,SQ1表示科技服務的可用性,表現為一定時間內科技服務能被用戶成功使用過的概率;SQ2表示科技服務的可靠性,表現為一定時間內科技服務能被用戶訪問過的概率;SQ3表示科技服務性價比,表現為用戶對科技服務價格的可承受程度;SQn表示不同科技服務的特殊屬性。
3.2.2.2 QoS 指標歸一化
為了計算每一種科技服務的質量屬性,同時消除屬性的不確定性,對每種科技服務的QoS 屬性指標進行歸一化處理。采用王尚廣[15]研究中的歸一化方法進行處理,如式(2)(3)所示:

式(2)(3)中:DQoSij表示第i個候選服務或用戶需求的第j個屬性值;DQoSjmax和DQoSjmin分別表示候選服務或用戶需求的第j個屬性值的最大值和最小值。D'QoSij表示第i個候選服務或用戶需求的第j個屬性值對應的歸一化值。
QoS 屬性可分成正向和反向屬性,正向屬性比如可靠性、信譽度等,用式(3)計算,屬性值越大越好;而反向屬性比如價格、服務時間等,用式(2)計算,屬性值越小越好。
3.2.2.3 QoS 相似度計算

3.2.3P-S綜合相似度計算
根據式(5)計算科技服務資源綜合匹配相似度Sim(P,S),據此得到符合閾值內的科技服務資源,并將科技服務資源輸出給企業用戶需求方作為服務推薦的結果。

式(5)中:α、β為綜合匹配的權重系數,需滿足α+β=1,且α≥0、β≥0。
本研究采集豬八戒網站中知識產權服務、科技金融服務、檢驗檢測服務、技術轉移服務以及企業用戶數據作為數據集,其中,知識產權服務包含專利、域名、商標、網站共12 764 條數據;科技金融服務數據共514 條;檢驗檢測服務數據共152 條;技術轉移服務數據共997 條;企業用戶數據共3 645 條。以知識產權服務為例,設3 個企業用戶(U1、U2、U3)需要有關知識產權服務,平臺中包含12 764 種可提供的知識產權服務資源,用Sj(j=1,2,…,12 764)表示。知識產權服務方將服務資源發布在平臺上,并提出對企業需求方的合作要求,企業需求方提出對知識產權服務資源的需求詳情和服務QoS 要求,平臺根據供需雙方的條件進行服務匹配(見表4)。

表4 實驗企業用戶需求偏好屬性

表4 (續)
(1)服務資源類型匹配。設企業用戶的需求類別為發明授權,采用式(1)得到知識產權服務類型匹配相似度。由于Ptype為發明授權,與Stype的發明授權為全同關系,與專利服務為S真包含P關系,故Simt=1;發明授權與發明公開和實用新型均為全異關系,故Simt=0,將結果為0 的科技服務資源剔除,剩下的553種服務資源組成的服務集合進入下一步。
(2)服務資源QoS 匹配。對照3 個企業用戶需求對知識產權服務資源的QoS 要求,得到37 個符合要求的服務集合進行服務資源QoS 匹配(見表5、表6)。其中,表6 是對表5 的結果進行量化處理和歸一化計算,將QoS 匹配相似度閾值設為0.8,剔除匹配相似度小于0.8 的服務資源。表6 中服務可用性為服務被瀏覽使用的次數;可靠性為該服務不出故障的概率;性價比為該服務的報價占總服務的概率;專利價值度為對該專利的一個評價總值。

表5 實驗企業用戶的QoS 要求

表6 實驗平臺中部分知識產權服務資源的QoS 要求
(3)服務資源綜合匹配相似度計算。根據式(5)計算知識產權服務資源綜合相似度,結果如表7 所示,其中α、β分別為0.5,相似度閾值ω≥0.900。將綜合相似度值進行降序排列輸出知識產權服務,如表8 所示。

表7 實驗企業用戶需求與知識產權服務資源綜合相似度

表8 實驗企業用戶需求與知識產權服務資源匹配結果
采用準確率(precision)和召回率(recall)來驗證 EURSTC 算法在解決科技服務資源推薦與用戶需求匹配問題上的有效性。計算公式如下:

式(6)(7)中:C為符合要求的服務資源集合;D為返回的服務資源集合。
為便于對比分析,以用戶U1的需求為例,分別使用未考慮服務特殊屬性的基于QoS 的算法與取未量化用戶需求的CB 算法進行運算,并將匹配結果按照綜合相似度值進行降序排列,如表9 所示。

表9 不同推薦算法的實驗用戶U1 需求與知識產權服務資源匹配結果
假設符合用戶U1需求的服務集合為C={S32,S27},對比表8 和表9 可以看出,3 種算法都能從需求出發匹配到部分合適的服務,但匹配結果有所不同:CB 算法能獲取滿足用戶需求的服務S27,基于QoS 的算法能從QoS 方面匹配到用戶滿意的服務S32,而EURSTC 算法匹配出讓雙方滿意的服務S28和S31,同時匹配結果中也包含兩種對比算法中的最優匹配結果S32和S27。
為進一步驗證EURSTC 算法的有效性,采集豬八戒網站中知識產權服務、科技金融服務、檢驗檢測服務、技術轉移服務等4 類科技服務以及企業用戶數據作為數據集。其中,知識產權服務包含專利、域名、商標、網站共12 764 條數據;科技金融服務數據共514 條;檢驗檢測服務數據共152 條;技術轉移服務數據共997 條;企業用戶數據共3 645條。計算4 類科技服務在QoS 算法、CB 算法以及EURSTC 算法下的準確率和召回率(見表10),并繪制出相應的P-R 曲線(見圖3)。從表10 可見:

表10 各類科技服務推薦算法有效性比較
(1)因為同時考慮了專利服務的QoS 屬性和特殊屬性(專利價值度),EURSTS 算法在專利服務數據集上的準確率和召回率均高于其他兩種方法。其中,EURSTS 算法的準確率比其他兩種算法提高了33.4%~36.7%;隨著推薦服務數量的增加,3 種算法的準確率逐漸下降,但召回率均呈上升趨勢,而EURSTS 算法的召回率仍比其他兩種算法提高了5.9%~7.9%。
(2)因為同時考慮了檢驗檢測服務的QoS 屬性和特殊屬性(檢測周期),EURSTS 算法在檢驗檢測服務數據集上的準確率和召回率均高于其他兩種方法。其中,EURSTS 算法的準確率比其他兩種算法提高了33.3%~33.7%;隨著推薦服務數量的增加,3 種算法的準確率逐漸下降,但召回率均呈現上升趨勢,而EURSTS 算法的召回率仍比其他兩種算法提高了1.1%。
(3)因為同時考慮了科技金融服務的QoS 屬性和特殊屬性(融資金額),EURSTS 算法在科技金融服務數據集上的準確率和召回率均高于其他兩種方法。其中,EURSTS 算法的準確率比其他兩種算法提高了30.1%~33.4%;隨著推薦服務數量的增加,3 種算法的準確率逐漸下降,但召回率均呈現上升趨勢,而EURSTS 算法的召回率仍比其他兩種算法提高了0.1%~0.2%。
(4)因為同時考慮了技術轉移服務的QoS 屬性和特殊屬性(技術成熟度),EURSTS 算法在技術轉移服務數據集上的準確率和召回率均高于其他兩種方法。其中,EURSTS 算法的準確率比其他兩種算法提高了33.4%~37.1%;隨著推薦服務數量的增加,3 種算法的準確率逐漸下降,但召回率均呈現上升趨勢,而EURSTS 算法的召回率仍比其他兩種算法提高了0.8%~2.7%。
綜合圖3 和表10 可見:(1)EURSTS 算法的P-R曲線始終高于其他兩種方法的曲線,并且均有較高的準確率和召回率。相較于其他兩種算法,EURSTS算法的準確率提升了約30.1%~37.1%,召回率提升了約0.1%~7.9%;EURSTS 算法通過加入科技服務特殊屬性以豐富服務質量信息提高了準確率,同時獲取并量化用戶需求提高了召回率。(2)4 種科技服務的準確率隨推薦服務數量的增加而下降,召回率隨推薦服務數量的增加而上升。

圖3 不同算法的科技服務資源推薦結果P-R 曲線
本研究提出EURSTS 算法,通過模糊模型量化企業背景信息來獲取企業用戶需求偏好,然后考慮科技服務的特殊屬性與用戶需求進行服務類型和QoS 匹配,最后計算用戶需求與服務資源間的綜合相似度并提供推薦。與未量化用戶需求和未考慮服務特殊屬性的算法相比,EURSTS 算法更具有優越性和有效性,能在滿足企業用戶需求的前提下使科技服務資源推薦結果的準確率和召回率分別提高30.1%~37.1%和0.1%~7.9%,并合理匹配服務資源。
未來可以考慮研究單個科技服務的多類型特殊屬性,進一步提升科技服務資源的精準推薦,推動科技服務平臺的建設發展。