張 麗 冰
(南開大學商學院,天津300071)
?
基于Fussy-GRNN的網(wǎng)絡論壇質(zhì)量評價
張麗冰
(南開大學商學院,天津300071)
互聯(lián)網(wǎng)論壇是目前進行直接知識交流的一條重要途徑,如何對互聯(lián)網(wǎng)論壇進行科學評價成為一個重要問題。在已有研究基礎上,本文從網(wǎng)站建設、網(wǎng)站管理、信息交流質(zhì)量和信息交流時效性等四個方面,構建網(wǎng)站質(zhì)量評價指標體系與基于模糊廣義回歸神經(jīng)網(wǎng)絡 (Fussy-GRNN) 的企業(yè)知識共享能力評價模型,并進行了相應測試。
網(wǎng)絡論壇;Fussy-GRNN;評價指標;評價模型
網(wǎng)絡論壇又名電子公告板(BBS),該系統(tǒng)通過網(wǎng)絡,使各用戶終端連接,進行數(shù)據(jù)或程序的上傳或下載、文章信息發(fā)布和閱讀等信息交換行為。現(xiàn)在的網(wǎng)絡論壇(網(wǎng)絡社區(qū)),是以電子公告板系統(tǒng)為核心進行應用擴展,集成信息公告欄、群組討論、在線實時聊天、交友、個人空間、無線增值服務等功能在內(nèi)的網(wǎng)上互動平臺。同一主題的網(wǎng)絡社區(qū)集中了具有共同信息需求的用戶。傳統(tǒng)形式下的網(wǎng)絡論壇分為論壇、版塊和主題三個層次,而新型網(wǎng)絡論壇則集成了博客、微博、社交網(wǎng)絡、個人空間等網(wǎng)絡應用,分層更加復雜和多樣。網(wǎng)絡論壇所具有的實時性(支持在線交流)、內(nèi)容豐富性(在法規(guī)要求的范圍內(nèi),可以自由根據(jù)論壇分類主題進行分析)、資源可靠性(絕大多數(shù)管理良好的論壇根據(jù)設定不允許發(fā)送無意義的文章,同時禁止惡意“灌水”回復)等特征,使人們在網(wǎng)絡生活中扮演著知識交流的角色。因此,有必要對網(wǎng)絡論壇進行評價,通過構建相關評價指標體系和評價模型,促使網(wǎng)絡論壇健康發(fā)展。
(一)國外相關研究情況
目前,國際上對網(wǎng)絡論壇的研究比較多,研究方向也各不相同。例如網(wǎng)絡論壇會員的行為分析、熱點追蹤與監(jiān)控、潛在對象行為影響等研究。
YuIchifuji, Susumu Konno, Hideaki Sone[1]214通過研究一種基于貝葉斯原理的算法,將論壇中的回復自動分為“普通評論”,“惡意破壞論壇秩序的評論”,“嚴重破壞論壇秩序的評論”三類,并且根據(jù)實驗,此算法對“惡意破壞”或“嚴重破壞”的評論歸類準確率為64.7%,對單純“惡意破壞”評論歸類的準確率為85.4%。
Yasufumi Takama, Masaki Okumura[2]1001提出了一個定時監(jiān)視多個BBS運行趨勢的可視化系統(tǒng)。他們認為BBS是一個能夠獲取最新信息并可以獲得在感興趣的話題下最廣的領域的觀點。因此,有必要多線程同時運作進行信息收集以獲得更多數(shù)據(jù)。他們這個構想的基礎是關鍵字可視化。此外他們的系統(tǒng)實現(xiàn)了靈活檢測用戶對關鍵詞的關注變化情況。他們同時通過試驗中基于眼動追蹤數(shù)據(jù)的原型系統(tǒng)獲取的測試參與者數(shù)據(jù),分析其行為。
Alexandra L. Whittaker等[3]135通過對基于Web2.0技術下的產(chǎn)物——Facebook——建構網(wǎng)絡學習社群對本科生動物學學習的影響,發(fā)現(xiàn)Facebook在教育領域有很大促進作用,這些主要作用體現(xiàn)在強化通訊,獲取社群援助和制定問題解決策略方面。
(二)國內(nèi)研究情況
目前,國內(nèi)對網(wǎng)站的相關評價研究正處于迅速發(fā)展時期。根據(jù)中國知網(wǎng)學術趨勢搜索提供的數(shù)據(jù)[4](如圖1所示,檢索時間2016-5-11),我國國內(nèi)對網(wǎng)站評價的論文,整體呈上升趨勢。

圖1 關鍵詞為“網(wǎng)站”并含“評價”的學術關注度圖
王晰巍等[5]111結合信息生態(tài)的相關理論和門戶網(wǎng)站發(fā)展狀況,基于信息者、信息和信息環(huán)境等3個信息生態(tài)基本要素,提出從“服務性、參與性、互動性”三方面入手,構建低碳類信息門戶網(wǎng)站生態(tài)性評價指標體系,利用層次分析法確定各評價指標權重。為驗證指標的應用價值,結合國內(nèi)外典型低碳類信息門戶網(wǎng)站進行實證研究。宋麗麗[6]114在網(wǎng)絡鏈接基本分析方法基礎上,構造銷售利潤率影響因子指標,并結合其它對中小企業(yè)網(wǎng)站影響較大的鏈接指標進行研究,分析其與樣本中小企業(yè)排名的相關關系,對中小企業(yè)網(wǎng)站影響力進行評價,進而對中小企業(yè)網(wǎng)站建設提出建議。趙躍[7]67引入對應分析法,以31個省級政府門戶網(wǎng)站為評價對象,以中國軟件評測中心的3個反映政府網(wǎng)站功能的指標數(shù)據(jù)與Alexa網(wǎng)站的8個實時監(jiān)測數(shù)據(jù)為依據(jù),建立相應的對應分析評價模型,并在此基礎上得到兩張對應分析定位圖,結合網(wǎng)站原始數(shù)據(jù)對兩張定位圖進行比較分析,并將圖中網(wǎng)站分類情況與中國軟件評測中心發(fā)布的省級政府網(wǎng)站排名情況行比較分析,揭示出不同水平政府門戶網(wǎng)站的優(yōu)勢與劣勢,從而達到對政府網(wǎng)站進行評價的真正目的。
(一)評價指標構建原則
在涉及到對事物質(zhì)量評價時,遵循以下原則。
1.系統(tǒng)性原則。影響網(wǎng)絡論壇質(zhì)量的因素較多,必須采用系統(tǒng)設計、系統(tǒng)評價的原則。在設定中抓住重要的、有代表性的指標,同時兼顧其他必要因素,這樣才能比較全面、客觀地評價網(wǎng)絡論壇的質(zhì)量。
2.定性與定量相結合原則。在影響網(wǎng)絡論壇質(zhì)量的因素中,包括不能量化但可以確定其性質(zhì)的定性指標和可以量化的定量指標等兩方面指標。
3.可行性原則。對網(wǎng)絡論壇的質(zhì)量評價指標體系建設,應考慮在實際操作中的可行性,要易于操作、方便實施。
(二)網(wǎng)絡論壇質(zhì)量評價指標的建立
基于上述三個原則,提出了網(wǎng)絡論壇質(zhì)量評價指標體系,包括網(wǎng)站建設、網(wǎng)站管理、信息交流質(zhì)量和信息交流時效性等。該指標體系在層次上分為目標層、準則層和指標層,各層次下具有相應的指標,如圖2與表1所示。

圖2 網(wǎng)絡論壇質(zhì)量評價體系
1.網(wǎng)站建設由網(wǎng)站的視覺建設( X1)、網(wǎng)站的用戶友好性 ( X2)、網(wǎng)站的系統(tǒng)穩(wěn)定性(X3)、網(wǎng)站的系統(tǒng)安全(X4)四項指標構成。視覺建設可通過網(wǎng)站的排版和色彩設置來衡量;網(wǎng)站的用戶友好性通過網(wǎng)站注冊、發(fā)布信息、來信提醒的便捷程度等來衡量;網(wǎng)站的系統(tǒng)穩(wěn)定性通過網(wǎng)站的加載能力,是否出現(xiàn)故障頁面導致無法登錄來衡量;網(wǎng)站的系統(tǒng)安全通過網(wǎng)站的賬號安全(是否易于盜號,個人信息是否易于泄露)來衡量。網(wǎng)站建設水平高低反映了網(wǎng)絡論壇的基礎性能好壞,也是信息交流的硬件基礎。

表1 網(wǎng)絡論壇指標數(shù)據(jù)
2.網(wǎng)站管理。包括網(wǎng)站規(guī)章編制( X5)、網(wǎng)站規(guī)章執(zhí)行( X6) 兩項指標。網(wǎng)站規(guī)章編制反映互聯(lián)網(wǎng)論壇對外界反應的靈活性和原則性,以及網(wǎng)站管理的預見性水平;網(wǎng)站規(guī)章執(zhí)行是指網(wǎng)站對于違規(guī)行為處理的響應速度,以及對違規(guī)行為處理質(zhì)量水平,可用站務反饋版塊中用戶的舉報文章數(shù)目來表征。
3.信息交流質(zhì)量。包括交流的信息標準化(X7)、交流的信息質(zhì)量(X8)兩項指標。交流的信息標準化表現(xiàn)在論壇中文章發(fā)表是否遵循一定格式,如轉(zhuǎn)載的文章是否會出現(xiàn)轉(zhuǎn)載文章的來源等;交流信息的質(zhì)量表現(xiàn)在論壇中優(yōu)秀文章多少,其可通過論壇中的“加分”、“高亮”、“推薦”、“精華”文章占總體文章的數(shù)目來衡量。
4.信息交流時效性。包括信息交流速度(X9)、信息交流響應數(shù)量(X10)兩項指標。信息交流響應數(shù)量表現(xiàn)在論壇發(fā)布一篇文章后收到其他網(wǎng)友的回復時間長短;信息交流的響應數(shù)量表現(xiàn)在論壇內(nèi)部一篇文章回復數(shù)量的平均值,平均值越高,說明論壇內(nèi)的用戶參與度越高。
(一)模糊理論介紹
模糊理論最初由美國加州大學L.A.Zadeh提出。該理論誕生原因是傳統(tǒng)精確的數(shù)學方法已不能完全有效解決生活中一些復雜問題,而使用模糊的邏輯觀念來描述現(xiàn)實生活中的事物具備一定可行性。模糊理論是以隸屬函數(shù)來表達人類生活中不明確或模糊性問題。本文采用三角隸屬函數(shù)進行分析。
在本文的10 個影響因素中,既有定性因素又有定量因素,如網(wǎng)站的視覺建設、網(wǎng)站的用戶友好性、網(wǎng)站的系統(tǒng)穩(wěn)定性、網(wǎng)站的系統(tǒng)安全、網(wǎng)站規(guī)章編制、交流信息的標準化等為定性因素;網(wǎng)站規(guī)章執(zhí)行、交流的信息質(zhì)量、信息交流的速度、信息交流的響應數(shù)量為定量因素。
對于不同類型的因素,要使用不同方法來確定其隸屬度: 對于定性因素可以通過專家評分法來確定隸屬度;對于定量因素可先對數(shù)據(jù)歸一化,然后再進行比較評價。
設定評價集 E {優(yōu)秀、良好、一般、較差},根據(jù)最大隸屬度原則來確定評價結果。如表1中所示的網(wǎng)絡論壇 N1的指標“網(wǎng)站的視覺建設”(X1) 的評價集為 {0、0.3、0.3、0.4},根據(jù)“最大隸屬度”原則,該網(wǎng)絡論壇的此項指標的評價結果為“較差”,其他指標評價結果也采用類似原則進行評價。
(二)GRNN 的結構和學習算法
GRNN ( General Regression Neural Network, 泛化回歸神經(jīng)網(wǎng)絡) 是徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡的變化形式之一。GRNN具有很強的非線性映射能力和柔性網(wǎng)絡結構;同時也具有較高的容錯性和魯棒性。根據(jù)實際經(jīng)驗,GRNN的訓練速度快于一般的RBF 網(wǎng)絡;與常用的BP 網(wǎng)絡相比,GRNN的收斂速度明顯較快。此外,GRNN可用于在樣本數(shù)據(jù)較少或數(shù)據(jù)不穩(wěn)定情況下獲得較好的評價與處理結果。
GRNN 構成如圖3,其各構成部分為:

圖3 GRNN的網(wǎng)絡結構
1.輸入層(Input Layer)。輸入層各神經(jīng)元是簡單的分布單元,直接將輸入變量傳遞到下一層。輸入層神經(jīng)元的數(shù)量等于學習樣本輸入向量的維數(shù)。
2.模式層(Pattern Layer)。又名隱含層。其神經(jīng)元的個數(shù)等于學習樣本的數(shù)目n,各神經(jīng)元對應不同的樣本,模式層神經(jīng)元傳遞函數(shù)為:

i=1,2,…,n
(1)
神經(jīng)元i的輸出為輸入變量與其對應的樣本 X 之間的歐式距離 ( Euclidean Distance) 平方的指數(shù)平方的指數(shù)形式。式中,X 為輸入變量; Xi為第 i 個神經(jīng)元對應的學習樣本。
3.求和層(Sum-mation Layer)。求和層使用以下計算公式進行求和:
(2)


GRNN 學習的步驟如下:
(3)計算測試樣本與標準模式的相似度,并利用訓練好的模型進行仿真。
(4)輸出結果。
(三)Fussy-GRNN 的網(wǎng)絡結構
根據(jù)模糊理論和 GRNN 的學習算法,構建出關于網(wǎng)絡論壇質(zhì)量評價的 Fussy-GRNN模型,如圖4 所示。

圖4 網(wǎng)絡論壇質(zhì)量的Fussy-GRNN網(wǎng)絡結構
該模型包括兩部分: 模糊處理部分和 GRNN 數(shù)據(jù)處理部分。其中,模糊處理部分負責對原始數(shù)據(jù)進行模糊化處理,使數(shù)據(jù)能夠被模糊神經(jīng)網(wǎng)絡所用;GRNN 在模糊數(shù)據(jù)的基礎上,實現(xiàn)對數(shù)據(jù)的訓練、仿真、測試等。
(一)數(shù)據(jù)收集
根據(jù)第二部分中提出的網(wǎng)絡論壇質(zhì)量評價指標體系,設計調(diào)查問卷,然后就11個綜合性網(wǎng)絡論壇中的汽車論壇進行問卷調(diào)查,調(diào)查對象包括資深網(wǎng)民、相關行業(yè)從業(yè)人員等。表1中所示的數(shù)據(jù)為經(jīng)過模糊化加工后的調(diào)查問卷數(shù)據(jù)。
(二)數(shù)據(jù)處理和分析
利用 MATLAB軟件,進行神經(jīng)網(wǎng)絡的模擬仿真工作。具體工作由以下幾個步驟構成。
1.Fussy-GRNN網(wǎng)絡結構的確定
(1)輸入層相關結構的確定。結合第三部分第二大問題中的相關描述,F(xiàn)ussy-GRNN網(wǎng)絡的輸入層神經(jīng)元數(shù)量由網(wǎng)絡論壇質(zhì)量的指標數(shù)量決定。但由于已對每個指標進行了模糊處理,共包括4 項分指標(即評價集 E 中的元素個數(shù)為4),所以輸入層的實際神經(jīng)元數(shù)量為 40 個 (10×4)。
(2)輸出層相關結構的確定。對于輸出層,因為輸出值也有4項分指標,所以輸出層神經(jīng)元的數(shù)量為4。
(3)隱含層相關結構的確定。隱含層的神經(jīng)元數(shù)目等于學習樣本的數(shù)量,結合對輸出層和輸入層神經(jīng)元結構的設計,隱含層的神經(jīng)元數(shù)量應為40個,并使誤差達到所要求的目標值。
2.利用Fussy-GRNN網(wǎng)絡進行分析處理
(1)利用 Fussy-GRNN 對原始數(shù)據(jù)進行模糊化處理,處理后的結果如表1所示。
(2)利用 Fussy-GRNN 進行數(shù)據(jù)訓練、仿真、測試。用表1中前8組數(shù)據(jù)(即前8個網(wǎng)站的質(zhì)量調(diào)查數(shù)據(jù))作為訓練樣本,然后用newgrnn 函數(shù)創(chuàng)建 Fussy-GRNN 中的GRNN網(wǎng)絡;分別設定徑向基函數(shù)分布密度值(SPREAD)為0.02、0.03、0.04、0.05、0.06、0.1、0.3、0.5、0.7、0.9,進而進行仿真。
通過在系統(tǒng)上仿真可以得知,當SPREAD=0.1時,誤差的數(shù)量級達到1.0e-47; 當 SPREAD =0.06 時,誤差的數(shù)量級達到1.0e-130;當SPREAD = 0.05時,誤差的數(shù)量級達到1.0e-188;當SPREAD = 0.04,誤差趨近于0。這就意味著,隨著SPREAD值增大,誤差越來越大。同理,隨著SPREAD值減小,誤差越來越小。但當SPREAD =0.03 ,系統(tǒng)提示誤差值無法顯示(表明無法顯示),因此為便于計算,選擇SPREAD值為0.04,完成對網(wǎng)絡的訓練。
對表1中的后4個網(wǎng)站數(shù)據(jù)作為測試樣本進行仿真,所得結果如表2所示。
由表2并根據(jù)評價集和最大隸屬度原則可以看出,網(wǎng)站N9的評價結果為 “優(yōu)秀”,N10為“良好”,網(wǎng)站 N11為“良好”。通過實地調(diào)研,對于網(wǎng)站N9和N10的實際評價結果與所仿真獲得的評價結果相符,從而也說明“基于Fussy-GRNN 的網(wǎng)

表2 Fussy-GRNN網(wǎng)絡評價結果(SPREAD=0.04)
絡論壇質(zhì)量評價”的有效性;但對于網(wǎng)站N11,實際評價中更多偏向于“優(yōu)秀”的評價,雖然其總體實際評價與本次模擬結果相同,但在進一步調(diào)查中受訪專家普遍認為N11相較“良好”中的其他網(wǎng)站有突出的優(yōu)秀表現(xiàn),盡管其與評價為“優(yōu)秀”的網(wǎng)站還有一定差距。這也說明我們在評價集的設計中存在一些問題,比如可選選項過少等,這些問題將在后面的研究中改進。
本文通過分析目前其他論文的相關研究成果,提出使用Fussy-GRNN作為工具的網(wǎng)絡體系,并通過相關測試證實其有效性。模糊矩陣方法較傳統(tǒng)的一些方法更能表達出關于具體的一些不便說明的事實的性能,為網(wǎng)絡評價提供了一個新方法。
[1]YuIchifuji, Susumu Konno, Hideaki Sone, An advisory method for BBS users and evaluation of BBS commets[J]. Procedia -Social and Behavioral Sciences,2010,(1).
[2]Yasufumi Takama,Masaki Okumura, Interactive Visualization for Monitoring Support of Multiple BBS Threads[J].Procedia Computer Science,2013 ,(2).
[3]Alexandra L. Whittaker, Gordon S.Howarth, Kerry A. Lymn,Evaluation of Facebook to create an online learning community in an undergraduate animal science class[J].Educational Media International, 2014,(2).
[4]中國知網(wǎng)學術趨勢搜索[EB/OL].[2016-5-11],http://trend.cnki.net/TrendSearch/trendshow.htm?searchword=%u7F51 %u7AD9%20%u8BC4%u4EF7.
[5]王晰巍, 郭宇, 魏駿巍等.門戶網(wǎng)站生態(tài)性評價及實證研究——以低碳類門戶網(wǎng)站為例[J].圖書情報工作,2014,(19).
[6]宋麗麗,徐靜. 基于網(wǎng)絡鏈接分析的中小企業(yè)網(wǎng)站分析與評價研究[J].現(xiàn)代情報,2015,(1).
[7]趙越. 基于對應分析法的政府網(wǎng)站評價研究[J].電子政務,2014,(3).
(責任編輯魯守博)
2016-06-17
張麗冰,女,山東濰坊人,南開大學商學院情報學碩士。
G206.2
A
1672-0040(2016)05-0019-06