陳睿,劉靜偉
(西安工程大學服裝與藝術設計學院,陜西 西安 710000)
網絡游戲又稱為電子游戲,游戲服裝直觀地展示了游戲角色的性格特征、游戲世界的設定以及游戲文化的傳達[1],也是游戲玩家構建自我形象,實現身份認同的重要道具[2],同時給游戲帶來了可觀的經濟價值[3]。
數據挖掘是指從大量的數據中提取有價值的信息和知識,通過數據挖掘技術,可以發現數據之間的關系和規律[4]。通過語料庫及自然語言處理工具進行數據挖掘的相關研究,已基于語料庫數據,分析了服裝色彩情感核心語義特征[5]、“潮”文化的文化特征[6]、絲綢文化情感特征與構成[7]、服裝品牌知識集群等[8]。將數據挖掘技術應用于對網絡游戲服裝的研究現狀及研究熱點的挖掘,可以進一步分析網絡游戲服裝研究進展,為網絡游戲服裝的研究提供參考。
網絡游戲服裝研究現狀及研究熱點挖掘的第一步是建立網絡游戲服裝相關文獻的專業語料庫。在CNKI 數據庫中進行高級檢索,檢索條件設置為:主題%=“網絡游戲服裝”or“網絡游戲服飾”or“電子游戲服裝”or“電子游戲服飾”,共檢索出網絡游戲服裝相關文獻282 篇。
我國網絡游戲服裝的研究起步于2000 年,起步較晚,發展較為緩慢,研究主題統計中,排名最高的是游戲角色設計,其次是與傳統文化、文化傳播、服裝設計等。
為了對網絡游戲服裝的相關文獻進行進一步的詳細分析,經過人工篩選,剔除文獻核心與網絡游戲服裝關聯不夠緊密的文獻,最終選擇其中的86 篇與網絡游戲服裝關聯度高的文獻構建網絡游戲服裝專業語料庫。
KH coder 是一個計量文本數據挖掘軟件,用于處理和分析文本數據,該軟件有詞頻分析、共現分析、相關性分析、聚類分析等功能,并將分析結果進行可視化展示,適用于非結構化文本的分析[9]。
為分析結果更加精確,首先進行新詞詞表和停用詞表的設置。語料庫中部分詞匯屬于行業專有詞匯,需進行新詞設置,才可被作為一個完整的詞語識別,從而進行分析。例如“網絡游戲”,如不進行新詞設置,軟件會把“網絡游戲”這個詞語分割成為單獨的兩個詞語:“網絡”和“游戲”進行分析。通過反復試驗,共設置新詞306 個,例如:虛擬時尚、武俠小說、忍者服、插肩袖、卷草紋等。
為排除一些出現頻率高,但對分析結果無用的干擾詞匯,設定停用詞表,參考百度的常用中文停用詞表,最終設置停用詞2 101 個。
在完成新詞詞表及停用詞詞表的設置后,對網絡游戲服裝語料庫進行分詞和詞性標注,將詞語分為名詞(Noun)、專有名詞(ProperNoun)、新詞詞表詞語(TAG)、形容詞(Adj、JJ)、副詞(Adv)、動詞(Verb)。
層次聚類是一種常用的聚類分析方法,用于將一組樣本或數據點劃分為不同的群組或類別。通過計算每一個類別的數據點與所有數據點之間的距離來確定它們之間的相似性,距離越小,相似度越高,并將距離最近的兩個數據點或類別進行組合,構建聚類層次結構[10]。
圖1 是網絡游戲服裝語料庫層次聚類的結果,共七個聚類,左側的柱狀圖反映詞頻的高低。

圖1 層次聚類分析圖Fig.1 Hierarchical cluster analysis diagram
由聚類A 可見,網絡游戲服裝與民族、傳統文化相關的符號學研究;由聚類B 可見,網絡游戲服裝的設計與角色的塑造密不可分,且聚類B 的詞頻明顯高于其他聚類,可見網絡游戲服裝設計和角色塑造相關的研究占比較大;聚類C 可見網絡游戲服裝的藝術表現形式與角色的人物造型有關;聚類D 可見未來主義風格相關游戲服裝的占比較大;聚類E 可見,網絡游戲服裝的設計元素,例如色彩、紋樣等與審美以及歷史背景相關;聚類F 可見,網絡游戲服裝與玩家的虛擬形象相關聯;聚類G 可見,游戲服裝的發展與玩家心理及虛擬社會中的社交活動相關。
KWIC(keyword in context)檢索即上下文關鍵詞檢索,通過對檢索詞左側右側的上下文適當距離的詞匯進行篩選及統計,探索與檢索詞一定距離內的高度關聯詞。
表1 是與網絡游戲服裝風格密切相關的詞匯集群。Jaccard系數越高,則表明該詞語在文本中權重越大。根據Jaccard 系數和詞頻判斷,在相關研究中,網絡游戲服裝風格主要有:未來主義、古典、奇幻、浪漫、傳統等。

表1 “風格”KWIC 檢索結果統計表(部分)Tab.1 "Style"KWIC search results statistic al table(Part)
多維尺度分析是根據具有多重維度的樣本或變量之間的相似性或非相似性來對其進行分類的一種統計學研究方法,其中相似性越高,氣泡之間的距離就會越近。選用二維分析,橫豎坐標分別對應不同的維度,氣泡大小對應該詞出現頻率的高低,不同顏色的氣泡則對應不同的聚類。
圖2 是網絡游戲服裝語料庫數據選取形容詞進行的多維尺度分析結果,展示了不同維度下形容詞之間的相關性。表2 是從形容詞中提取和網絡游戲服裝最為密切相關的美感類形容詞,并進行了五個不同的子集劃分。

表2 美感形容詞分類子集(部分)Tab.2 Classification Subsets(part)ofaesthetic adjectives

圖2 形容詞多維尺度分析圖Fig.2 Adjective multidimensional scale analysis diagram
圖3 是動詞多維尺度分析結果,將聚類中的動詞按照關聯角色進行分類,得到表3 所示的五個子集,分別與設計研發人員、運營人員、游戲玩家、研究人員相關聯。

表3 動詞分類子集(部分)Tab.3 Verb Classification Subsets(parts)

圖3 動詞多維尺度分析圖Fig.3 verbs Multidimensional scale analysis diagram
網絡游戲服裝在我國研究起步較晚,主要有文化、造型藝術、符號學、心理學等相關研究。文章通過對CNKI 數據庫內網絡游戲服裝相關文獻進行篩選后建立語料庫,并用文本挖掘工具對語料庫進行數據分析,挖掘網絡游戲服裝的研究內容和研究熱點。結果表明,運用語料庫分析法對網絡游戲服裝相關文獻進行數據挖掘及知識抽取具有可行性,實驗結果對網絡游戲服裝相關領域的研究和應用具有一定的參考價值。