耿凌頂 黃鑫萍
(1.大連大學(xué)國(guó)際學(xué)院,遼寧大連 116622;2.武漢輕工大學(xué)管理學(xué)院,湖北武漢 430048)
語(yǔ)義分析是通過(guò)對(duì)語(yǔ)言本身的文字、符號(hào)、語(yǔ)境等進(jìn)行解析,發(fā)掘那些不能通過(guò)普通閱讀所掌握的深層意義。網(wǎng)絡(luò)語(yǔ)義分析是在語(yǔ)義分析的基礎(chǔ)之上,通過(guò)對(duì)人們?cè)诰W(wǎng)絡(luò)上留下的語(yǔ)言進(jìn)行深層分析,充分發(fā)掘網(wǎng)絡(luò)語(yǔ)言背后人們的觀點(diǎn)、立場(chǎng)以及情感等要素。武漢錦里溝是武漢市木蘭山5A旅游景區(qū)群的核心景區(qū)之一,本文主要運(yùn)用“八爪魚(yú)”這一爬蟲(chóng)軟件和武漢大學(xué)開(kāi)發(fā)的ROSTCM6這一語(yǔ)義網(wǎng)絡(luò)分析軟件,以武漢錦里溝風(fēng)景區(qū)為實(shí)證對(duì)象,利用游客對(duì)景區(qū)評(píng)價(jià)作為研究數(shù)據(jù)來(lái)源,探究游客的情感傾向和具體需求,為景區(qū)的建設(shè)發(fā)展提出可行的建議。
在互聯(lián)網(wǎng)大發(fā)展的背景下,游客可以在各種網(wǎng)絡(luò)平臺(tái)上發(fā)表自己對(duì)景區(qū)的評(píng)論,這些評(píng)論蘊(yùn)含著游客最真實(shí)的情感,不僅影響其他游客對(duì)于該景區(qū)的印象以及消費(fèi)決策,也是對(duì)景區(qū)進(jìn)行整改完善的直接依據(jù)。本文以武漢錦里溝為研究對(duì)象,利用“八爪魚(yú)”軟件搜集了景區(qū)在美團(tuán)、去哪兒、攜程以及飛豬四大在線旅游平臺(tái)8 126條游客評(píng)論(表1)。

表1 四大平臺(tái)游客評(píng)價(jià)統(tǒng)計(jì)表
由于互聯(lián)網(wǎng)平臺(tái)的開(kāi)放性,游客評(píng)論語(yǔ)言在字?jǐn)?shù)、語(yǔ)法、格式上都存在很大的隨意性,因此需要利用爬蟲(chóng)軟件對(duì)收集到的這些評(píng)論文本進(jìn)行預(yù)處理。數(shù)據(jù)的預(yù)處理主要包含三個(gè)環(huán)節(jié),首先是刪除諸如“好”“很好”“不行”等等只有一兩個(gè)字、過(guò)于簡(jiǎn)短且不能產(chǎn)生語(yǔ)義關(guān)聯(lián)的游客評(píng)論。其次是去掉諸如“好好…”“差差…”“垃圾垃圾…”等將一個(gè)字或者一個(gè)詞多次復(fù)制粘貼,湊字?jǐn)?shù)的評(píng)論。最后就是刪除那些為獲取平臺(tái)上的評(píng)價(jià)積分,直接復(fù)制粘貼其他游客的評(píng)價(jià)。
經(jīng)過(guò)數(shù)據(jù)預(yù)處理后,已經(jīng)得出有效數(shù)據(jù)。但是游客評(píng)價(jià)大多是較長(zhǎng)的句子,為了挖掘景區(qū)游客評(píng)價(jià)的熱點(diǎn),需要利用ROSTCM6軟件的分詞處理功能,將評(píng)論的長(zhǎng)句子進(jìn)行分詞處理,抽取出游客評(píng)價(jià)的高頻詞匯和熱點(diǎn)詞匯。
分詞處理以后就可以利用ROSTCM6軟件進(jìn)行情感分析,也就是將文本分成正面、負(fù)面評(píng)價(jià),進(jìn)行二分化處理。其基本原理是根據(jù)每條的字、詞包含的情感積極性的高低打出不同的分?jǐn)?shù),一條評(píng)論中正面評(píng)價(jià)詞匯越多,分?jǐn)?shù)就越高,相反負(fù)面評(píng)價(jià)的分?jǐn)?shù)為負(fù)數(shù),0分為中性評(píng)論。表2是表1進(jìn)行預(yù)處理后,剩余7 124條評(píng)論二分化處理結(jié)果。

表2 二分化處理結(jié)果表
為了更加深入地了解景區(qū)哪些具體因素引發(fā)了游客的積極情感,以及這些積極因素之間的相互關(guān)系,將5 137條正面評(píng)價(jià)和ROSTCM6語(yǔ)言網(wǎng)絡(luò)分析功能,可以構(gòu)建游客在線正面評(píng)價(jià)的語(yǔ)義網(wǎng)絡(luò)分析圖(圖1)。

圖1 武漢錦里溝景區(qū)游客正面評(píng)價(jià)語(yǔ)義網(wǎng)絡(luò)圖
通過(guò)圖1可以看出景區(qū)存在以下優(yōu)勢(shì):
1)“錦里溝”和“景區(qū)”這兩個(gè)界定研究對(duì)象的節(jié)點(diǎn)同時(shí)指向了“風(fēng)景”節(jié)點(diǎn),而“風(fēng)景”又指向了“很好”這一節(jié)點(diǎn),說(shuō)明大多數(shù)游客認(rèn)為錦里溝景區(qū)“風(fēng)景優(yōu)美、景色不錯(cuò)”。
2)“工作人員”“服務(wù)”“態(tài)度”這幾個(gè)一二級(jí)節(jié)點(diǎn)與“很好”這個(gè)一級(jí)節(jié)點(diǎn)構(gòu)成了一個(gè)封閉的四邊形,不難得出該景區(qū)內(nèi)工作人員的服務(wù)態(tài)度很好是引發(fā)錦里溝景區(qū)的游客正面情感的一大因素。
3)一級(jí)節(jié)點(diǎn)“好玩”關(guān)聯(lián)了“山道”“滑車(chē)”“玻璃橋”“玻璃”“漂流”“項(xiàng)目”等多個(gè)次級(jí)節(jié)點(diǎn),說(shuō)明景區(qū)內(nèi)項(xiàng)目較多,收獲了不少游客特別是小孩子們的喜愛(ài)。
4)“土家”“風(fēng)情”“文化”這三個(gè)節(jié)點(diǎn)之間構(gòu)成了一個(gè)封閉三角形,證明景區(qū)土家族的少數(shù)民族文化給較多游客留下了深刻的印象,事實(shí)上錦里溝景區(qū)是武漢市唯一的土苗文化風(fēng)情區(qū),文化特色鮮明。
5)“網(wǎng)上”“劃算”這兩個(gè)一級(jí)節(jié)點(diǎn)與“買(mǎi)票”節(jié)點(diǎn)形成了一個(gè)封閉的三角形,表明了大多數(shù)游客認(rèn)為錦里溝景區(qū)在網(wǎng)上購(gòu)票十分劃算。實(shí)踐中武漢錦里溝是木蘭山5A旅游景區(qū)群中,最早“觸網(wǎng)”并推行團(tuán)購(gòu)的景區(qū)。
同理,為了挖掘?qū)е洛\里溝景區(qū)游客產(chǎn)生負(fù)面情緒的主要因素,以及這些因素之間的相互關(guān)系,可以通過(guò)1 423條負(fù)面評(píng)價(jià),構(gòu)建負(fù)面評(píng)價(jià)語(yǔ)義網(wǎng)絡(luò)圖(圖2)來(lái)完成。

圖2 錦里溝景區(qū)游客負(fù)面評(píng)價(jià)語(yǔ)義網(wǎng)絡(luò)圖
通過(guò)圖2可以看出景區(qū)存在以下問(wèn)題:
1)景區(qū)收費(fèi)混亂。圖2中“項(xiàng)目”“收費(fèi)”“門(mén)票”都是高頻詞匯,并且“景區(qū)”“項(xiàng)目”“門(mén)票”“玩的”這四個(gè)節(jié)點(diǎn)都指向了“收費(fèi)”節(jié)點(diǎn)。在負(fù)面評(píng)價(jià)文本中通過(guò)搜索“收費(fèi)”,可以發(fā)現(xiàn)很多游客反映景區(qū)存在胡亂收費(fèi)現(xiàn)象。
2)景區(qū)配套設(shè)施不完善。在負(fù)面評(píng)價(jià)語(yǔ)義圖中可以看到“配套”“設(shè)施”“不完善”節(jié)點(diǎn)之間形成了一個(gè)封閉的三角形,顯然游客認(rèn)為景區(qū)配套設(shè)施不夠完善。通過(guò)在游客負(fù)面評(píng)價(jià)文本中搜索這三個(gè)詞語(yǔ)發(fā)現(xiàn),很多游客反映景區(qū)垃圾桶太少、沒(méi)有路標(biāo)。
3)工作人員數(shù)量少、素質(zhì)較低。圖2中,“服務(wù)”“人員”“態(tài)度”“管理”這四個(gè)節(jié)點(diǎn)構(gòu)成了一個(gè)封閉的四邊形,可以看出游客十分看重景區(qū)內(nèi)服務(wù)人員的態(tài)度及管理。除此之外,“景區(qū)”“工作人員”“太少”節(jié)點(diǎn)之間也構(gòu)成了一個(gè)封閉的三角形。瀏覽景區(qū)負(fù)面評(píng)價(jià)文本,可以得知該景區(qū)內(nèi)的工作人員很少,無(wú)法問(wèn)路,還有部分游客認(rèn)為景區(qū)工作人員態(tài)度不熱情。
4)景區(qū)環(huán)境衛(wèi)生問(wèn)題突出。在負(fù)面評(píng)價(jià)語(yǔ)義分析圖中可以看到“垃圾”節(jié)點(diǎn)直接指向了“有點(diǎn)多”節(jié)點(diǎn)。在語(yǔ)義分析中,“垃圾”這一詞匯可以是形容詞,體現(xiàn)游客對(duì)景區(qū)的負(fù)面評(píng)價(jià),同時(shí)也可以作為名詞,說(shuō)明游客認(rèn)為景區(qū)內(nèi)的垃圾較多,污染了環(huán)境。結(jié)合負(fù)面評(píng)價(jià)文本分析,確實(shí)存在部分游客為了吐槽景區(qū)而形容其很“垃圾”,而更多的游客評(píng)論景區(qū)環(huán)境衛(wèi)生條件差,“垃圾很多”。
5)景區(qū)周邊道路設(shè)計(jì)不合理。從圖2中可以看到,“道路”節(jié)點(diǎn)上的連接弧較多,“不好走”以及“景區(qū)”節(jié)點(diǎn)直接指向了“道路”,說(shuō)明游客認(rèn)為該景區(qū)的道路不好走。通過(guò)結(jié)合所有的負(fù)面評(píng)價(jià)文本進(jìn)行綜合分析,發(fā)現(xiàn)游客主要抱怨這些交通問(wèn)題:首先是景區(qū)內(nèi)部路況很差,山路、泥巴路多,景區(qū)外部道理路彎彎繞繞,道路不平整,安全隱患較大,其次是景區(qū)的路上路標(biāo)很少,游客導(dǎo)入性不足,最后是景區(qū)周邊堵車(chē)嚴(yán)重,缺乏工作人員進(jìn)行疏通。事實(shí)上,錦里溝景區(qū)位于武漢市邊遠(yuǎn)的黃陂區(qū),屬于大別山南麓余脈,交通設(shè)施建設(shè)任重道遠(yuǎn)。
在“互聯(lián)網(wǎng)+”時(shí)代,各大網(wǎng)絡(luò)平臺(tái)上已經(jīng)形成了海量的游客評(píng)論數(shù)據(jù)。與此同時(shí),隨著計(jì)算機(jī)科學(xué)的發(fā)展,人工智能改變了人類(lèi)與計(jì)算機(jī)的交流方式,運(yùn)用人工智能進(jìn)行語(yǔ)義數(shù)據(jù)挖掘,可以在對(duì)現(xiàn)實(shí)世界中的事物進(jìn)行描述的語(yǔ)言中探索出更多有用的數(shù)據(jù)和信息。本文以武漢市錦里溝景區(qū)的網(wǎng)絡(luò)評(píng)價(jià)為數(shù)據(jù)來(lái)源,運(yùn)用相關(guān)的語(yǔ)義網(wǎng)絡(luò)分析工具,對(duì)這些文本正、負(fù)面評(píng)價(jià)進(jìn)行了進(jìn)一步挖掘,既為景區(qū)發(fā)展起到導(dǎo)向作用,也是對(duì)語(yǔ)義數(shù)據(jù)網(wǎng)絡(luò)分析的一次有益的探索。
農(nóng)業(yè)開(kāi)發(fā)與裝備2023年5期