999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類和決策樹對上海景點評論分析

2018-08-18 11:06:32張小妹梁佩
科學與財富 2018年22期

張小妹 梁佩

摘 要:本文爬取了大眾點評網2017 年6 月份的上海周邊游景點評論數據,篩選出四個變量,運用R及其它統計軟件對其進行分析,分別采用"最長距離法"、"類平均法"、"重心法"、"Ward法"對總分、環境評分、服務評分三個變量進行聚類分析,分析結果與該景點星級進行比較,探究聚類后的數據與星級之間分類有無一致性。最后利用決策樹進行分類,得到景點星級,總分評分,服務評分的分類,分析了游客最關注的景點指標,得到景點的旅游建議和改進措施。

關鍵詞:上海景點評論、聚類分析;決策樹

一、模型建立與分析

本文選取了上海周邊游數據集中的score、enrironment、service這三個變量,其中的缺失值用樣本均值代替,首先利用歐式距離生成三個變量的距離函數,然后用最長距離法,類平均法,重心法和Ward法分別繪出繪出譜系圖和聚類情況,對四種方法進行對比,選擇一種輸出它的分類結果,最后利用決策樹建立了一個關于上海周邊游景點的游客選擇模型。

二、聚類分析

通過上面四幅圖發現,最長距離法和Ward法聚類產生的分類比較均勻,分別輸出他們的分類情況如下:

最長距離法的分類情況:

group

1 2 3 4

157 537 52 4

Ward法的分類情況:

group

1 2 3 4

59 180 170 341

在實際數據中,上海五星級景點數為79個,準五星景點數為114個,四星級景點數為239個,準四星級景點數為318個,通過對比發現用Ward法分類產生的聚類與我們的實際數據更相符,因此選用Ward法分類輸出具體的分類情況。

第1類星級

> max(第1類星級)

[1] 5

> min(第1類星級)

[1] 3.5

結果顯示,第一類含有59個景點,他們的星級為3.5-5;

第2類星級

> max(第2類星級)

[1] 5

> min(第2類星級)

[1] 3.5

結果顯示,第二類含有180個景點,他們的星級為3.5-5;

第3類星級

> max(第3類星級)

[1] 5

> min(第3類星級)

[1] 3.5

結果顯示,第三類含有170個景點,他們的星級為3.5-5;

第4類星級

> max(第4類星級)

[1] 5

> min(第4類星級)

[1] 3.5

結果顯示,第四類含有341個景點,他們的星級為3.5-5。

最后發現用Ward法分類產生四個類的星級都在3.5-5之間,說明依據score、environment、service來評價上海景點的星級是不太合理的。

三、利用決策樹建立游客選擇模型

通過決策樹發現,第一層是依據score變量來劃分,第二層是依據service變量來劃分,第三層是依據star變量來劃分,對于score<8分,service>=6.8分并且star為3.5分的占了51%,對于score<7分,service>=5.8分并且star為3.5分的占了8%,對于service<7分,score <5.8分并且star為4分的占了17%,對于service<6.8分,service>=7分并且star為4分的占了10%,對于service>8分,score<8.9分,并且star為4.5分的占了10%,對于service>8分,score>=8.9分,并且star為5分的占了4%,對于總分又高,星級又高的景點,建議游客去旅游,但這類景點數量比較可觀。

四、結論與建議

通過對上海總評評分,環境評分,服務評分進行聚類,發現星級分類與聚類產生的類別所包含的景點數不太一致,說明星級高的景點不一定各變量評分高,各變量評分高的景點不一定星級高,故在選擇景點進行旅游時,不應該只看星級、總評評分、環境評分、服務評分,而應該關注評論的具體內容來選擇適合的景點進行旅游。

通過對星級、總評評分、服務評分進行決策樹分類發現,對于總分和星級都高的景點,建議游客去旅游。

參考文獻:

[1]崔雷.專題文獻高頻主題詞的公司聚類分析[J].情報哦理論與實踐,1996,19(4):49—51.

[2] Metha M, Rissanen J, Agrawal R. SLIQ: A Fast Sealable Classifier for Data Mining[C]//Proc. of EDBT96. Avignon, France: [s. n.], 1996.

[3] 楊學兵,張俊.決策樹算法及其核心技術[J].計算機應用與發展,2007.17:43-45.

[4]馮少榮,尚文俊.基于樣本選取的決策樹改進算法[J].西南交通大學學報,2009,44(5):643-647.

主站蜘蛛池模板: 日韩成人在线视频| 色网站在线免费观看| 天天色综合4| 小说 亚洲 无码 精品| 欧美人人干| 婷婷99视频精品全部在线观看 | 好紧好深好大乳无码中文字幕| 日韩精品一区二区深田咏美| 亚洲经典在线中文字幕| 美女一级免费毛片| 女人18毛片一级毛片在线| 欧美在线视频a| 久久久久青草线综合超碰| 国产日本欧美亚洲精品视| 国产精品主播| 欧美综合区自拍亚洲综合天堂| 久久精品66| 中文国产成人精品久久| 亚洲水蜜桃久久综合网站| 亚洲91精品视频| 91成人在线观看| 国产又黄又硬又粗| 无码综合天天久久综合网| 孕妇高潮太爽了在线观看免费| 久久毛片免费基地| 国产理论最新国产精品视频| 国产真实乱子伦视频播放| 欧美v在线| 丰满人妻一区二区三区视频| 欧美成人综合视频| 精品伊人久久久香线蕉 | 国产一区免费在线观看| 成人在线第一页| 久久精品视频亚洲| 99热这里只有免费国产精品| 亚洲无码电影| 亚洲AV一二三区无码AV蜜桃| 日本高清在线看免费观看| 国产精品尤物在线| 亚洲色欲色欲www网| 露脸一二三区国语对白| 亚洲国产成人精品一二区| 在线精品视频成人网| 尤物国产在线| 五月婷婷伊人网| 色综合天天综合中文网| 国产区人妖精品人妖精品视频| 91亚洲视频下载| 国产91高跟丝袜| 日韩在线视频网站| 国产精品成人一区二区不卡 | 中文字幕有乳无码| 99精品在线看| 国产精品.com| 午夜国产大片免费观看| 久久不卡精品| 成人久久18免费网站| 看你懂的巨臀中文字幕一区二区| 青青青国产免费线在| 手机永久AV在线播放| 99久久精品国产麻豆婷婷| 成人在线不卡| 亚洲国产成人久久77| 暴力调教一区二区三区| 毛片三级在线观看| 女人18一级毛片免费观看| 99re在线视频观看| 996免费视频国产在线播放| 亚洲免费播放| 毛片视频网址| 中文字幕乱码二三区免费| 国产免费福利网站| 国产成人精品18| 亚洲美女AV免费一区| 国产精品va免费视频| 青草娱乐极品免费视频| 中文字幕无码av专区久久 | 国产男女免费视频| 992Tv视频国产精品| 久久综合色天堂av| 日韩高清欧美| 国产精品视频导航|