999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于R語言的文本數據可視化分析教學

2020-07-23 06:20:02楊杰
商情 2020年29期
關鍵詞:可視化

【摘要】數據的可視化作為一種最新的統(tǒng)計數據分析方法已經廣泛運用在各個領域中,大數據時代背景下作為非統(tǒng)計專業(yè)本科學生,掌握一門統(tǒng)計分析軟件是必要的。而利用統(tǒng)計軟件進行可視化分析又是一項極為重要的必備技能。文章以R語言為基礎,對近2020年國家政府工作報告進行可視化分析,以期激發(fā)學生對于統(tǒng)計數據分析的興趣。

【關鍵詞】R語言;可視化;政府工作報告;統(tǒng)計教學

1軟件介紹

R軟件本質上是一種語言,即R語言,它是在S語言的一個分支,早在上世紀80年代左右被人們所開發(fā)并使用,如今是統(tǒng)計領域使用極為廣泛的一種數據分析工具。它在數據探索、統(tǒng)計分析和統(tǒng)計作圖上面具有獨特的優(yōu)勢,屬于一種解釋型語言。R整體上是一套集數據處理、運算、制圖為一體的軟件系統(tǒng)。其對于數組的運算功能尤其強大,所以R又可以視為一種數學計算的環(huán)境。R不僅有完整連貫的分析工具包和豐富即時的制圖包,它的編程語言還十分簡便且強大,用戶可以對數據進行輸入輸出的雙向操縱、分支、循環(huán)以及自定義功能。R語言的主題思想就是給用戶提供集成化的統(tǒng)計工具,海量的數學計算、統(tǒng)計計算函數,用戶可以靈活機動進行數據分析,更甚者可以根據需求創(chuàng)造新的統(tǒng)計計算方法并與所有使用者共享。

R能夠被廣泛使用還得益于其使用上的免費和8個基礎模塊之外的CRAN板塊,CRAN已經收錄了超4000個各類包,可用于經濟計量、財經分析、人文科學研究以及人工智能等諸多領域。

2文本數據可視化分析工具——詞云

“詞云”這個概念由美國西北大學新聞學副教授、新媒體專業(yè)主任里奇·戈登(Rich Gordon)提出。“詞云”就是通過形成“關鍵詞云層”或“關鍵詞渲染”,對文本文件中出現(xiàn)頻率較高的“關鍵詞”的視覺上的突出。使用的R制作詞云主要包含:文本數據獲取、數據分詞處理、制圖三個部分。

3教學案例展示

第1步:文本數據獲取

將文本數據保存為txt格式存儲,采用scan( )函數進行文本數據的獲取,代碼如下:

f<-scan(‘C:\\\\Users\\\\Administrator.PC-20190315DIEF\\\\Desktop\\\\2020政府工作報告全文.txt,sep=‘\\n,what=‘,encoding=“GBK”)#讀取存儲于桌面的文件

第2步:數據分詞與統(tǒng)計詞頻

seg <- qseg[f] #使用qseg類型分詞,并把結果保存到對象seg中

seg <- seg[nchar(seg)>1]#去除字符長度小于2的詞語

seg <- table(seg)#統(tǒng)計詞頻

seg <- seg[!grepl(‘[0-9]+,names(seg))]#去除數字

seg <- seg[!grepl(‘a-zA-Z,names(seg))]#去除字母

length(seg)#查看處理完后剩余的詞數

seg <- sort(seg,decreasing=TRUE)[1∶200]#降序排序,并提取出現(xiàn)次數最多的前200個詞語

seg #查看200個詞頻最高的

第3步:制圖

通過data.frame( )函數將進行分詞和統(tǒng)計詞頻后的文本數據保存為新的系統(tǒng)文件,然后利用wordcloud2函數進行詞云制作,代碼如下:

data=data.frame(seg)

library(wordcloud2)

wordcloud2(data,size=1,minSize=0,gridSize=0,fontFamily=‘Segoe UI,fontWeight=‘bold,color=‘random-dark,backgroundColor=“white”,minRotation=-pi/4,maxRotation=pi/4,shuffle=TRUE,rotateRatio=0.4,shape=‘circle,ellipticity=0.65,widgetsize=NULL,figPath=NULL,hoverFunction=NULL)

主要參數講解:

data:需要繪制的文本數據;size:字體大小,默認為1;fontFamily:字體;color:字體顏色;backgroundColor:背景的顏色;;shape:繪制“云”的形狀。最終得到“詞云”如圖1。

4總結

統(tǒng)計學的理論基礎是數學,分析基礎是“數據”。如今“大數據”時代飛速發(fā)展,每秒鐘都在產生海量的數據,利用好這些數據是尤為重要的,通過一個簡單的文本數據可視化例子帶領學生脫離“死記硬背”統(tǒng)計學中的概念、公式的漩渦,提高學生的動手欲望,養(yǎng)成大膽嘗試,用于探索數據,讓數據“說話”的統(tǒng)計學學習理念。與此同時,熟練掌握一門統(tǒng)計分析軟件尤為重要。作為一名非統(tǒng)計專業(yè)的學生學習統(tǒng)計學最重要的一個目標就是:能夠將數據分析結果呈現(xiàn)出來,并且結合相關專業(yè)領域進行結果的解釋。

參考文獻:

[1]中國政府網.2020年政府工作報告全文[A/OL].http://china.findlaw.cn/fagui/p-1/39934.html.

[2]張杰.R語言數據可視化之美[M].北京:電子工業(yè)出版社,2019.

作者簡介:

楊杰(1991-),男,四川眉山人,碩士研究生,初級統(tǒng)計師,研究方向:應用統(tǒng)計分析。

猜你喜歡
可視化
無錫市“三項舉措”探索執(zhí)法可視化新路徑
基于CiteSpace的足三里穴研究可視化分析
自然資源可視化決策系統(tǒng)
北京測繪(2022年6期)2022-08-01 09:19:06
三維可視化信息管理系統(tǒng)在選煤生產中的應用
選煤技術(2022年2期)2022-06-06 09:13:12
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統(tǒng)
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
可視化閱讀:新媒體語境下信息可視化新趨勢
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
主站蜘蛛池模板: 国产激情无码一区二区免费| 熟女日韩精品2区| 国产成人凹凸视频在线| 精品免费在线视频| 综合网天天| 欧美亚洲国产精品第一页| 国产99视频精品免费观看9e| 亚洲欧美激情另类| 亚洲视频免费在线看| 日本欧美视频在线观看| 九一九色国产| 亚洲天堂久久新| 露脸真实国语乱在线观看| 日韩精品一区二区三区大桥未久| 亚洲日本一本dvd高清| 精品91视频| 久久久精品久久久久三级| 91视频首页| 日本免费精品| 日韩欧美中文亚洲高清在线| 亚洲免费毛片| 无码免费视频| 亚洲手机在线| 国产麻豆永久视频| 欧美一级爱操视频| 91精品人妻互换| 亚洲精品午夜天堂网页| 亚洲一级毛片在线观播放| AV在线天堂进入| 中文字幕精品一区二区三区视频| 国产精品专区第1页| 91九色国产porny| 激情亚洲天堂| 欧美国产中文| 亚洲香蕉久久| 91精品专区国产盗摄| 国产精品专区第1页| 无码电影在线观看| 91福利在线看| 国产91丝袜在线播放动漫| 亚洲欧美成人影院| 国产黄在线免费观看| 午夜一区二区三区| 999精品色在线观看| 欧美福利在线观看| 99ri精品视频在线观看播放| 青青草国产免费国产| 老色鬼欧美精品| 91精品国产自产91精品资源| 久久国产毛片| 亚卅精品无码久久毛片乌克兰| 谁有在线观看日韩亚洲最新视频| a色毛片免费视频| 天天爽免费视频| 91在线国内在线播放老师| 全部免费特黄特色大片视频| 精品一区国产精品| 亚洲中文字幕日产无码2021| 看看一级毛片| 亚洲色图欧美在线| 欧美色视频在线| AV无码一区二区三区四区| 99久久精品国产综合婷婷| 高清无码手机在线观看| 亚洲男女天堂| 欧洲亚洲一区| 亚洲综合亚洲国产尤物| 久久福利网| 97青草最新免费精品视频| 女人18一级毛片免费观看| 亚洲第一区在线| 国产性精品| 欧洲高清无码在线| 久久精品丝袜高跟鞋| 欧美一区国产| 欧美久久网| 又爽又大又光又色的午夜视频| 国产精品2| 五月天久久婷婷| 91麻豆精品视频| 91精品视频网站| 人妻丰满熟妇αv无码|