999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Python數據可視化的優勢
——以《三國演義》為例

2023-11-29 09:47:22李文娟
中國教育技術裝備 2023年19期
關鍵詞:可視化

李文娟

甘肅省定西市安定區教育局 甘肅定西 743000

0 引言

在數據科學、人工智能、大數據分析等迅猛發展的當前,數據可視化的方法不勝枚舉,數據可視化的目的主要是直觀展示信息的分析結果和構思,使大量抽象的數據具象顯示。國外常用的數據可視化工具有Visual Eyes、Google Trends、Many Eyes、Grasshopper、WebGL 等,國內常見的數據分析工具有Excel 數據圖表分析、SPSS 在線(軟件)數據分析、CiteSpace 可視化文獻分析、Python 第三方庫數據可視化等。本文以Python 語言數據可視化的過程為例,展現Python 強大的數據分析及可視化功能。

1 大數據時代數據可視化成為發展趨勢

1.1 大數據的時代背景

奧地利科學家維克托·邁爾-舍恩伯格是最早洞見大數據時代發展趨勢的數據科學家之一,2012年他在《大數據時代》中前瞻性地指出,大數據帶來的信息風暴正在變革我們的生活、工作和思維方式。國際互聯網數據中心預測,2025年全球每年產生的數據將達到175ZB,如果把175ZB 全部存在DVD 光盤中,那么DVD 疊加起來的高度可以繞地球222 圈。在如此海量的數據中,如何快速便捷地展現和發掘其中的價值,是一個巨大的挑戰。大數據時代信息量暴增,高效地獲取數據成為人們最關注的問題,也將成為未來研究的趨勢。

1.2 數據可視化的發展歷程

數據可視化的發展可追溯至20世紀50年代計算機圖形學的早期。在中國知網學術平臺上,以“數據可視化”為主題詞檢索發現,最早在1993年有一篇數據可視化的研究報告,文中提到1986年美國提出科學計算可視化的概念,在國際上引起廣泛重視。從20世紀90年代開始,國內一些高校和研究所相繼開展了可視化技術的研究[1]。根據知網發文年度趨勢表可知,從1993年至今,有關數據可視化的文獻數量逐年增多,尤其從2012年開始增長速度加快,在2020年達到峰值,至今研究熱度一直未減。

1.3 數據可視化的典型工具

表1 中簡述了當前常用的6 種數據可視化工具,它們在各自的應用領域有獨特的功能優勢,Visual Eyes 常用于可視化教學;Google Trends 應用于全球新聞等各類信息的可視化;Many Eyes 用于展現在線的可視化社區信息;Grasshopper 在建筑信息可視化方面更占優勢;WebGL 是一個不需要組件加載的網絡三維可視化技術;Cite Space 在論文熱點研究可視化方面功能強大。相較這些技術手段,Python 的應用領域更為廣泛,發展前景更好。

2 Python數據可視化的優勢

2.1 Python是一門功能強大及應用廣泛的編程語言

Python 是Guido van Rossum 在1990年開發的一個輕語法、弱類型的高級編程語言軟件,它擁有強大的第三方庫,最大的優勢是比其他語言更簡單易學,功能強大,數據結構高效,能快速實現面向對象的編程。除了數據可視化功能,該語言也廣泛支持應用程序的開發,在詞云、數據可視化、數據倉庫與數據挖掘、仿真系統等方面都有很多應用。在云端、網站、游戲開發、機器人、航天飛機控制、物聯網終端等領域,Python 應用無處不在[8]。此外,Python 還可以利用第三方庫爬取網絡、網頁以及網站內容,從而快速地收集所需要的信息。近年來,Python 在人工智能領域扮演著重要的角色,有很多典型的應用案例,例如:谷歌的無人駕駛、谷歌的AlphaGo 項目、微軟的小冰、蘋果的Siri、IBM的Watson 等[9]。

2.2 Python 具有豐富的第三方庫

Python 有標準庫和第三方庫兩類,標準庫Python 安裝自帶,可供使用者隨意使用,第三方庫則需要另外下載或者在線安裝。強大的標準庫是基礎,豐富的第三方庫是強化,隨著應用領域的拓展,強大的第三方庫使用途徑越來越廣泛,在高中信息技術教材中,涉及的第三方庫較多,每一個庫都有一個典型的應用特例,下面通過表2 對這些庫進行匯總介紹。

表2 Python 第三方庫介紹

2.3 Python數據可視化的過程有章可循

通過查閱大量文獻,發現利用Python 實現數據可視化的過程都有固定的模式。如戴瑗、鄭傳行基于Python,在爬取及分析南京二手房數據時,對數據進行采集、清洗,再對清洗后的數據進行可視化分析。翟高粵基于Python 的數據分析過程包含需求分析、數據獲取、數據預處理、分析建模、模型評價與優化、部署等步驟。陳都、徐峰的創傷流行病學可視化研究包括數據導入、數據清洗、統計分析、數據可視化以及模型建立等步驟。錢貝貝、陳志波基于Python 爬蟲的音樂數據可視化分析過程包含數據采集、數據預處理、數據分析和可視化展示等步驟,研究隱藏在這些海量數據背后的規律。本文將借鑒高中信息技術教材中數據處理的過程進行數據可視化研究,按照數據采集、數據整理、數據分析與數據可視化四個步驟,展示Python數據可視化的過程。

3 Python數據可視化的過程

基于《三國演義》小說文本,利用Python 實現文本和數值數據可視化。首先用詞云將文本數據可視化,主要利用jieba 庫分詞統計、imageio庫導入圖像、WordCloud 庫生成詞云功能;其次用圖表將數值數據可視化,在第一步的基礎上,采集jieba 分詞統計出來的高頻人物詞,利用CSV 文件處理,利用pandas 庫中的函數read_csv()讀取,利用NumPy 庫指定生成柱狀圖的列數,利用Matplotlib 庫中pyplot 函數繪制柱狀圖。

Requests 庫和Beautiful Soup 庫在《普通高中教科書·信息技術必修1 數據與計算》教材中沒作介紹,教材涉及的相關內容主要是網絡爬取數據這一內容的拓展,向學生展示爬蟲爬取數據的原理與過程,本文將不再贅述。

3.1 用詞云將數據可視化

3.1.1 數據采集與整理

數據采集主要是明確數據需求、確定數據來源、選擇數據采集的方法。選擇處理的對象是《三國演義》小說文本,通過網絡采集的方法,下載獲取文件;數據整理是相對煩瑣的一步,主要通過Word文檔整拼寫檢查及文檔校對功能校正文字,然后整理成txt 文件,放在指定文件夾中。

3.1.2 數據分析與可視化

數據分析與數據可視化既緊密聯系又相互融合,此處使用結構分析法,將分析的結果以詞云的形式生動、直觀地呈現出來。首先使用jieba 庫進行前20 個高頻詞統計,具體過程如圖1所示,從圖中可知在《三國演義》中曹操、孔明、劉備等詞語出現頻率很高,大概可以得出小說主要圍繞這些人物展開故事。

圖1 《三國演義》前20 個高頻詞統計

具體代碼如下:

print(items[i][0],items[i][1]) #輸出詞和出現次數

其次在jieba 分詞的基礎上應用imageio 庫和Wordcloud 庫生成詞云,具體如圖2所示,通過文字大小決定詞語頻率,詞云可以將小說出現頻率較高的主要詞語直觀呈現出來。

圖2 《三國演義》詞云

具體代碼如下:

3.2 用圖表將數據可視化

3.2.1 數據采集與整理

此處的數據采集基于以上網絡采集的文本,具體步驟是根據上面jieba 分詞統計的高頻詞,刪除與人物無關的高頻詞匯,只保留人物詞匯,將詞匯與頻次統計整理在數據表格文件中并保存為csv 文件,放在指定文件夾中。

3.2.2 數據分析與可視化

為清晰顯示每個高頻人物詞出現的數量,選擇對比分析法,生成柱狀圖,從而直觀地展示小說中出現頻率較高的七位人物的頻次差距,從圖3 得出頻率較高的七位三國人物是曹操、孔明、劉備、關羽、張飛、呂布、趙云,出現頻次分別為1 451、1 383、1 252、784、358、300、278。

圖3 《三國演義》前七位高頻人物出現的頻次

具體代碼如下:

4 結論

Python作為眾多數據可視化呈現的工具之一,有簡潔實用等多種優勢,作為三大主力編程語言榜首的Python,除了應用領域廣泛外,相較其他數據可視化軟件或語言,既能用圖表實現數值數據可視化,也能生成詞云實現文本數據可視化,這是Python實現數據可視化或者數據分析的獨特優勢,也是本文探索的價值所在,Python 的前景優勢可歸納為以下三點。

4.1 Python 應用領域廣泛

在爬蟲、數據分析、機器學習等模塊,Python具有巨大的潛力,強大的第三方庫賦予Python 更多的應用領域,其中pandas、NumPy、 SciPy 等用于數據分析,Matplotlib 用于作圖,sklearn 用于機器學習,PyBrain 用于神經網絡,PyGame 用于多媒體開發和游戲軟件開發,webpy 用于搭建Web 框架等。

4.2 學會Python 就業前景良好

Python 入門簡單易學,從事Python 開發,工作機會很多,未來發展空間也很大,在數據科學、人工智能、網絡爬蟲、游戲開發和桌面應用開發等方面,相關職位種類逐漸增多,如Python 數據分析師、人工智能工程師、爬蟲開發工程師、游戲軟件開發工程師等。

4.3 Python 用戶體驗更好

未來Python 將會在功能應用方面更快更高更強,Python 本身就是一個很實用的編程軟件,其標準庫和第三方庫非常強大,任何方向的技術編程都能找到相應的支持庫,眾多開發公司將它作為開發語言。近幾年PyPy 解釋器在不斷加快Python 的運行速度,相信再過幾年Python 在運行速度和開發效率方面將有很大的提升。

猜你喜歡
可視化
無錫市“三項舉措”探索執法可視化新路徑
基于CiteSpace的足三里穴研究可視化分析
自然資源可視化決策系統
北京測繪(2022年6期)2022-08-01 09:19:06
三維可視化信息管理系統在選煤生產中的應用
選煤技術(2022年2期)2022-06-06 09:13:12
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
可視化閱讀:新媒體語境下信息可視化新趨勢
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
主站蜘蛛池模板: 久草网视频在线| 国产精品永久久久久| 国产农村精品一级毛片视频| 国产精品网址你懂的| 成人一区专区在线观看| 国产精品刺激对白在线| 亚洲欧洲日产无码AV| 亚洲成A人V欧美综合天堂| 亚洲高清免费在线观看| 熟妇丰满人妻| 在线精品自拍| 国产成人无码播放| 在线免费不卡视频| 精品亚洲欧美中文字幕在线看| 91精品国产麻豆国产自产在线| 亚洲黄色高清| 久久亚洲综合伊人| 成人福利视频网| 伊人查蕉在线观看国产精品| 色男人的天堂久久综合| 性激烈欧美三级在线播放| 免费欧美一级| 免费人成在线观看视频色| 日本免费a视频| 国产成人久久综合一区| 人妻夜夜爽天天爽| 中文字幕人妻av一区二区| 亚洲第一成年人网站| 久久无码av一区二区三区| 丰满少妇αⅴ无码区| 亚洲色偷偷偷鲁综合| 亚洲中文字幕97久久精品少妇| 黄网站欧美内射| 亚洲精品日产精品乱码不卡| 91久久国产综合精品女同我| 成人免费视频一区| 四虎AV麻豆| 久久性妇女精品免费| 2021国产乱人伦在线播放 | 欧美日本二区| 欧美一区二区福利视频| 香蕉eeww99国产精选播放| 鲁鲁鲁爽爽爽在线视频观看| 久久性妇女精品免费| 91无码人妻精品一区二区蜜桃 | 中国一级特黄大片在线观看| 国产亚洲精品无码专| av一区二区三区高清久久 | 在线观看国产精品日本不卡网| 亚洲欧美在线综合一区二区三区| 一级毛片高清| 国产乱人乱偷精品视频a人人澡| 成人福利在线免费观看| 国产精品成| 亚洲美女一级毛片| 国产无码精品在线| 亚洲有无码中文网| 免费欧美一级| 欧美乱妇高清无乱码免费| 一本二本三本不卡无码| 久久综合色视频| 亚洲中文字幕日产无码2021| 毛片网站免费在线观看| 亚洲午夜福利精品无码不卡 | 青青操视频在线| Jizz国产色系免费| 本亚洲精品网站| 国产在线小视频| 欧美精品亚洲精品日韩专区| 国产精品第页| 亚洲日本中文字幕乱码中文| 手机在线免费毛片| 国产亚洲欧美日韩在线一区二区三区| 色视频国产| 国内99精品激情视频精品| 国产精品永久久久久| 久夜色精品国产噜噜| 日韩欧美视频第一区在线观看| 黄色片中文字幕| 美女内射视频WWW网站午夜 | 色网在线视频| 91免费国产高清观看|