999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據技術在商業分析中的實踐應用研究

2021-11-05 15:35:58宋偉偉
數字通信世界 2021年10期
關鍵詞:可視化數據庫功能

宋偉偉

(四川財經職業學院,四川 成都 610101)

1 大數據技術

大數據技術是當前比較熱門的技術之一,萬物信息化、數字化就會產生大量的數據,而產生的大量數據是錯綜雜亂的,可以通過數據分析、可視化等技術,將有規律有用的信息呈現出來[1]。數據科學與大數據技術是一門比較新穎且跨學科比較多的技術, 因此需要有數學、編程、統計學、計算機等知識。

商業數據分析不僅是向管理者提供各種數據, 還需要更加深入的方法來記錄、分析和提煉數據, 并以易于理解的格式呈現結果。數據本身僅僅是事實和數字,可以通過大數據技術尋找數據規律,結合業務問題找出有用信息,提高生產力。

2 實驗相關技術闡述

2.1 網絡爬蟲技術

網絡爬蟲[2]是一種基于B/S架構的數據采集技術,它能夠按照一定的規則自動抓取萬維網信息的程序或者腳本。網絡爬蟲運行流程如圖1所示,由調度器負責URL管理器、網頁下載器、網頁解析器之間的協調工作,價值數據是從網頁中提取出的數據,其通常被保存在文件或者數據庫中。

圖1 網絡爬蟲運行流程

2.2 數據庫存儲技術

通過網絡爬蟲對于爬取到的數據列表進行存儲,以備下一步數據分析使用。主要用到的數據存儲技術是mysql、sqlserver、csv文 件 存 儲、excel表 格 存 儲、mongoDB等,本文實驗中是將爬取到的數據存儲到mysql數據庫中。

2.3 數據分析技術

商業數據分析工具主要包括Python、R、Stata、MATLAB、EViews、SAS、SPSS等,本文實驗應用的是Python數據分析工具。

Python是一種面向對象、解釋性的計算機程序設計語言,Python語言簡潔而清晰,具有豐富而強大的類庫,能夠把用其他語言制作的各種模塊很輕松地聯結在一起。在Python中,通過安裝Pandas、Numpy、

Scipy、Statsmodels、Matplotlib、Seaborn、Scikit-Learn、Theano、Tensorf low等一系列的程序包實現上述功能,還需要安裝IPython交互環境。

本文實驗中,通過Numpy實現數值計算, Pandas實現數據分析、分組聚合等操作,Matplotlib 和Seaborn實現數據可視化。

2.4 數據可視化技術

Python提供了非常多樣的繪圖功能,可以通過Python提供的工具Matplotlib繪制二維、三維圖形。Seaborn在Python中用于創建信息豐富和有吸引力的統計圖形庫,它基于Matplotlib,提供多種功能,實現單因素、雙因素、線性回歸、數據矩陣、統計時間序列等的可視化,以便進一步實現更加復雜的可視化過程。

Matplotlib常用的制圖功能有直方圖、散點圖、曲線標繪圖、連線標繪圖、箱圖、餅圖、條形圖、點圖等。

3 在商業中的應用

準備好工具后,首先需要從網站上抓取信息并對數據進行初步分析,了解數據的構成并判斷數據的質量。數據初步分析往往是統計性的、多角度的、嘗試性的。根據分析的結果進行深入的挖掘, 得到更有價值的結果。

3.1 明確目標

論文中的目標相對比較明確,最終目標是要根據實時獲取到的Top100排名圖書,可視化顯示前十名熱銷圖書和熱評圖書的數據,以及根據關注的圖書進行圖書推薦、圖書價格和評論預警等功能。

3.2 數據采集與處理

在進行數據采集時,需要根據實際的業務環境采用不同的方式,本文中使用爬蟲對數據進行采集,使用爬蟲獲取京東計算機行業排行榜數據。獲取的數據有:獲取排名前100名的圖書名、出版社、圖書鏈接、圖書ID、價格。

本文采集數據中,創建了Crawl.py文件,創建了的Crawl類定義三個方法:def get_ranking( ):獲取排行前100名的圖書ID;def get_ pr ice( ):根據ID獲取前100名在圖書價格,并存儲圖書名、出版社、京東價格、定價、鏈接、ID列表;def get_evaluation():獲取評價評分內容。

3.3 數據庫存儲操作

將獲取到的圖書信息存儲到MySQL數據庫表中。新建mysql.py文件,在文件中定義各個應用方法:如連接數據庫、關閉數據庫、數據表的紀錄插入、查詢數據的方法。

3.4 UI可視化界面設計及UI轉Py編程文件

首先,單擊File菜單——Settings,打開的對話框中單擊Tools——External Tools打開的界面中添加擴展工具,主要是QT Designer和PyUIC,它們的主要功能是通過Qt Designer進行圖形可視化設計[3],采用pyUIC插件將可視化圖形界面轉換生成相應的Python 文件,生產的Python文件需要移動到項目的根目錄下, 可以在生成的Python文件中進行代碼功能編寫。

采用NumPy、Pandas、Matplotlib模塊進行計算、處理分析、可視化編程。

NumPy是Python處理數組和矢量運算的庫, 是進行高性能計算和數據分析的基礎,NumPy提供了對數組進行快速運算的標準數學函數。Pandas是Python的一個開源庫,為Python提供了高性能、簡單易用的數據結構和數據分析工具。Pandas提供了方便的類似表格統計操作和SQL操作等操作,使得數據處理工作更加便捷。Matplotlib是利用Python進行數據分析的一個重要的可視化工具,繪制多種高質量的2D、3D圖形。

在生成的Python文件中,我們主要完成了10個可視化界面的設計,以及13個Python文件的代碼編寫。完成本項目數據服務功能。

4 結束語

本文中的項目對網絡爬蟲技術、數據庫存儲技術、數據分析技術及可視化技術進行了流程和實踐總結,從數據分析出發,依靠技術工具,以決策優化和一定的數據服務為目的,洞察數據背后的規律,為商業創造更大的數據獲取、分析、可視化等一系列技術思路。

猜你喜歡
可視化數據庫功能
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
關于非首都功能疏解的幾點思考
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 国产三级视频网站| 国产福利微拍精品一区二区| 免费A∨中文乱码专区| 精品无码视频在线观看| 免费在线成人网| 亚洲天堂视频在线观看免费| 精品久久高清| 视频二区欧美| 国产美女视频黄a视频全免费网站| 激情综合婷婷丁香五月尤物 | 无码一区中文字幕| 自慰网址在线观看| 97国产在线观看| 日a本亚洲中文在线观看| 亚洲精品天堂在线观看| 99这里只有精品在线| 91无码网站| 国产伦精品一区二区三区视频优播 | 97在线观看视频免费| 9丨情侣偷在线精品国产| 国产成人禁片在线观看| 99久久无色码中文字幕| 精品無碼一區在線觀看 | 欧美日韩国产系列在线观看| 91欧美亚洲国产五月天| 成人国产免费| 久久人人妻人人爽人人卡片av| 精品国产自在在线在线观看| 免费观看国产小粉嫩喷水| 亚洲熟女中文字幕男人总站| 日本在线视频免费| 中文天堂在线视频| 2022国产91精品久久久久久| 精品视频第一页| 91麻豆精品国产高清在线| 国产激爽爽爽大片在线观看| 婷婷五月在线| 亚洲成人网在线观看| 伊人五月丁香综合AⅤ| 91色国产在线| 美女无遮挡免费视频网站| 国产成人精品三级| 91精品日韩人妻无码久久| 亚洲天堂精品在线| 在线毛片免费| 最新无码专区超级碰碰碰| 国产欧美日韩va| 亚洲色图欧美激情| 亚洲精品麻豆| 午夜福利在线观看入口| 日韩欧美综合在线制服| 久久人搡人人玩人妻精品一| 精品少妇人妻无码久久| 欧美一区精品| 亚洲综合国产一区二区三区| 国产精品无码翘臀在线看纯欲| 蜜桃视频一区二区| 久久香蕉欧美精品| 国产精品一区二区国产主播| 日本黄色a视频| 亚洲一区二区无码视频| 精品三级在线| 国产成人8x视频一区二区| 青草视频久久| 亚洲国产欧美中日韩成人综合视频| 欧美成人精品一区二区| AⅤ色综合久久天堂AV色综合| 国产精品.com| 欧美www在线观看| 2021最新国产精品网站| 91麻豆久久久| 久久不卡精品| 国产一级裸网站| 国产精品亚洲一区二区三区z | 日日噜噜夜夜狠狠视频| 色噜噜久久| 最新精品久久精品| 国产亚洲高清在线精品99| 狠狠色综合网| 色悠久久综合| 国产在线小视频| 自拍欧美亚洲|