999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

R語言在實驗數據可視化與統計檢驗中的應用

2022-09-02 07:36:00曾祥潘廣東省廣州市白云區景泰小學
中國信息技術教育 2022年17期
關鍵詞:可視化語言實驗

曾祥潘 廣東省廣州市白云區景泰小學

吳俊杰 北京師范大學物理系

孫麗君 山東省淄博第二中學

中小學校在實驗研究中,往往受到各種條件的限制,不允許做大量的實驗觀測,因此能夠取得的實驗數據比較少。通過少量數據推測研究對象的規律,需要進行統計學分析和處理。借助統計軟件可以很便捷地對數據進行統計分析,極大降低數據處理難度和節約分析時間。目前常用的統計軟件可分為以SPSS為代表的商業軟件和以R語言為代表的開源軟件。相對而言,R語言更適合中小學校使用。這是因為R語言除了滿足統計領域的使用,還有非常強大的拓展性,提供了數千個涵蓋了各個領域的開源工具包。同時,學校可借助R語言開展統計、編程或其他領域的教學實踐。另外,R語言及開源工具包都可以免費使用,這有助于研究成果的推廣與延續。

筆者結合實驗實例,敘述了在對照實驗項目中采用R語言進行數據的整理、分析及可視化呈現。這樣有助于中小學師生了解R語言的功能與應用,幫助有需要的研究者迅速掌握R語言,正確地統計分析數據。

● R語言簡介

R語言是一種交互式計算處理環境,用戶可在官網(www.r-project.org)下載安裝。R語言安裝后是在命令行窗口操作,為了方便使用,可安裝R語言的集成開發環境Rstudio。Rstudio可在官網(www.rstudio.com)找到免費版本下載,安裝后界面如圖1所示。

圖1 Rstudio功能界面

Rstudio界面可分為四個功能區。其中程序編輯區用于編寫R語言腳本程序,程序執行后輸出數據和提示信息將在命令控制臺顯示。如果是簡單的操作可直接在控制臺輸入指令,無需編寫獨立程序。數據環境用于呈現導入的數據結構等信息。在使用R語言繪圖時,圖片會在繪圖輸出中顯示出來。

● 數據采集整理

數據采集有很多方式,既可以用人工記錄的傳統方式,也可以通過信息化儀器設備自動采集。

(1)手工記錄。這是傳統方式,用眼看手記把實驗數據抄寫在記錄紙上或直接錄入到電子表格。對于數據多、持續時間長的實驗項目,需要耗費比較多的人力資源,而且持續記錄容易疲勞,從而導致出現較多的錯誤。

(2)數字化實驗(DIS)自動記錄。使用DIS器材開展實驗,可以解決手工記錄容易出錯的問題。但是DIS設備購置經費投入大,不容易普及推廣。部分實驗項目可借助開源硬件傳感器,通過自制實驗器材的方式解決,這需要實驗員做更多的技術準備。

(3)對實驗項目改進。利用人工智能等先進技術改進實驗器材,使其提高使用效率、提升精度等。例如,借助深度學習工具,自動識別儀器讀數等。還可以重構實驗項目,如利用OpenCv計算機視覺識別實驗對象的周長、投影面積,代替手工測量和計算。通過這些方法能夠較便捷地取得實驗數據。

實驗數據獲得后,可保存為CVS、XLS等數據格式,再通過Rstudio菜單File→Import Dataset導入R語言進行分析檢驗。

● 數據可視化

數據可視化是把數據轉成圖形的方式顯示出來,可以讓用戶快速、直觀地分析數據,了解數據的整體狀況。R語言常用的可視化圖形有直方圖、散點圖、箱形圖等。下面,以繪制小番茄重量的頻率分布直方圖為例,了解R語言的繪圖方法。

先在Rstudio導入小番茄重量文件“tomato.xls”,該電子表格第1列“sn”為序號,第2列“weight”是小番茄重量。在命令控制臺輸入以下繪圖指令:

>hist(tomato$weight, freq=F)

其中,“hist”是繪制直方圖函數;“tomato$weight”是數據來源,來自tomato文件的weight列;“freq=F”是指定繪制頻率直方圖,如果改為“freq=T”則是繪制頻數直方圖。繪制的圖像效果如圖2所示。

圖2 小番茄重量分布直方圖

此外,還可以在直方圖上疊加其他圖形。例如,疊加密度曲線,輸入以下指令:

>lines(density(tomato$weight),lw d=2)

在上述指令中,“lines”是畫線函數;“density(tomato$weight)”的作用是把重量數據轉換成密度數據;“lwd=2”是設定線條粗細。繪圖效果如下頁圖3所示。

圖3 直方圖疊加密度曲線

通過觀看圖形可以非常清晰地了解數據的分布情況,也能快速發現是否有奇異數據的存在。頻率分布直方圖也是在后續做數據正態分布檢驗的一個參考。

● 數據檢驗

在數理統計分析中,只能由估計量估計總體的參數,總體參數始終是不可知的,只能通過統計檢驗,由統計量推斷總體參數。一般在統計中先對參數提出假設,然后再根據假設進行數據檢驗。下面,以檢驗櫻桃輪廓特征(果實投影面積及寬高比)差異性為例子介紹檢驗過程。

取得大紅櫻桃、大黃櫻桃各30枚,拍照后用OpenCv獲取每一顆櫻桃的輪廓特征數據。假設顯著性水平a=0.05,問是否可以認定每兩組櫻桃的輪廓有差異?

分析:每一組櫻桃30顆,數量少屬于小樣本;櫻桃樣本是隨機分組,屬于獨立樣本。因此可使用兩獨立樣本t檢驗,其操作流程為:正態性檢驗→方差齊性檢驗→t檢驗。

應用t檢驗的前提條件是數據必須服從正態分布,適用于小樣本正態性檢驗的方法是S-W檢驗。其次是方差齊性檢驗,使用F檢驗。檢驗指令及結果如下表所示。

從檢驗結果可知,兩組數據正態性檢驗p-value值均>0.05,說明符合正態分布;方差齊性檢驗p-value=0.7072>0.05,滿足方差齊。因而可以使用兩獨立樣本t檢驗,檢驗結果p-value=1.133e-07<0.05,說明兩組數據有明顯差異。

數據的正態性決定了后續檢驗方法的選擇,如果數據不服從正態分布,差異性檢驗就不能使用t檢驗,否則將得出錯誤的結論。

● 結語

R語言語法簡單,容易編寫,利用好R語言對于統計分析來說具有重要的現實意義。本文介紹的內容只是R語言龐大功能的一小部分,對R語言感興趣想深入了解的讀者可以通過R語言的書籍等相關資料進一步學習掌握。

兩獨立樣本樣本t檢驗過程

猜你喜歡
可視化語言實驗
記一次有趣的實驗
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
做個怪怪長實驗
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
讓語言描寫搖曳多姿
累積動態分析下的同聲傳譯語言壓縮
NO與NO2相互轉化實驗的改進
主站蜘蛛池模板: 欧美午夜视频在线| 蜜臀AV在线播放| 中文字幕在线看| www.亚洲一区| 在线免费无码视频| 亚洲aⅴ天堂| 欧美午夜视频| 国产粉嫩粉嫩的18在线播放91| 久草视频精品| 99这里只有精品免费视频| 亚洲AⅤ综合在线欧美一区| 在线观看网站国产| 97精品伊人久久大香线蕉| 99热这里只有精品久久免费| 国产精品55夜色66夜色| …亚洲 欧洲 另类 春色| 亚洲黄色成人| 波多野结衣久久精品| 国产成人区在线观看视频| 色亚洲激情综合精品无码视频| 一区二区三区四区日韩| 欧美福利在线观看| 在线看片中文字幕| 欧美精品aⅴ在线视频| 香蕉视频在线观看www| 国内a级毛片| 91在线无码精品秘九色APP | 97视频免费看| 99国产精品免费观看视频| 四虎永久免费地址| 天天综合网站| 亚洲日韩图片专区第1页| 久久综合一个色综合网| 亚洲一区二区无码视频| 欧美人在线一区二区三区| 99er这里只有精品| 国产97视频在线观看| 中文一级毛片| 久久久精品无码一区二区三区| 精品三级网站| 亚洲全网成人资源在线观看| 欧美午夜小视频| 日韩无码视频播放| 无码国内精品人妻少妇蜜桃视频 | 亚洲欧美一区二区三区蜜芽| 一级成人欧美一区在线观看| 亚洲成人一区在线| 不卡无码网| 亚洲va在线∨a天堂va欧美va| 成人亚洲天堂| 欧美精品色视频| 精品一區二區久久久久久久網站| 国产超碰一区二区三区| 青草午夜精品视频在线观看| 制服丝袜一区| 亚洲三级成人| JIZZ亚洲国产| 久久久久人妻精品一区三寸蜜桃| 亚洲欧美自拍一区| 国产第一页屁屁影院| 超碰免费91| 99激情网| 五月综合色婷婷| 视频国产精品丝袜第一页| 亚洲第一国产综合| 欧美成人一级| 成人国产精品一级毛片天堂| 超碰色了色| 国产福利一区二区在线观看| av一区二区三区在线观看| 亚洲伦理一区二区| 国产午夜福利片在线观看| 无码日韩视频| 国产日产欧美精品| 精品小视频在线观看| 国产日本视频91| 福利小视频在线播放| aaa国产一级毛片| 欧美综合区自拍亚洲综合绿色| 无码内射中文字幕岛国片| 亚洲色图在线观看| 久久无码av一区二区三区|