(山東科技大學 山東 青島 266000)
淺談試驗設計與數據處理在生產中的重要性
鄭欣璐李靜吳興旺李赟
(山東科技大學山東青島266000)
作為一門應用性技術學科,試驗設計與數據處理在科學研究和工農業生產中發揮著越來越重要的作用。特別是化工類專業需要通過實驗來觀測和研究最終現象和結果,實現實驗的最優化和最簡化在實際操作中往往起著事半功倍的效果。此時試驗設計與數據處理就顯得尤為重要。
試驗設計與數據處理;化工生產;最佳的試驗方案
試驗設計與數據處理是以概率論和數理統計為理論基礎,經濟、科學地安排試驗的一門應用技術學科。到目前為止,該學科經歷了80多年的研究和實踐,已成為廣大技術人員和科學工作者必備的基礎理論知識[1]。該學科能幫助實驗者以基本的專業知識為基礎,科學地設計試驗方案,并對所得的試驗數據進行分析,以達到縮短試驗周期,在最大程度上優化試驗,達到理想的預期效果的目的,是一種廣泛應用于工農業生產和科學研究過程中的普遍使用的科學計算方法,是產品設計質量管理和科學研究的重要工具。在以實驗為基礎的化工類學科中,試驗設計與數據處理這門技術學科顯得尤為重要。特別是在研究新產品,解決新問題的試驗過程中,未知的工藝因素、操作因素甚至人為因素特別多,需要通過大量的試驗來探索工藝條件。學會使用科學的試驗設計方法設計試驗并對試驗得到的大量數據進行正確的分析和處理可以使試驗次數盡可能少并能在較短時間內達到預期的試驗目的,這樣就能實現試驗的高效率,收獲事半功倍的效果。
一個理想的試驗設計應該要具備以下三個條件:1、試驗的次數要盡可能的少,節省人力物力;2、試驗得到的數據要便于分析和處理;3、最終能獲得預期的結果,使試驗有效。對于設計試驗,首先要明確是單因素試驗還是多因素試驗,單因素試驗是指該試驗中只受到一個因素的影響,而與其它可控或不可控因素無關。常用的單因素試驗設計的方法有黃金分割法、分數法、對分法、交替法等。實驗者可以通過適當的方法優選出試驗的最佳試驗因素水平,并在實驗中檢驗再優化。以黃金分割法為例,兩個試點關于存優范圍的中心對稱,且每次舍去的區間長度與舍去前的區間長度成比例,第一個試點確定在因素范圍的0.618處,后續試點可以用“加兩頭,減中間”來確定。黃金分割法操作簡單實用,是尋找單因素單峰目標函數最佳點的主要方法。
多因素試驗受多種因素的影響,實驗者可采用正交試驗設計、產品三次設計、完全隨機化試驗設計等多種方法科學地安排和分析多因素試驗,從而確定最佳方案。日本著名的統計學家田口玄一在正交試驗中作出重大貢獻,他將正交試驗選擇的水平組合列成表格,即正交表。正交表的使用大大減少了工作量,因而在科學研究中已實現廣泛應用。在正交試驗設計中,實驗者通過明確試驗目的,確定考核指標,確定交互測試中有多少個相互獨立的變量,這映射到表中的因素個數,再次,確定每個變量可以取值的個數的最大數,這映射了表中的水平數,根據這些選擇一個次數最少的、最合適的正交表,把因素和值映射到正交表中,就可以通過最少次試驗以確定科學的試驗方案。
由于試驗中的不確定性,試驗得到的大量數據并不全是有用的,對于化工試驗來說,光是誤差來源就具有多方面性,除去系統儀器誤差,還有人為因素造成的偶然誤差。為了使試驗結果更加可靠,實驗者需要對數據進行一定的判斷和分析,對原始數據的可靠性加以客觀評定。數據分析就是討論如何對這些紛繁復雜的數據進行分析,揭示其中隱含的內在規律、發掘有用的信息,為決策者的正確決策提供理論依據[2]。數據處理的方法主要有:參數估計、回歸分析、假設檢驗和方差分析等。參數估計是根據從總體中抽取的樣本估計總體分布中包含的未知參數的方法,是統計推理的一種基本形式,分為點估計和區間估計兩部分。點估計是根據手中的樣本估計總體分布中所含的未知參數或未知參數的函數,其原理就是構造一個依賴于樣本的量,作為未知參數或未知參數的函數;而區間估計是依賴抽取的樣本,根據一定的正確度和精確度的要求,構造出適當的區間,作為樣本分布的未知參數或參數函數的真值所在范圍的估計。回歸分析是確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法。在很多作圖軟件比如Excel和Origin中都有這種思想和體現,其中最為人熟知的建模技術就是線性回歸,回歸分析使用最佳的擬合直線,在因變量和一個或多個自變量之間建立一種關系,以此衡量變量間的相關程度。
假設檢驗是判斷各種數據處理結果的可靠程度,其基本原理是先對總體的特征作出一種假設,然后通過抽樣研究的統計推理,對此假設應該被拒絕還是被接受作出推理和判斷[3]。通過檢驗,對樣本指標與假設的總體指標之間是否存在差別作出判斷,是否接受該假設。這里必須明確的是,進行檢驗的目的并不是懷疑樣本指標本身是否計算正確,而是為了分析樣本指標與總體指標之間是否存在顯著差異。所以在這個意義上,假設檢驗也稱為顯著性檢驗。是數據處理中常用的一種方法。方差分析是從觀測變量的方差入手,根據各影響因素對考察指標影響的顯著性程度,從而找出最佳的實驗條件或生產條件。通常將正交試驗設計與方差分析有機地結合加以應用,以解決各種實際問題。方差分析包括單因素方差分析和多因素方差分析,其基本思想都是一致的,通過F檢驗判斷某因素對試驗結果影響的顯著性,這在Excel或Origin等計算機繪圖軟件中都有體現。
試驗涉及與數據處理是以概率論、數理統計和專業技術知識及經驗為基礎,經濟、合理地安排試驗,對試驗結果進行科學計算和分析,最終達到以較少的試驗次數、較短的試驗周期、較低的試驗成本,迅速地得到正確的結論和較好的試驗效果[4]。對于化工、化學、制藥、食品與材料等需要實驗和觀測的學科,經常需要通過大量實驗研究最佳的工藝條件或生產配方,不管是從經濟方面還是從生產效益以及效率問題,都需要實驗者能探索出最合適最經濟的實驗條件,以提高生產效益,增強可行性。而試驗設計與數據處理這門技術性學科就很好地幫助解決了這一問題,一個周密而完善的試驗設計能合理地安排各種實驗因素,能嚴格地控制實驗誤差,從而用較少的人力、物力和時間,最大限度地獲得豐富而可靠的試驗結果,試驗設計是實驗過程的依據,也是實驗數據處理的前提,在整個科研工作中起著非常重要的作用,而數據處理作為其不可分割的一部分,使大量繁雜冗余的數據簡單化,科學化,為實驗工作者解決問題,呈現最好的實驗結果。試驗設計與數據處理這門學科與其它以大量數據為支撐的學科相輔相成,在實驗條件探索和結果分析中起到顯著的作用,為生產帶來一定的經濟效益。
[1]李云雁、胡傳榮 試驗設計與數據處理[M].北京:化學工業出版社
[2]梅長林、范金城 數據分析方法[M].北京:高等教育出版社,2006
[3]李福民 論衛生統計學中的假設檢驗 《衛生職業教育》,2003,21(3)
[4]汪中才 高職實訓教學評價體系構建初探[J].科技信息,2009 01:649-650
鄭欣璐(1995-),女,漢族,福建省南平市,本科,山東科技大學,研究方向:應用化學;李靜(1995-),女,漢族,山東省聊城市人,山東科技大學電子通信與物理學院2014級通信工程專業在讀本科生;吳興旺(1997-),男,漢族,山東省單縣,學生,本科,山東科技大學,化學工程與工藝;李赟(1997-),女,漢族,山東省煙臺市,本科,山東科技大學,研究方向:測控技術與儀器。