




摘要:商用空調中電機的成本占整體成本的比重較大,研發過程中需要對其成本合理性進行重點審視,結合大數據、云計算等新興技術的出現,可以借助現有的歷史數據,為電機成本的評判建立一定分析依據,并分析不同自變量的因素影響,結合電機選型進行綜合分析,本文闡述了大數據相關概念及電機冷/價比(空調冷量/電機成本)構成的主要成分,通過運用SPSS統計軟件及統計學原理,對電機的成本/空調冷量構成建立模型,并結合整體數據分布情況,得出相關分析意見,對性價比評價方法得出一定經驗。
關鍵詞:大數據、商用電機、成本冷/價比、SPSS、多元線性回歸
引言
商用空調中電機屬于“心臟”部分,據內部數據統計,電機占到空調平均成本的30%以上(水冷、多聯、單元等機型),一款電機的成本的性價比,將直接決定整機成本的合理性,而其中如何去評估電機的成本構成,傳統是按照參照電機(原型電機)的歷史數據,通過做對比來實現差價估計,但因受不同廠家工藝、技術方案的差異,往往評估出來的價格,與實際核價(最終定價),存在較大的差異,以此來計算電機的冷/價比(制冷量/成本),則誤差更大。在現今大數據日益發展的今天,我們可以考慮通過大數據基本分析思路,結合統計學中的一些基礎理論,借鑒已有的數據分布,采用大數據分析軟件,來推導出評估電機成本的合理模型。
一、項目研討背景:
①大數據發展趨勢:在互聯網和信息技術的不斷發展的前提下,人們所產生的相關數據也隨之增多。例如微信聊天、網上購物、乘坐公交地鐵、打電話等過程都在不斷的產生很多數據。我國的數據儲存量也在不斷的增長。這些數據主要包含結構化和非結構化兩種類別,數據單位從最開始的 GB 向最終的 ZB 急速增長,已經大大超出了人們目前所能處理的范疇。在這樣巨大的數據庫里面,如何更好的加強數據管理,快速的使用數據以及高效處理數據等問題已經越來越被人們所重視,在這樣的前提下,大數據時代隨之到來了。我國相關計劃顯示,要加強互聯網、大數據、云計算等和現代產業的相結合,從而不斷的推動電子行業、工業互聯網等的健康發展,同時提出了我國在 5 ~ 10 年的時間內,應完成相關的大數據發展和目標實現,隨后并提出了我國大數據的戰略目標[1]。
現階段對于大數據的定義標準并不統一。大數據課程內容顯示:大數據就是一個數據庫,它的容量非常大、類別較多,且關于數據集內容的管理和儲存無法用傳統數據庫工具來完成。它的特點不僅僅是大,還表現為一定的重要性和復雜性。大數據主要具備了以下特點:數據類別較多、處理數據速度較快、數據體量巨大、數據價值密度相對較低等。數據類別較多指的是數據的種類較為豐富,已經不再是之前較為單一的結構化數據,其來源較為豐富;處理數據速度極快指的是在數據量較為龐大的狀況下,還依然能夠保證數據處理的實時性;數據體量巨大主要指的是在現目前的規模較大的數據集中,數據量一般可以達到 10TB 至 1PB 之間;數據價值密度相對較低指的是在對數據聯系不斷的提起過程中,有用數據相對較少,如何通過相應的手段加強算法來完成數據價值的有效提取,已經成為了現目前大數據時代下必須應當解決的難題之一。
②商用空調電機存在現狀:商用空調中電機的主要作用,包括對房間進行換熱循環、室外側冷媒與空氣熱交換、室內新風運送等,可謂商用空調的“心臟”,其重要性不言而喻,而電機的大小選型一般取決商用空調的制冷量,一般冷量越大,所需要的換熱能力越強,對應的電機功率則需要更大,通過分析商用空調的成本構成,當中電機的占比可達30%以上(不同機組電機占比有較大差異,室內機電機成本占比可達60%),行業一般采用整機對應冷量/電機成本的方式(冷/價比),整機冷量是明確的指標,但成本存在變動,如何有效、合理評價一款商用電機的成本,是現今各家電企業都必須面臨的一個難題。
二、本文介紹了對商用電機的數據分析方法。
首先對歷史數據進行必要的數據預處理,采用多元線性回歸分析方法,使用SPSS 軟件對樣本數據進行分析,找出相關系數,總結運行規律,得出了電機沖片、電機功率、電機轉速三個影響因子與電機冷價比的關聯關系,使用殘差分析方法對模型進行了評價,模型的建立方法分為4 個步驟:數據采集、數據預處理、模型學習、輸出結果。將這4 個步驟總結可得出如圖1 所示的流程圖。
三、模型建立的流程:
電機成本構成,在影響因子與電機成本總在一個最優值上下浮動。在找到這一關聯關系的基礎上,可計算出一組給定影響因子對應的電機成本,最佳電機成本是決定整機性價比的前提。多元線性回歸能有效地挖掘出多個自變量與因變量之間的關聯系數,可以對海量的歷史數據進行快速分析。常用的曲線擬合方法是最小二乘法,常見軟件為SPSS。
3.1 數據預處理
利用總結提煉已有電機的冷/價比——沖片——功率——轉速——使用機型等相關因素。但是針對不同機組的電機使用條件,可能會存在某些特殊情形,如:高端機組選用高靜音特制電機、適用于海島地區的高防腐性能電機、高濕環境下應用的高密封防護電機,這些會形成成本的干擾因素,直接影響對數據模型的判斷,這些數據無法正確地反映出這些自變量和因變量的影響關系,對于分析結果影響很大,因此需要對原始數據先進行預處理,對部分極端值進行剔除和篩選,提出非常規應用場合、特殊客戶需求、高端性能工序復雜等非常規電機數據,最后得到處理后的數據樣本。
3.2 模型建立
本文選用的影響因子為:電機沖片、電機功率、電機轉速; 被評估的能耗指標為:整機冷量/電機成本。使用SPSS 軟件進行多元線性回歸,將筆者單位近5年來的電機數據作為輸入進行分析??倲祿l目數為698 條,數據庫格式如下:
通過SPSS軟件對數據源的錄入,并運行“多項Logistic”得出的結果為:
y =-0.008 8 x1 + 0.515 x2 + 0.001 x3
式中:y 表示電機冷/價比;x1表示電機轉速;x2表示電機沖片尺寸;x3表示電機功率。
四、模型評價
對得到的運算結果進行解讀:
1、電機轉速每上升(下降)1轉,冷/價比會相應下降(上升)0.0088,即電機轉速每上升(下降)100轉,則冷/價比相應下降(上升)0.8,此點與電機n=T/P關系一致,即相同涉及扭矩下,轉速與功率成反比,轉速越高(低),功率需求越低(高),冷/價比亦可更低(高);
2、電機沖片每上升(下降)1mm,冷/價比會相應上升(下降)0.515,即沖片越大,電機成本越高,此點符合常規電機開發的認知;
3、電機功率每上升(下降)1W,冷/價比會相應上升(下降)0.001,即電機功率每上升(下降)100W,則冷/價比相應上升(下降)0.1,功率越大,所需電機成本越高,但在經驗較豐富的空調廠商,采用較科學的電機選型方法后,其對應的整機冷量也同步上升,因此冷/價比基本持平(或者說影響較?。?
根據模型分析結果,對模型預測值與實際值的偏差進行計算,計算出R、R 平方、調整后R平方、標準偏斜度錯誤,結果如表1。R 表示復相關系數,R 越大,線性關系越密切。表1 顯示R = 0.743,可認為電機轉速、電機沖片尺寸、電機功率這3 個量與電機冷/價比的關系較為密切。
表2 展示了模型的系數及顯著性檢驗結果,可以發現各個系數( 電機轉速、電機沖片、電機功率的系數) 的顯著性都為0,明顯低于0.05??烧J為模型系數與樣本之間的差異為純機會變異; 之前的假設與真實情況是一致的。
表3 展示了模型的殘差估計結果:在632個正誤差之中,最大值是34.89,中位數是4.46,說明大部分正誤差維持在一個比較小的水平。出現最大值偏差較大,不排除與部分電機選型是非標工況,同樣冷量下需要更大的功率電機,如T3工況、低溫嚴寒工況,需要能效比仍然為一級能效的空調需求;
正誤差的方差為5.12,為一個較小的值;
結合平均值、中位數以及方差可以認為正誤差較小,模型精度較大,同樣道理我們也可以分析負誤差,可以得到負誤差較小,模型精度較大??紤]絕對誤差,發現與正負誤差比較,其中位數無太大變化。模型標準差較小,說明了模型正/負離散程度均較小,模型得出的數據較為穩定。
這一結果證明了整個模型的殘差整體集中在較小的一個區間內,多元線性擬合結果較符合實際情況。
五、結論
基于大數據分析的評估模型(商用電機冷/價比模型)全面地考慮了整機冷量、電機功率、電機沖片、電機轉速影響整機成本、電機成本的多個影響因子,通過預處理數據,多元線性回歸等分析方法,最終結果有助于設計人員更加全面、細致地了解商用空調中電機性價比的評價方法,為進一步提升開發機組的性價比,提供了明確的方向。
參考文獻
[1]梁宵.大數據視角下電商企業精準營銷策略研究[D].鞍山:遼寧科技大學,2018.
作者簡介:吳超,男,1980.4.17,漢族,廣東潮州,本科學士學歷,電氣工程自動化專業,高級工程師,就職于格力電器股份有限公司技術部,現為對外經濟貿易大學統計學院在職人員高級課程研修班學員,從事商用空調電氣研發工作。