文/張映琪吳志軍辛林嶺
決策樹CART算法在廚柜用戶研究中的應用
文/張映琪1吳志軍1辛林嶺2
廚柜行業是我國制造業中的朝陽行業,近幾年來業內的競爭壓力不斷升溫。在以用戶為中心的時代背景下,研發出能滿足用戶期待和需求的產品成為企業的核心競爭力。文章以基于廚柜研發的用戶研究為出發點,應用決策樹理論的CART算法建立用戶研究數據的決策樹模型,并對模型進行分析和解讀,目的在于為廚柜行業的新品研發提供思路和方法。
決策樹 CART 廚柜 用戶研究
廚柜最早出現于20世紀20年代德國為了滿足國內大量的住房需求而建設的標準化公寓中,直到90年代開始由香港流傳到中國大陸,并成為我國制造業中的朝陽行業。雖然廚柜行業在中國正處于上升階段,但是伴隨著廚電、衣柜、家具等行業向廚柜行業的跨界,市場競爭已經愈發激烈。我國工商聯的廚柜專業委員會預測道:隨著廚柜行業本身的日趨成熟,將會有一大批缺乏產品競爭力和不符合標準的廚柜企業間面臨淘汰[1]。開發出優質的產品成為當下廚柜企業的核心競爭力。
廚柜即是廚房中收納各類廚房器具的物理載體,又是承載設計師設計思維的藝術載體,且與人們的日常生活緊密聯系[2]。廚柜產品作為西方舶來的產品,在審美、使用和功能等方面是否符合中國的用戶還有待研究。
根據筆者對國內一些廚柜企業的走訪,目前國內的廚柜企業對新產品開發的依據主要參照:
(1)參加國內/國際各大展會,學習國際優秀廚柜企業開發的新品;
(2)收集國內近兩年室內裝飾行業的設計風格趨勢;
(3)結合銷量數據,對銷量較好的產品進行升級。
其中不乏有部分企業通過問卷、訪談等形式對用戶進行調查,但由于沒有針對該調查形式的系統整理方法,造成用戶調查結果依然無法為廚柜的新品開發提供有效的依據。
在當代以用戶為中心的設計風潮中,挖掘用戶的期待和需求等因素,并將其融入到產品開發中去,正是廚柜新品研發的突破口。為了洞察用戶需求和期望,避免設計師以“自我”為中心;在廚柜產品開發之前應當對用戶進行研究,從數據中挖掘出設計所需要的依據[3]。
對用戶進行研究可依照“因果”關系進行調查因素的編制,即在某種條件下會產生某種結果。此類用戶研究的方式邏輯性較強,有利于研發人員對后期生成的數據進行應用。整個研究過程大致可分為5步:結果因素與影響因素的設置,影響因素中細分屬性的設置,各個因素的數據收集,對所有搜集的的數據進行清洗和挖掘,將挖掘的出的數據進行分析和應用。
決策樹理論是一種被廣泛應用于數據挖掘的一種技術,用于決策樹生成的計算方法有很多種,最常用的有CART、C5.0、QUEST、ID3等。文章以CART算法為例,建立輔助廚柜產品新品開發的用戶研究決策樹模型。
1960年左右,決策樹理論被廣泛的應用到各個領域中,特別是在人工智能、規則提取等方面[4],是一種能將混亂無序的因果關系進行梳理和分類的一種技術[5]。決策樹的最終呈現模式是以“結果”為基點,依照影響因素的信息純度進行分裂開叉的樹狀圖。
在創建決策樹之前應當先把所搜集的有效數據分為訓練集與檢驗集。創建過程可分為建樹和剪枝兩個步驟,其中剪枝又可細分為預剪枝與剪枝兩個步驟:
(1)利用訓練集建立決策樹的初型;
(2)根據前期設立的分支指數的閾值進行預剪枝;
(3)運用檢驗集對決策樹的模型進行測試、剪枝。形成最終的決策樹模型(整個過程如圖1所示)。
CART是分類回歸樹(Classi fi cation and Regression Trees)的簡寫,最早是由Breiman和Friedman 等人于1984年提出的[6]。CART算法是通過計算各個影響因素的Gini Gain指數來建立決策樹,Gini Gain指數最小的因素為最佳分裂點[7]。

圖1:決策樹模型創建過程
由于CART算法是用于建立二叉決策樹的,因此在處理多屬性的影響因素時要將屬性進行合并計算,如:影響因素A共有{a,b,c}三個屬性,那么就會出現三種分組的情況({{a,b},c},{{a,c},b},{{b,c},a}),計算得出這三個組合中Gini指數最低的一組為分叉。Gini指數是計算每個影響因素中的雜質指標,介于0-1之間,指數越大代表該影響因素越不純。公式為:

a代表屬性組合,k代表結果變量,P代表該屬性中結果變量的概率。得出屬性的Gini指數之后,便可以計算出該影響因素的Gini Gain的指數,公式為:

Ni代表該屬性的數量,N代表總數量。影響因素的Gini Gain即是每個屬性概率乘以屬性Gini指數的總和。
調研用戶的形式有很多種,如問卷、訪談、影像等。文章以問卷為數據收集的手段,收集用戶關于“廚房餐廳一體化設計”的影響因素的數據;并通過數據分析軟件—SPSS CLEMENTINE 12中CART算法進行數據的計算處理,生成決策樹;最終對生成的決策樹進行分析和解讀。
筆者通過網絡的方式收集了133份調查問卷,以這份數據為例建立供新產品開發的決策樹模型。133份問卷中男性用戶有63人占47.37%,女性用戶有70人占52.63%,20-25歲的用戶占72.18%。
問卷的“結果”因素是用戶在購買廚柜時是否會將餐廳一同設計,目的在于挖掘支持餐廚一體化設計下影響因素/細分屬性所組成的規則路徑。該問題的影響因素圍繞“風格外觀、使用功能、展現形式”三個方面進行設計,共設置8個影響因素、34個細分屬性(如表1所示)。
SPSS CLEMENTINE 12是市面上常用的數據挖掘軟件,能將復雜的CART計算過程通過簡單的設置后,快速精準的輸出決策樹模型。以結果因素(將廚房與餐廳一體化設計)設置為輸出變量,影響因素設置為輸入變量,開始進行設置:
(1)設置隨機選取75%的數據作為訓練集,剩余25%的數據作為檢驗集;
(2)選擇CART算法,具體設置如下:選擇Gini指數作為建樹依據、最大樹深設置為5、將最優裂變引起的不純度變量的最低值設置為0.0001、勾選“Prune Tree”(節點的分叉無法明確提高樹的精準度時,自動停止該節點的分裂。)最終模型的樹深為5層,共產生了9條規則路徑(其中純度為100%的路徑共6條),生成的決策樹簡化模型如圖2所示(括號中的百分數表示該條規則路徑的純度)。
鑒于問卷設計的核心是挖掘用戶支持廚房與餐廳一體化設計的影響因素,因此從計算生成的9條規則路徑中提取結果為“是”的路徑進行分析。結果為“是”的規則路徑共5條,分別如下:
(1)柜體表面材質滿足(石材化/水泥化/木紋化)處理下;廚柜風格滿足(歐式/中式/現代/工業)風格下;改善(洗滌區/烹飪區/切配區)的體驗;
(2)柜體表面材質滿足(石材化/水泥化/木紋化)處理下;廚柜風格滿足(歐式/中式/現代/工業)風格下;改善吊柜收納的體驗下;將周邊產品(全展示/僅展示器具)下;臺面材料為鋼材;
(3)柜體表面材質滿足(石材化/水泥化/木紋化)處理下;廚柜風格滿足(歐式/中式/現代/工業)風格下;改善吊柜收納的體驗下;將周邊產品(不展示/僅展示小電器);
(4)柜體表面材質滿足(鋼材化/玻璃化/單色化)處理下;廚柜風格滿足(歐式/中式/現代/混搭)風格下;擴展(媒體/親子)功能下;色彩為(暖色系/冷色系/黑白灰);
(5)柜體表面材質滿足(鋼材化/玻璃化/單色化)處理下;廚柜風格滿足(歐式/中式/現代/混搭)風格下;擴展(休閑/聚會)功能。
企業在開發餐廚一體化的廚柜產品時,可以在以上各個規則路徑的每個因素節點上附加成本和收益等預算數據,計算出收益最大的路徑進行開發;或根據品牌的定位來篩選出最適合的規則路徑。

表1:調查問卷內容

圖2:“廚房與餐廳一體化設計”的決策樹模型
人們對廚房的期待和需求也漸漸的隨著飲食文化、生活方式等觀念的改變而改變,單純的改變廚柜產品的外觀是無法開發出打動用戶的新品。廚柜產品是承載復雜的周邊產品、復雜的用戶行為的系統,對復雜系統的研究和探索的方法應該在多學科中的尋找合適的方法。只有通過科學的方法,對復雜的廚柜系統進行深入分析,新品的開發才能跟上需求。
決策樹CART算法除了應用在以用戶調研的數據建立模型之外,還能應用于廚柜產品的競品分析、會展材料整理、入戶設計調查等研究。此外,文章中案例的支撐數據較少,并不能很精準的推出預測結果,重在為廚柜行業新品開發提供參考的思路和方法。
(通訊作者:吳志軍)
[1]吳志軍,肖文波.廚房家具系統的整合設計[J].家具,2014(06):39-43.
[2]張繼娟.整體廚柜門板結構設計的影響因素分析[J].包裝工程,2014(24):42-44+49.
[3]楊舒英,張帆.整體廚柜研發過程中的“設計調研”[J].家具與室內裝飾,2015(10):24-27.
[4]盧東標.基于決策樹的數據挖掘算法研究與應用[D].武漢:武漢理工大學,2008.
[5]劉菲.基于決策樹技術的忠誠客戶挖掘研究[D].阜新:遼寧工程技術大學,2009.
[6]Breiman L,Friedman J H, Olshen R A,et al.Classification and Regression Trees[R].Montery,CA:Wadsworth International Group,1984.
[7]陳云櫻,吳積欽,徐可佳.決策樹中基于基尼指數的屬性分裂方法[J].微機發展,2004(05):66-68.
張映琪(1994-),男,湖南科技大學碩士研究生。主要研究方向為廚房產業整合設計、設計戰略與系統創新等。
作者單位
1.湖南科技大學湖南省中小型機電產品工業設計中心 湖南省湘潭市 411201
2.云南藝術學院民族民間藝術研究所 云南省昆明市 650033
國家自然科學基金項目(51405155);中國博士后科學基金項目(2015M582321);湖南省研究生科研創新項目(CX2017B677)。
吳志軍(1979-),男,湖南科技大學副教授、碩士生導師,博士,湖南大學與廣東工業設計城聯合培養設計學博士后。主要研究方向為設計戰略與系統創新、工業設計等。