999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

集裝箱船舶裝卸客戶滿意度研究

2020-03-16 02:31:56李田田
電子技術與軟件工程 2020年24期
關鍵詞:滿意度作業

李田田

(南京信息工程大學 江蘇省南京市 210044)

1 引言

集裝箱船舶裝卸涉及船方、碼頭、一關三檢、理貨、貨主等多家單位;作業過程中需要岸橋、場橋、拖車、叉車等多種設備;司機、理貨員、關手、調度員、業務員等多工種的配合,裝卸工藝流程較為復雜,客戶滿意度受到諸多因素影響,故有必要對集裝箱船舶裝卸客戶滿意度展開研究,能夠有效改善影響客戶滿意度的關鍵因素,從而改變消費者行為,建立和提高客戶忠誠度,提升企業的競爭力和盈利能力[1]。

2 數據與方法介紹

2.1 數據說明

通過分析簡化,我們選取靠泊時長、等待作業時長、離泊時間、作業時間、在泊時長、船艙板作業、裝載箱量和困難作業箱量作為我們所要研究的影響因素變量[2]。其中靠泊時長=實際靠泊時間-計劃靠泊時間;離泊時間=實際離泊時間-計劃離泊時間。本文分析使用的數據共有381 個樣本量。

2.2 主成分分析

主成分分析是一種設法將原變量重新組合成一組新的互相無關的綜合變量,同時從這些綜合變量中選取較少的幾個綜合變量,盡可能多地反映原變量的信息的統計方法[3]。主要目的是希望能夠提取出較少的幾項綜合性指標,它們互不相關,并且能最大限度地反映出原來較多指標所反映的信息,進而用這較少的幾項綜合性指標來刻畫個體。

其中每個主成分的貢獻率是指每個主成分所提取的信息量在全部信息量中所占的比例。前m 個主成分的貢獻率之和稱為前m 個主成分的累計貢獻率,在實際應用中,只要累計貢獻率大于85%,就可以認為前m 個主成分已綜合了原變量中的大部分信息。

2.3 聚類分析

聚類分析是研究一組多維樣本的分類問題。在分類之前,對類的個數和類的屬性并不清楚,只是希望通過模糊概念(例如樣本間的相似或相互關系的密切程度)對它們加以適當的歸類。聚類是將數據分到不同的類或者簇,要滿足同一個簇中的對象有很大的相似性,而不用的簇間的對象有很大的相異性。

其中K-Means 聚類是一種應用范圍非常廣的聚類方法,其思想是在給定聚類數k 時,通過最小化組內誤差平方和來獲得每個樣本點的分類。首先,隨即確定k 個初始點作為質心,然后將數據集中的每個點分配到一個簇中,具體來講,找到最接近每個點的質心,并將其分配給該質心所對應的簇。之后,每個簇的質心更新為該簇所有點的平均值[4]。

圖1:作業時間箱線圖

圖2:作業時間核密度圖

圖3:在泊時長箱線圖

圖4:在泊時長核密度圖

圖5:艙蓋板作業量核密度圖

圖6:裝卸箱量核密度圖

圖7:等待作業時長核密度圖

圖8:困難作業箱量核密度圖

2.4 決策樹

分類是一種根據輸入數據集建立分類模型的數據挖掘算法,通過一種學習算法來確定分類模型,該模型可以很好地擬合輸入數據中類標號和屬性集之間的聯系。學習算法得到的模型不僅要很好擬合輸入數據,還要能夠正確地預測未知樣本的類標號。決策樹是以樹結構形式來表達的一種重要的預測分析模型。

表1:在泊時長分箱結果

表2:靠泊時長分箱結果

表3:混淆矩陣

決策樹的構造過程不依賴領域知識,它使用屬性選擇度量來選擇將元組最好地劃分成不同的類的屬性。使用決策樹進行決策的過程就是從根節點開始,測試待分類項中相應的特征屬性來選擇輸出分支,從而確定各個特征屬性之間的結構[5]。構造決策樹的關鍵步驟是在某個節點處按照某一特征屬性的不同劃分構造不同的分支,盡可能讓一個分裂子集中待分類項屬于同一類別。決策樹算法主要圍繞兩大核心問題展開:

(1)決策樹的生長問題,即利用訓練樣本集,進行決策樹的建立。

(2)決策樹的剪枝問題,在保證決策精度的前提下,在樹的大小和正確率之間尋找平衡點,使樹的葉子節點最少,葉子節點的深度最小。

3 主要結果

3.1 數據預處理

3.1.1 靠泊時長(DDKB)

靠泊時長的數據分布大都集中在[0,25]區間以內,整體呈現非正態分布,根據數據的特點,對數據進行分箱處理,盡量保證每個箱子分到的數據均勻。采用了左閉右開的方式進行分箱,由于值為0 的數據個數偏多,所以將0 單獨作為一個箱子,分箱的結果如表1 所示。

圖9:聚類結果

圖10:散點圖1

圖11:雙變量核密度圖1

圖12:雙變量核密度圖2

經過分箱以后,將每個區間進行命名,一共分成5 個箱子,可以看成5 個類別,也就是說將在泊時長進行變量轉化,從數值型數據轉化為分類變量,在后續處理中,分別將其記為0,1,2,3,4,方便建模。

3.1.2 作業時間(ZYSJ)

作業時間呈現右偏分布,因為數據有缺失,所以采用中位數的方法對缺失值進行填充。對數據進行填充后,并通過箱線圖(圖1)檢測異常值。

對異常值采取蓋帽法進行處理,由箱線圖可知,大于2000 的值都是異常值,對將大于2000 的值都設為2000。將處理后的數據畫核密度圖(圖2),可以看出呈現正態分布。

圖13:散點圖2

圖14:決策樹

圖15:變量重要性排序

3.1.3 離泊時長(DDLB)

離泊時長全部數據大部分集中于[0,400]區間內。因為離泊時長有缺失值,而且離泊時長服從嚴重的偏態分布,所以不宜使用全部數據的均值或中位數進行填充,故截取數據范圍在[0,400]的范圍,觀察其分布情況,呈現右偏分布,則使用該區間的中位數進行缺失值填充。根據離泊時長數據特點和變量特征,將采用蓋帽法,令大于1700 的數值等于563,再采用分箱的方式,分箱結果如表2 所示。

3.1.4 在泊時長(ZBSC)

作出在泊時長的箱線圖(圖3),發現值大于2200 以上的都是異常點,故采用蓋帽法,將大于2200 的值等于2000,并作出處理過后的在泊時長核密度圖(圖4),發現數據已呈現正態分布。

3.1.5 艙蓋板作業量(HATCHES)和裝卸箱量(XL)

經繪制箱線圖檢驗艙蓋板作業量和裝卸箱量的異常值,發現艙蓋板作業量只有一個異常點,值為95,采用蓋帽法改為48。處理后的數據呈正態分布如圖5 所示。裝卸箱量小于10 和大于900 的數據是異常點,將蓋帽處理后,呈現正態分布如圖6 所示。

3.1.6 等待作業時長(DDZY)、困難作業箱量(DIFF)

等待作業時長呈右偏分布,故對數據進行取對數處理,經處理后的直方圖如圖7,可見呈對稱分布。

從圖8 看出困難作業箱量的分布近似為正態分布。

3.2 實證分析

3.2.1 聚類分析

主成分分析是一種常用于減少大數據集維數的降維方法,通過將高維變量縮減到低維變量,并能通過低維變量代表原數據的大部分信息。減少數據集的變量數量,自然是以犧牲精度為代價的,降維的好處是以略低的精度換取簡便。因為較小的數據集更易于探索和可視化,并且使機器學習算法更容易和更快地分析數據,而不需處理無關變量。針對本文胡數據,通過提取兩個主成分,方差貢獻率達到95%,說明提取出的兩個主成分能夠反映原來變量的大部分信息。

將提取出的兩個主成分用于聚類分析的變量,以第一主成分作為橫坐標,以第二主成分作為縱坐標,得出分類結果如圖9。其中第一個類別有126 個樣本,第二個類別有106 個樣本,第三個類別有149 個樣本。并從聚類的結果來看,分成3 類效果較好,類與類之間界限清晰,存在較大差異。

3.2.2 探索性分析

通過聚類分析得到各個樣本的類別,將樣本類別作為研究的目標變量,分別查看各個影響因素與類別之間的關系。

(1)不同類別下對比。

由圖10 可以看出在不同類別里面,樣本點的分布不同,在類別0 情況下,作業時長基本都是低于1100,在類別1 情況下,作業時長大部分高于1100,而在類別2 里作業時長處在1000 和1500之間。靠泊時長處在區間[10,50)的樣本被分到類別2 的數目較少,處在區間[1,10)的樣本被分到類別0 的數目較少。

(2)單個因素與類別。

雙變量核密度表示如果顏色越深,則頻數多大,故由圖11 和圖12可以看出類別0的情況下,等待作業時長主要集中在[2,3]之內,船艙板作業主要集中在[15,20]之內,裝載箱量主要集中在[300,400]之內,困難作業箱量主要集中在[0,10]和[30,40]之內。同理也可以看出類別1 和類別2 的分布情況。

(3)在泊時長、作業時間和類別。

由散點圖圖13 可以看出在泊時長在[750,1000]區間和作業時間在750 附近的值被分在了類別0,值越大則越容易被分為類別1,處在中間范圍的被分為了類別2。

綜上所述,根據集裝箱船舶裝卸背景及數據特點,將類別按照客戶滿意度進行劃分,一般來說客戶比較傾向于希望在泊時長短,作業時間少,所以類別0 表示客戶的滿意度是不滿意,類別1 表示客戶的滿意度是滿意,則類別2 表示客戶的滿意度是一般。

3.2.3 決策樹

通過按照樣本的60%的比例劃分出訓練集,剩下的40%作為測試集,并根據訓練集訓練出的模型對測試集進行預測,從而判斷模型的建立是否合理。得到混淆矩陣如表3 所示。從混淆矩陣結果看出,模型的建立是合理的,其中只有少數樣本預測的類別與實際類別不符合。

繪制決策樹如圖14 所示。在劃分數據集之間之后信息發生的變化稱為信息增益,知道如何計算信息增益,我們就可以計算每個特征值劃分數據集獲得的信息增益,獲得信息增益最高的特征就是最好的選擇。從決策樹可以看出在泊時長這個因素最為重要,以在泊時長為1338.5 為分界線進行劃分,如果在泊時長小于1338.5,再根據作業時間進行劃分,可見作業時間是繼在泊時長的第二個重要影響因素。如果在泊時長小于1338.5 且作業時間大于940.5,則考慮裝載箱量因素。以此類推,可根據細分具體情況,從而判斷在何種情況下,判斷客戶的滿意度是滿意的。對于客戶不滿意情況,可針對具體情況,進行改進,對于滿意度一般的情況,也可以進行某些方面的提高,從而更充分的讓客戶感受到滿意。

由對特征的重要性進行排序,得到的結果如圖15 所示,可見在泊時長、作業時間和裝載箱量因素為主要影響因素。靠泊時長、離泊時長、船艙版作業、等待作業時長和困難作業箱量等因素對客戶滿意度的影響不大。

4 結論

通過對集裝箱船舶裝卸相關指標進行變量轉換、缺失值填充,異常值檢測等措施以后,將其做主成分分析,通過提取了兩個主成分,累計貢獻率達到95%,能夠充分代表原始數據的大部分信息。利用提取出的主成分將整個樣本進行聚類分析分成三類,其中包括客戶滿意,客戶滿意度一般和客戶不滿意三種。將客戶滿意度作為目標變量、影響因素作為自變量,從而構建決策樹。使用訓練集得出的決策樹用于預測測試集,預測效果良好,并且得出在泊時長、作業時間和裝載箱量因素為主要影響因素。靠泊時長、離泊時長、船艙版作業、等待作業時長和困難作業箱量等因素沒有參與到決策樹建模中,故對客戶滿意度的影響不大。

猜你喜歡
滿意度作業
多感謝,生活滿意度高
工會博覽(2023年3期)2023-04-06 15:52:34
讓人羨慕嫉妒恨的“作業人”
16城市公共服務滿意度排行
小康(2021年7期)2021-03-15 05:29:03
作業聯盟
學生天地(2020年17期)2020-08-25 09:28:54
快來寫作業
淺談如何提升脫貧攻堅滿意度
活力(2019年19期)2020-01-06 07:34:38
明天村里調查滿意度
雜文月刊(2019年15期)2019-09-26 00:53:54
作業
故事大王(2016年7期)2016-09-22 17:30:08
相對收入、收入滿意度與主觀幸福感
醫院滿意度調查
主站蜘蛛池模板: 一级成人欧美一区在线观看| 成人国产免费| 国产第八页| 九九热精品在线视频| 国产主播一区二区三区| 国产v精品成人免费视频71pao| 日本亚洲欧美在线| 欧美成一级| 亚洲国产亚综合在线区| 性视频久久| 国产美女91呻吟求| 国内视频精品| 韩日无码在线不卡| av在线人妻熟妇| 性色一区| 精品三级网站| 欧美一级一级做性视频| 狼友视频国产精品首页| 精品视频福利| 久久精品亚洲专区| 亚洲欧美极品| 免费一级毛片在线观看| 亚洲国产看片基地久久1024| 国产午夜一级毛片| 国产日本视频91| 国产成人亚洲精品蜜芽影院| 国产精品无码AV中文| 亚洲精品777| 国产精品专区第1页| 国产无码高清视频不卡| 在线观看91精品国产剧情免费| 亚洲免费黄色网| 日韩国产一区二区三区无码| 欧美在线伊人| 亚洲国产精品无码AV| 小说区 亚洲 自拍 另类| 久久综合色播五月男人的天堂| 国产精品亚洲综合久久小说| 国产精品页| 91九色最新地址| 亚洲精品天堂自在久久77| 久久不卡国产精品无码| 无码有码中文字幕| 国产成人在线无码免费视频| 亚洲男人的天堂久久香蕉网| 国产99视频在线| 2021国产精品自产拍在线观看| 亚洲三级色| 国产91小视频| 久久婷婷国产综合尤物精品| 亚洲天堂福利视频| 欧美在线视频不卡第一页| 毛片久久网站小视频| 亚洲v日韩v欧美在线观看| 中国精品久久| 亚洲一区二区三区麻豆| 久久永久视频| 亚洲人成影院午夜网站| 三级国产在线观看| 嫩草在线视频| 久青草免费在线视频| 97免费在线观看视频| 亚洲一区二区视频在线观看| 国产麻豆精品手机在线观看| 亚洲一区国色天香| 97精品久久久大香线焦| 男人天堂亚洲天堂| 日韩av高清无码一区二区三区| 国产亚洲美日韩AV中文字幕无码成人 | 国内精品一区二区在线观看| 试看120秒男女啪啪免费| 亚洲日韩高清无码| 亚洲男人的天堂久久精品| 欧美激情伊人| 国产91蝌蚪窝| 欧美成人午夜视频免看| 国产成人免费| 四虎影视永久在线精品| 99久久精品国产自免费| 亚洲精品大秀视频| 国产成人综合亚洲欧洲色就色| 中文无码精品A∨在线观看不卡|