鐘 宇,董 浩,邢 軍,徐 燕,胡興鋒,趙朋賢,周明珠,禹 艦,楊 進(jìn)
1.新疆維吾爾自治區(qū)煙草質(zhì)量監(jiān)督檢測(cè)站,烏魯木齊經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)天柱山街55 號(hào) 830026
2.國(guó)家煙草質(zhì)量監(jiān)督檢驗(yàn)中心,鄭州高新技術(shù)產(chǎn)業(yè)開(kāi)發(fā)區(qū)翠竹街6 號(hào) 450001
3.中國(guó)科學(xué)院合肥物質(zhì)科學(xué)研究院,合肥市蜀山湖路350 號(hào) 230031
4.中國(guó)科學(xué)技術(shù)大學(xué),合肥市金寨路96 號(hào) 230026
5.重慶中煙工業(yè)有限責(zé)任公司,重慶市南岸區(qū)南坪東路2 號(hào) 400060
以大數(shù)據(jù)、人工智能為代表的新興信息技術(shù)已推動(dòng)科學(xué)研究進(jìn)入第四范式[1-2],同時(shí)深度影響著制造業(yè)的發(fā)展,數(shù)字化轉(zhuǎn)型已成為煙草行業(yè)創(chuàng)新發(fā)展的必然選擇[3],煙草行業(yè)在煙葉種植[4]、市場(chǎng)營(yíng)銷[5]、專賣管理[6]、科技文獻(xiàn)分析[7-8]、科學(xué)數(shù)據(jù)挖掘[9-11]等領(lǐng)域也已開(kāi)展了大數(shù)據(jù)技術(shù)的研究及應(yīng)用。質(zhì)量是企業(yè)賴以生存、贏得市場(chǎng)的根本,是“國(guó)家利益至上、消費(fèi)者利益至上”行業(yè)價(jià)值觀的具體體現(xiàn),是推動(dòng)行業(yè)高質(zhì)量發(fā)展的重要支撐。質(zhì)量大數(shù)據(jù)[12]依托于行業(yè)產(chǎn)品質(zhì)量管理,根植于工業(yè)大數(shù)據(jù),在工業(yè)互聯(lián)網(wǎng)大平臺(tái)上發(fā)揮著關(guān)鍵作用。因此,將大數(shù)據(jù)與質(zhì)量管理進(jìn)行有機(jī)融合,開(kāi)發(fā)出貫穿于企業(yè)、行業(yè)、供應(yīng)鏈的數(shù)字化、智能化質(zhì)量大數(shù)據(jù)體系正成為研究熱點(diǎn)[13-14]。質(zhì)量大數(shù)據(jù)是基于工業(yè)場(chǎng)景提出的概念,屬于工業(yè)大數(shù)據(jù)的一部分,其目的是為產(chǎn)品設(shè)計(jì)、生產(chǎn)、運(yùn)維全生命周期的質(zhì)量分析管理提供數(shù)據(jù)來(lái)源,并在此基礎(chǔ)上開(kāi)發(fā)用于質(zhì)量管理、戰(zhàn)略決策的分析工具,為企業(yè)提升產(chǎn)品的設(shè)計(jì)、制造和運(yùn)行質(zhì)量提供支撐[15-16]。質(zhì)量數(shù)據(jù)在煙草行業(yè)分布廣泛、數(shù)據(jù)資源結(jié)構(gòu)化高、數(shù)據(jù)延續(xù)性好,但由于缺乏系統(tǒng)的收集整理和整合挖掘,質(zhì)量數(shù)據(jù)的利用并不充分,未能實(shí)現(xiàn)全流程的質(zhì)量數(shù)據(jù)分析和建立質(zhì)量數(shù)據(jù)相關(guān)的應(yīng)用體系。為此,基于對(duì)行業(yè)重點(diǎn)工商企業(yè)質(zhì)量檢測(cè)機(jī)構(gòu)的調(diào)研,研究了質(zhì)量數(shù)據(jù)分析利用現(xiàn)狀以及應(yīng)用需求,旨在為構(gòu)建煙草行業(yè)質(zhì)量大數(shù)據(jù)平臺(tái)提供依據(jù)和支撐。
采用問(wèn)卷調(diào)研和現(xiàn)場(chǎng)調(diào)研的方式,對(duì)北京、上海、云南等煙草商業(yè)企業(yè)和河南、湖北、重慶等卷煙工業(yè)企業(yè)進(jìn)行質(zhì)量數(shù)據(jù)主題調(diào)研。調(diào)研內(nèi)容包括質(zhì)量數(shù)據(jù)資源、質(zhì)量數(shù)據(jù)信息化和分析利用現(xiàn)狀、問(wèn)題需求及意見(jiàn)建議等方面。質(zhì)量數(shù)據(jù)資源調(diào)研內(nèi)容涵蓋了卷煙、煙葉、煙用材料等12類產(chǎn)品的產(chǎn)品信息、檢驗(yàn)檢測(cè)結(jié)果和數(shù)據(jù)存儲(chǔ)方式等。現(xiàn)狀調(diào)研內(nèi)容包括實(shí)驗(yàn)室信息系統(tǒng)的應(yīng)用,質(zhì)量數(shù)據(jù)分析及實(shí)際應(yīng)用,質(zhì)量數(shù)據(jù)存儲(chǔ)形式、更新頻率與數(shù)據(jù)規(guī)模等。需求調(diào)研內(nèi)容包括產(chǎn)品生產(chǎn)制造過(guò)程中的趨勢(shì)判斷、預(yù)測(cè)分析、智能決策,產(chǎn)品來(lái)料加工及生產(chǎn)全過(guò)程的質(zhì)量追溯,實(shí)驗(yàn)室的能力水平和資源配置以及對(duì)原輔材料供應(yīng)商的評(píng)價(jià)等。
共收到來(lái)自6 家商業(yè)企業(yè)和6 家工業(yè)企業(yè)的12份調(diào)研結(jié)果。其中,數(shù)據(jù)資源信息946個(gè)特征字段;現(xiàn)狀和需求信息233 條,包含數(shù)據(jù)分析需求144 條、信息化現(xiàn)狀20 條、數(shù)據(jù)分析現(xiàn)狀16 條、存在問(wèn)題28條、意見(jiàn)建議25條。
1.2.1 信息和數(shù)據(jù)現(xiàn)狀
煙草行業(yè)常用的質(zhì)量檢驗(yàn)方式為監(jiān)督檢驗(yàn)和交收檢驗(yàn)。監(jiān)督檢驗(yàn)一般由國(guó)家煙草質(zhì)量監(jiān)督檢驗(yàn)中心、省級(jí)質(zhì)量監(jiān)督檢測(cè)站、工業(yè)企業(yè)質(zhì)量監(jiān)督檢測(cè)站負(fù)責(zé);工業(yè)企業(yè)的卷煙廠負(fù)責(zé)交收檢驗(yàn),并承擔(dān)單項(xiàng)或部分項(xiàng)目的委托檢驗(yàn)。各檢驗(yàn)單位在各業(yè)務(wù)環(huán)節(jié)均建立了相應(yīng)的信息化系統(tǒng),如工業(yè)企業(yè)用于產(chǎn)品質(zhì)量檢測(cè)的MES(Manufacturing Execution System)系統(tǒng),用于原輔材料管理的ERP(Enterprise Resource Planning)系統(tǒng),質(zhì)檢機(jī)構(gòu)用于檢驗(yàn)檢測(cè)的LIMS(Laboratory Information Management System)系統(tǒng)或綜合性辦公平臺(tái)等。如圖1所示,根據(jù)檢驗(yàn)項(xiàng)目和數(shù)據(jù)量,檢驗(yàn)數(shù)據(jù)大體呈金字塔狀分布。

圖1 煙草行業(yè)質(zhì)量數(shù)據(jù)分布Fig.1 Distribution of quality data in tobacco industry
調(diào)研的卷煙、煙葉和煙用材料等12 類產(chǎn)品的檢測(cè)量均較大,各類產(chǎn)品又細(xì)分為一二級(jí)指標(biāo),產(chǎn)品類別與一級(jí)指標(biāo)分布見(jiàn)圖2。其中,煙葉占比最大(19.45%),該類別共有11項(xiàng)一級(jí)指標(biāo)。一級(jí)指標(biāo)下又覆蓋多項(xiàng)二級(jí)指標(biāo),二級(jí)指標(biāo)主要為產(chǎn)品信息與檢測(cè)結(jié)果。12類產(chǎn)品一二級(jí)指標(biāo)數(shù)量分布見(jiàn)表1。

表1 各類產(chǎn)品質(zhì)量信息分布Tab.1 Distribution of quality information of main products in tobacco industry (個(gè))

圖2 產(chǎn)品類別與一級(jí)指標(biāo)分布Fig.2 Distribution of various product categories and first-level indicators
工業(yè)企業(yè)(代號(hào)A1~A6)在各產(chǎn)品類別的質(zhì)量信息覆蓋率見(jiàn)圖3。可見(jiàn),調(diào)研的6 家工業(yè)企業(yè)中有4家在各級(jí)指標(biāo)上均有覆蓋,有2家無(wú)煙用絲束質(zhì)量信息,1家無(wú)濾棒成型紙質(zhì)量信息。各工業(yè)企業(yè)全部指標(biāo)的平均覆蓋率最高為A1(86%),最低為A5(14%),平均值為61%。在各類產(chǎn)品中,卷煙的指標(biāo)覆蓋率最高(74%),其次是條與盒包裝紙(70%)、煙用接裝紙(70%)。指標(biāo)分布和覆蓋率可以體現(xiàn)產(chǎn)品的受關(guān)注程度,由于絲束檢測(cè)已轉(zhuǎn)移至供應(yīng)商或?yàn)V棒生產(chǎn)企業(yè),條與盒包裝紙、煙用接裝紙質(zhì)量是近年的關(guān)注熱點(diǎn),也是出現(xiàn)質(zhì)量問(wèn)題較多的產(chǎn)品。未覆蓋的信息主要是檢測(cè)數(shù)據(jù)以外的指標(biāo),如產(chǎn)品基本信息等,表明企業(yè)更加關(guān)注產(chǎn)品本身的質(zhì)量狀況,在質(zhì)量追溯和數(shù)據(jù)關(guān)聯(lián)分析上關(guān)注程度不夠。

圖3 工業(yè)企業(yè)各指標(biāo)覆蓋率Fig.3 Coverage rate of various indicators for industrial enterprises
商業(yè)企業(yè)質(zhì)檢站(代號(hào)B1~B6)在各產(chǎn)品類別的質(zhì)量信息覆蓋率見(jiàn)圖4。可見(jiàn),各質(zhì)檢站質(zhì)量檢測(cè)情況差異較大,6家質(zhì)檢站全部檢驗(yàn)卷煙產(chǎn)品,煙用膠、煙用三乙酸甘油酯有1家檢測(cè),其余產(chǎn)品有2~3家覆蓋。卷煙的指標(biāo)平均覆蓋率為76%,最高97%,最低66%。各質(zhì)檢站質(zhì)量信息覆蓋率產(chǎn)生的差異主要體現(xiàn)了所屬轄區(qū)監(jiān)督產(chǎn)品特點(diǎn)和業(yè)務(wù)內(nèi)容,如轄區(qū)是否為煙葉產(chǎn)區(qū)等,對(duì)于較少或未開(kāi)展過(guò)煙用材料等項(xiàng)目研究的質(zhì)檢站,其檢測(cè)信息的覆蓋率也較低。

圖4 質(zhì)檢站各指標(biāo)覆蓋率Fig.4 Coverage rate of various indicators for quality supervision and test stations
1.2.2 數(shù)據(jù)分析方式
傳統(tǒng)數(shù)據(jù)分析主要是通過(guò)樣本數(shù)據(jù),基于概率統(tǒng)計(jì)理論進(jìn)行的簡(jiǎn)單統(tǒng)計(jì)、描述性統(tǒng)計(jì)、時(shí)間序列分析、相關(guān)性分析的技術(shù)活動(dòng)。在具體分析場(chǎng)景和目的下,往往會(huì)結(jié)合多種方式展開(kāi)分析。被調(diào)研單位在不同應(yīng)用場(chǎng)景下主要采用的數(shù)據(jù)分析方法見(jiàn)表2。可見(jiàn),各單位主要采用描述性統(tǒng)計(jì)的方式分析各指標(biāo)的構(gòu)成、排序、集中和離散情況,通過(guò)尋找特征和規(guī)律進(jìn)行預(yù)警和生產(chǎn)指標(biāo)控制,以提高產(chǎn)品質(zhì)量水平。在傳統(tǒng)數(shù)據(jù)分析方式下,往往采用人工收集數(shù)據(jù)、軟件分析作圖、描述圖表規(guī)律等方式完成數(shù)據(jù)報(bào)告撰寫(xiě),周期相對(duì)較長(zhǎng)。隨著大數(shù)據(jù)時(shí)代的到來(lái),企業(yè)數(shù)據(jù)呈現(xiàn)數(shù)據(jù)量大、數(shù)據(jù)維度廣、數(shù)據(jù)非結(jié)構(gòu)化強(qiáng)等特點(diǎn),采用傳統(tǒng)數(shù)據(jù)分析方式已無(wú)法滿足當(dāng)前分析需求,需要整合先進(jìn)技術(shù),充分利用云計(jì)算、機(jī)器學(xué)習(xí)和人工智能等手段,提高質(zhì)量數(shù)據(jù)分析的時(shí)效性、真實(shí)性和全面性。

表2 不同應(yīng)用場(chǎng)景下采用的數(shù)據(jù)分析方法Tab.2 Data analysis methods used in different application scenarios
1.2.3 需求及意見(jiàn)建議
現(xiàn)有質(zhì)量數(shù)據(jù)的主要應(yīng)用展示方式是合格判定結(jié)果和質(zhì)量通報(bào),隨著數(shù)據(jù)可視化和大數(shù)據(jù)分析技術(shù)的發(fā)展,數(shù)據(jù)的分析需求呈現(xiàn)定制化和多樣化的特點(diǎn)。調(diào)研結(jié)果中關(guān)于數(shù)據(jù)分析的需求最多,表明行業(yè)對(duì)數(shù)據(jù)分析的需求日益迫切。構(gòu)建質(zhì)量大數(shù)據(jù)系統(tǒng)的目的在于利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)行業(yè)層面的數(shù)據(jù)資源梳理、整合和深入挖掘,滿足行業(yè)各級(jí)機(jī)構(gòu)質(zhì)量方面的決策需求。圖5展示了數(shù)據(jù)分析需求調(diào)研結(jié)果的詞頻分布情況。可見(jiàn),工業(yè)企業(yè)(圖5a)與商業(yè)企業(yè)質(zhì)檢站(圖5b)在質(zhì)量、分析等關(guān)鍵詞上的熱度相對(duì)較高。

圖5 工業(yè)企業(yè)和質(zhì)檢站對(duì)質(zhì)量大數(shù)據(jù)需求的詞頻分布Fig.5 Word frequency distribution of quality big data for industrial enterprises and quality supervision and test stations
將需求進(jìn)行分類梳理、匯總后劃分為11類,結(jié)果見(jiàn)圖6。可見(jiàn),質(zhì)量趨勢(shì)分析和預(yù)測(cè)分析需求居首位,由于工業(yè)企業(yè)產(chǎn)品以及用于制造產(chǎn)品的供應(yīng)商數(shù)量多,各類歷史數(shù)據(jù)積累時(shí)間長(zhǎng),對(duì)歷史數(shù)據(jù)趨勢(shì)進(jìn)行分析與把握,有助于指導(dǎo)產(chǎn)品設(shè)計(jì)、開(kāi)發(fā)、制造和質(zhì)量管理;其次是卷煙產(chǎn)品質(zhì)量分析需求,當(dāng)前企業(yè)及質(zhì)檢機(jī)構(gòu)的數(shù)據(jù)大多是孤立存在的,受分析技術(shù)和手段限制,各企業(yè)無(wú)法全面、準(zhǔn)確、及時(shí)地掌握卷煙產(chǎn)品在全國(guó)市場(chǎng)的質(zhì)量狀況;第三是實(shí)驗(yàn)室能力水平及資源配置分析需求,隨著實(shí)驗(yàn)室資質(zhì)評(píng)審的深入開(kāi)展,各企業(yè)對(duì)實(shí)驗(yàn)室能力水平的關(guān)注逐步提升。

圖6 質(zhì)量大數(shù)據(jù)各類別需求分布Fig.6 Demands for quality big data in various categories
1.2.4 存在問(wèn)題
將存在問(wèn)題分為技術(shù)、數(shù)據(jù)、業(yè)務(wù)3個(gè)維度,各單位在3 個(gè)維度上共涉及40 項(xiàng)問(wèn)題,問(wèn)題項(xiàng)分布見(jiàn)圖7。可見(jiàn),技術(shù)維度的問(wèn)題最多(20項(xiàng),分布在8個(gè)單位),其次是數(shù)據(jù)維度(15項(xiàng),分布在8個(gè)單位),第三是業(yè)務(wù)維度(5項(xiàng),分布在5個(gè)單位)。

圖7 各單位在3個(gè)維度上問(wèn)題項(xiàng)分布Fig.7 Distribution of problem items in three dimensions of each institution
各維度數(shù)據(jù)問(wèn)題的主要表現(xiàn)形式見(jiàn)表3。可見(jiàn),當(dāng)前主要問(wèn)題是數(shù)據(jù)分布分散,普遍存在數(shù)據(jù)孤島化現(xiàn)象。①在企業(yè)層面,表現(xiàn)為信息化系統(tǒng)多且系統(tǒng)間協(xié)同性差等特點(diǎn)。一方面,企業(yè)針對(duì)業(yè)務(wù)場(chǎng)景及需求開(kāi)發(fā)相適應(yīng)的信息化系統(tǒng),隨著業(yè)務(wù)場(chǎng)景及需求變化,信息化系統(tǒng)也逐漸增多。由于缺乏統(tǒng)籌規(guī)劃,企業(yè)內(nèi)部生產(chǎn)、管理、質(zhì)檢等各環(huán)節(jié)積累的大量數(shù)據(jù)無(wú)法暢通流動(dòng),難以為實(shí)現(xiàn)企業(yè)質(zhì)量目標(biāo)提供支持。對(duì)于規(guī)模較大的集團(tuán)化公司,其數(shù)據(jù)分散化現(xiàn)象更為明顯,表現(xiàn)在總公司與所屬子公司、子公司與子公司間存在眾多系統(tǒng),由于系統(tǒng)的運(yùn)行環(huán)境、數(shù)據(jù)類型、存儲(chǔ)方式等存在差異,數(shù)據(jù)難以匯集、交互進(jìn)而形成數(shù)據(jù)屏障,無(wú)法進(jìn)行整體、全面的挖掘和分析。另一方面,針對(duì)同一業(yè)務(wù)目的,基于不同發(fā)展階段的不同需求,企業(yè)開(kāi)發(fā)了多個(gè)版本的信息化系統(tǒng),因新老系統(tǒng)的繼承性、銜接性較差,造成原系統(tǒng)大量歷史數(shù)據(jù)丟失、棄用,浪費(fèi)了有價(jià)值的數(shù)據(jù)資源。②在行業(yè)層面,表現(xiàn)為產(chǎn)業(yè)鏈上各參與單位質(zhì)量數(shù)據(jù)共享性差等特點(diǎn),因缺乏信息資源互通共享平臺(tái),無(wú)法實(shí)現(xiàn)工業(yè)企業(yè)、商業(yè)企業(yè)、供應(yīng)商之間質(zhì)量數(shù)據(jù)的有效整合和共享,難以為行業(yè)管理決策提供服務(wù)。

表3 各維度數(shù)據(jù)問(wèn)題的主要表現(xiàn)形式Tab.3 Primary manifestations of data problems in various dimensions
質(zhì)量大數(shù)據(jù)建設(shè)是一項(xiàng)綜合性系統(tǒng)工程,要注重以產(chǎn)品為核心,實(shí)現(xiàn)行業(yè)內(nèi)上下游企業(yè)、各管理部門的數(shù)據(jù)集成,形成供應(yīng)、生產(chǎn)、營(yíng)銷、市場(chǎng)導(dǎo)向的現(xiàn)代化質(zhì)量數(shù)據(jù)管理模式。各參與單位要在數(shù)據(jù)采集、存儲(chǔ)、傳輸、共享、分析等方面共同發(fā)力,全面、系統(tǒng)地推進(jìn)相關(guān)工作的高質(zhì)量開(kāi)展。
質(zhì)量大數(shù)據(jù)標(biāo)準(zhǔn)體系是平臺(tái)的頂層設(shè)計(jì),工業(yè)、農(nóng)業(yè)等領(lǐng)域大數(shù)據(jù)標(biāo)準(zhǔn)體系已有較大發(fā)展,初步形成了由基礎(chǔ)標(biāo)準(zhǔn)、技術(shù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)、產(chǎn)品/應(yīng)用標(biāo)準(zhǔn)4 部分構(gòu)成的體系框架[17-20]。質(zhì)量大數(shù)據(jù)標(biāo)準(zhǔn)體系的制定過(guò)程要注重把握大數(shù)據(jù)技術(shù)和行業(yè)發(fā)展特點(diǎn),整合和借鑒國(guó)內(nèi)外相關(guān)領(lǐng)域的標(biāo)準(zhǔn)化資源,在業(yè)務(wù)、數(shù)據(jù)、技術(shù)等多個(gè)層面建立、形成包含元數(shù)據(jù)、數(shù)據(jù)規(guī)范、數(shù)據(jù)交易及數(shù)據(jù)共享等內(nèi)容的標(biāo)準(zhǔn)體系,用以指導(dǎo)各數(shù)據(jù)庫(kù)的建設(shè)、各類工具包的應(yīng)用。
質(zhì)量主題數(shù)據(jù)庫(kù)是大數(shù)據(jù)分析的基礎(chǔ),要圍繞業(yè)務(wù)和技術(shù)兩個(gè)層面展開(kāi)建設(shè)。在業(yè)務(wù)層面,要根據(jù)行業(yè)的具體需求和數(shù)據(jù)特點(diǎn),有針對(duì)性地收集各相關(guān)方的數(shù)據(jù)資源,建立主題明確、字段完整、可拓展性強(qiáng)的數(shù)據(jù)庫(kù)。例如,卷煙產(chǎn)品質(zhì)量信息數(shù)據(jù)庫(kù)、煙用材料質(zhì)量信息數(shù)據(jù)庫(kù)、煙葉質(zhì)量監(jiān)控信息數(shù)據(jù)庫(kù)、實(shí)驗(yàn)室能力信息數(shù)據(jù)庫(kù)、材料供應(yīng)商信息數(shù)據(jù)庫(kù)等。在技術(shù)層面,要密切跟蹤大數(shù)據(jù)相關(guān)產(chǎn)業(yè)的發(fā)展,探索適用于行業(yè)的數(shù)據(jù)采集、清洗、存儲(chǔ)等技術(shù)。例如,用于采集數(shù)據(jù)的傳感器及邊緣計(jì)算技術(shù),用于清洗數(shù)據(jù)的大數(shù)據(jù)工具集,用于存儲(chǔ)數(shù)據(jù)的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)庫(kù)等。利用各種數(shù)據(jù)技術(shù)打通數(shù)據(jù)孤島,形成匯聚能力強(qiáng)、彈性強(qiáng)的數(shù)據(jù)湖,為后續(xù)的數(shù)據(jù)分析和利用提供支撐。
數(shù)據(jù)分析是綜合利用數(shù)據(jù)、發(fā)揮數(shù)據(jù)效用的核心環(huán)節(jié),傳統(tǒng)的分析軟件及分析技術(shù)已無(wú)法滿足當(dāng)前大數(shù)據(jù)時(shí)代的分析需求,運(yùn)用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法實(shí)現(xiàn)面向海量靜態(tài)數(shù)據(jù)、實(shí)時(shí)數(shù)據(jù)、時(shí)間序列數(shù)據(jù)、結(jié)構(gòu)/非結(jié)構(gòu)化數(shù)據(jù)的聚類、關(guān)聯(lián)和預(yù)測(cè)分析是當(dāng)前質(zhì)量大數(shù)據(jù)分析技術(shù)的核心。隨著算法領(lǐng)域的不斷發(fā)展、開(kāi)源代碼倉(cāng)庫(kù)的不斷豐富,將先進(jìn)模型應(yīng)用于卷煙質(zhì)量分析已成為可能。要注重?cái)?shù)據(jù)分析庫(kù)的建立,不斷形成并更新數(shù)據(jù)分析模塊,構(gòu)建應(yīng)用于卷煙、煙葉、煙用材料等產(chǎn)品的分析評(píng)價(jià)模型,為行業(yè)持續(xù)提高產(chǎn)品質(zhì)量,實(shí)現(xiàn)高質(zhì)量發(fā)展提供分層級(jí)、定制化、多樣化的質(zhì)量信息服務(wù)和技術(shù)支持。
(1)質(zhì)量缺陷預(yù)警模型。采集并整合傳感器采集的工藝數(shù)據(jù)與實(shí)驗(yàn)室檢驗(yàn)檢測(cè)數(shù)據(jù),對(duì)不同時(shí)間周期、不同批次、不同規(guī)格產(chǎn)品生產(chǎn)過(guò)程中的質(zhì)量參數(shù)進(jìn)行實(shí)時(shí)在線監(jiān)測(cè),分析工藝過(guò)程與缺陷產(chǎn)生的相關(guān)性,對(duì)高風(fēng)險(xiǎn)環(huán)節(jié)予以識(shí)別,不斷降低產(chǎn)品缺陷發(fā)生率,提高產(chǎn)品質(zhì)量。
(2)質(zhì)量分析模型。通過(guò)建立卷煙、煙葉、煙用材料等質(zhì)量主題數(shù)據(jù)庫(kù),匯集企業(yè)內(nèi)、行業(yè)間的產(chǎn)品質(zhì)量數(shù)據(jù),開(kāi)發(fā)橫跨原輔材料、成品、在銷品的質(zhì)量數(shù)據(jù)庫(kù)查詢技術(shù),探索利用機(jī)器學(xué)習(xí)算法、人工智能及深度學(xué)習(xí)算法等先進(jìn)技術(shù),深度挖掘數(shù)據(jù)間的關(guān)聯(lián)性,為產(chǎn)品質(zhì)量分析、預(yù)測(cè)及決策提供服務(wù)。
(3)實(shí)驗(yàn)室能力評(píng)價(jià)模型。建立實(shí)驗(yàn)室能力評(píng)價(jià)數(shù)據(jù)匯集系統(tǒng),開(kāi)發(fā)系列統(tǒng)計(jì)分析模型,對(duì)數(shù)據(jù)進(jìn)行全流程自動(dòng)化、定制化處理,快速發(fā)布實(shí)驗(yàn)室能力評(píng)價(jià)結(jié)果,實(shí)現(xiàn)能力評(píng)價(jià)后續(xù)全流程的數(shù)字化監(jiān)督。
構(gòu)建質(zhì)量大數(shù)據(jù)平臺(tái),促進(jìn)不同主體的數(shù)據(jù)資源建設(shè),支持?jǐn)?shù)據(jù)資源的分級(jí)分類管理,實(shí)現(xiàn)貫穿企業(yè)內(nèi)、行業(yè)間、產(chǎn)業(yè)鏈的質(zhì)量大數(shù)據(jù)協(xié)作、共享機(jī)制。同時(shí)要注重依托煙草科研大數(shù)據(jù)重大專項(xiàng)已研發(fā)的安全態(tài)勢(shì)感知關(guān)鍵技術(shù),為平臺(tái)的數(shù)據(jù)和系統(tǒng)安全提供支持。結(jié)合項(xiàng)目數(shù)據(jù)的來(lái)源、規(guī)模、更新頻率等特點(diǎn)以及系統(tǒng)平臺(tái)的要求,提供支持?jǐn)?shù)據(jù)完整性、保密性以及備份和恢復(fù)等安全功能。
長(zhǎng)期以來(lái),質(zhì)量相關(guān)數(shù)據(jù)分析都是基于分析人員經(jīng)驗(yàn)而開(kāi)展的以描述性分析為主的技術(shù)活動(dòng),這種模式已無(wú)法滿足大數(shù)據(jù)時(shí)代的質(zhì)量管理要求,并且缺乏具有大數(shù)據(jù)技能和專業(yè)領(lǐng)域知識(shí)、經(jīng)驗(yàn)豐富的人才,亟需加強(qiáng)質(zhì)量大數(shù)據(jù)管理復(fù)合型人才培養(yǎng)和鍛煉。開(kāi)展面向質(zhì)量大數(shù)據(jù)的重大專項(xiàng),探索建立針對(duì)質(zhì)量大數(shù)據(jù)人才的培養(yǎng)模式,持續(xù)為質(zhì)量管理和業(yè)務(wù)工作的進(jìn)步注入活力,為質(zhì)量大數(shù)據(jù)發(fā)展賦能。
基于對(duì)行業(yè)重點(diǎn)工商企業(yè)質(zhì)量檢測(cè)機(jī)構(gòu)的調(diào)研,分析了質(zhì)量數(shù)據(jù)分布利用現(xiàn)狀和應(yīng)用需求,梳理了行業(yè)質(zhì)量數(shù)據(jù)面臨的重點(diǎn)問(wèn)題,指出了行業(yè)質(zhì)量大數(shù)據(jù)的發(fā)展方向。結(jié)果表明:①行業(yè)質(zhì)量數(shù)據(jù)分布層級(jí)清晰,數(shù)據(jù)量大,覆蓋率高,能夠滿足大數(shù)據(jù)分析需求。②現(xiàn)有數(shù)據(jù)分析方式較為傳統(tǒng),缺乏多維度、定制化、時(shí)效性強(qiáng)的數(shù)據(jù)分析手段,數(shù)據(jù)分析需求主要集中在卷煙產(chǎn)品的質(zhì)量狀況、質(zhì)量趨勢(shì)和預(yù)測(cè)、實(shí)驗(yàn)室能力水平和資源配置情況等領(lǐng)域。③數(shù)據(jù)分布分散、數(shù)據(jù)孤島化現(xiàn)象普遍存在、信息化系統(tǒng)眾多、各系統(tǒng)間協(xié)同性差等均是亟需解決的問(wèn)題。④構(gòu)建行業(yè)質(zhì)量大數(shù)據(jù)要重點(diǎn)圍繞數(shù)據(jù)標(biāo)準(zhǔn)體系的制定、質(zhì)量數(shù)據(jù)庫(kù)建設(shè)、大數(shù)據(jù)分析技術(shù)的應(yīng)用、數(shù)據(jù)共享及安全以及技術(shù)人才培養(yǎng)等方面開(kāi)展系統(tǒng)性工作。作為一個(gè)新興技術(shù)體系,質(zhì)量大數(shù)據(jù)在建設(shè)時(shí)需要得到行業(yè)內(nèi)各企業(yè)及質(zhì)檢機(jī)構(gòu)的關(guān)注和支持,充分發(fā)揮行業(yè)集中統(tǒng)一管理的優(yōu)勢(shì),注重統(tǒng)籌規(guī)劃、協(xié)同建設(shè)、開(kāi)放共享,為提升行業(yè)整體效益、實(shí)現(xiàn)高質(zhì)量發(fā)展提供支持。