基于聚類分析的墨量預置優化方法

2016-12-21 07:21:05溫興化余皓珉葉霽

數碼世界 2016年12期

關鍵詞：優化

溫興化余皓珉葉霽

杭州電子科技大學信息工程學院

基于聚類分析的墨量預置優化方法

溫興化余皓珉葉霽

杭州電子科技大學信息工程學院

針對印刷墨量預置的不確定性的問題，提出了一種基于聚類分析的墨量預置優化方法，該方法根據當前的印刷生產工況，在樣本數據庫中尋找一個最佳匹配記錄作為優化樣本，該優化樣本相對應的墨量修正參數即為優化的修正參數值。實驗結果表明，該方法能夠根據具體的印刷生產條件，實現墨量精確預置，具有良好的可靠性與實用性。

聚類分析墨量預置優化方法

隨著印前技術的發展，可以通過多種方法生成墨量預置數據，如印版掃描或經RIP生成后的數據文件,由CIP4解釋器解釋生成油墨預置數據等，這些數據可以是標準的CIP3數據，也可以是來自于RIP產生的1-bit tiff數據格式。但一般情況下這樣得到的墨量預置數據沒有考慮印刷用紙、油墨、環境溫度、濕度等環境因素，屬于理想狀態數據，實際印刷操作的放墨值并不能直接采用上述墨量預置數值。因此，實際上級印刷時需要對墨量預置數據進行修正，以保證印刷質量。

墨量預置是由印刷材料、印刷設備、印刷工藝參數、印刷環境條件等許多因素綜合決定的，很難利用數學模型或物理模型等傳統方法對其進行精確的描述。為此，本文提出基于聚類分析的匹配優化算法，建立不同印刷生產情況下印前生成的PPF文件及JDF數據與墨區預置的關系模型，實現對印刷的油墨預置值修正，實現墨量準確預置，節省印刷準備時間，為印刷企業采用數字化生產及管理流程提供保障。

1 設計思想

本文的墨量預置優化算法是基于聚類分析的匹配優化思想，根據當前的印刷生產工況，在樣本數據庫中尋找一個最佳匹配記錄作為優化樣本，該優化樣本相對應的墨量修正參數即為優化的修正參數值。為此需要建立一個能夠實現自修正的優化參數樣本數據庫。

樣本庫的初步建立是根據具體印刷生產條件，通過調整不確定因素（如典型常用紙張類型、油墨類型、潤版液類型、印版類型、印刷機工況等）進行墨量預置實驗，利用密度計檢測印張質量，獲取相應的墨量預置修正參數，從而建立由相應印刷工況和墨量預置修正參數的優化樣本集。上述實驗只選取部分典型印刷生產條件進行，為了提高系統的適應性，該樣本數據庫還需具備學習維護功能，但由此帶來的是龐大的數據量。為此，本文采用聚類分析思想，將印刷樣本數據集分為4類并標定4個聚類中心，在所選印刷生產條件下所屬類中實現參數匹配，從而得到墨量預置的參數優化值。

具體實現步驟如下：

①對印刷生產工況樣本集實施聚類運算，分類工況樣本集；

②計算當前印刷生產工況樣本數據與各類中心的差值，根據差值大小判斷樣本所屬類；

③在當前印刷生產工況樣本所屬類，求取與當前工況樣本歐氏距離最近的一個樣本，若該距離滿足預先設定要求，則確定為優化樣本，根據此樣本對墨量預置參數進行優化修正；否則，進行樣本庫維護。

2 優化樣本數據集的聚類方法

模糊c－均值算法屬于動態聚類法，一般采用下列三步：

①選擇樣本間的相似性度量；②確定聚類質量準則函數；③給定初始分類，用迭代算法找出最優聚類結果。本文采用以歐氏距離作為相似性度量和基于誤差平方和準則的模糊c－均值算法對參數優化樣本集聚類。其聚類過程如圖1所示。

圖1 動態聚類框圖

2.1 相似性測度

本文選用采用歐氏距離作為相似性度量，其定義如下：

設每個個體有m個變量，把一個個體視為m維空間中的一個點，n個個體就是m維空間中的n個點。設x，和x/為兩個樣本，其歐氏距離定義為：

2.2 評判準則函數

準則函數用于評價聚類結果的優劣，本文選用誤差平方和準則作為準則函數。

若Ni是第i類Ri中的樣本數，mi為這些樣本的均值，即：

把Ri中的各樣本x與均值mi間的誤差平方和對所有類相加，可有：

J是誤差平方和聚類準則，它度量了用c個聚類中心ml，m2，…，mc代表的c個樣本子集Rl，R2，…，RC時所產生的總的誤差平方和。對于不同的聚類，J的值當然不同，使J極小的聚類是誤差平方和準則下的最優結果。

2.3 模糊c－均值算法

模糊c－均值算法是以c－均值算法為基礎。

設μji是第j個樣本xj對第i類的隸屬度函數，用隸屬度函數定義聚類損失函數為：

模糊c－均值方法要求每一個樣本屬于各個聚類的隸屬度之和為1，即：b越大，對比度越大。模糊c－均值算法是要求使Jf在條件(5)下的極小值，令Jf對jiμ的偏導數為0，并代入條件(5)，可得必要條件：

模糊c－均值算法就是用迭代方法求解式(6)和式(7)。

采用模糊c－均值算法對優化樣本集聚類，設定聚類數為4類，其步驟如下：

①設定聚類數目c=4，參數b，容許誤差Emax的值，令k=1；

⑤計算誤差，如果e

印刷過程中影響墨區墨量數據調整的因素很多，但影響較大的主要是印刷速度、印刷壓力、紙張平滑度、紙張吸墨性、油墨粘度和供水量。紙張平滑度影響印刷油墨的需求量，紙張平滑度越小，所需要的墨量也就越大。實際印刷過程中，印刷壓力調節時通過改變兩滾筒之間的中心距來實現的，真正能夠充分表達印刷壓力的理想依據是橡皮滾筒包襯的壓縮變形量的大小，即橡皮滾筒包襯的壓縮變形量與其所受的壓力成正比關系。因此設定專家樣本數據庫中的過程變量為：印刷速度V、包襯壓縮量P、紙張平滑度R、紙張吸墨性t、油墨粘度η和供水量S。

用模糊c－均值聚類法將優化樣本集分為4大類，對應上述6個變量求得4個聚類中心，如表1所示。

表1 優化樣本的聚類中心

從而，優化樣本集按相似性測度聚為4類，每一類包含N個樣本：

3 墨量預置參數修正優化

獲得4個聚類中心后，通過定義當前工況參數樣本與類之間的距離，由最短距離法求取與當前工況樣本距離最近的一個優化樣本，從而獲得墨量預置的參數修正優化數值。樣本與類中心的距離為樣本與類之間的距離。具體步驟如下：

3.1 確定工況樣本狀態變量

根據系統輸入的印刷條件，獲取工況樣本的8個狀態變量，包括為:油墨細度、著色力、黏性η，紙張的吸墨性t、表面強度P和表面平滑度R，印版版基砂目，潤版液PH值。

3.2 計算當前工況樣本參數與各類之間的距離，判斷當前工況樣本所屬的類

設xsi為當前工況樣本S的第i個狀態變量，ykj為第k類中心相應的狀態變量，分別計算S與第k類的距離dsk，k＝1，…，4；

3.3 尋找工況最優化樣本

4 試驗與分析

試驗在海德堡單張紙印刷機CD102－4上進行，采用炬光熱敏CTP版，杭州杭華油墨，UPM優光銅版紙和膠版紙，印刷條件如表2所示。

表2 試驗印刷條件

為了驗證墨量預置的效果，設計了如下測試條：一條20cm×lcm的實地，放置在叼口部位，用來測量實地密度。兩條按5%遞增的20級梯尺，放置在圖像兩側，用于測量各級網點增大值、計算相對反差。網點為圓形調幅網點，加網線數為l75LPl。測量工具為愛色麗X-Rite530分光光度計。

如圖2所示為青色油墨進行預設的效果圖，圖中標識了印品印刷合格時的墨鍵開度的真實值與采用本文方法的預設值。

圖2 青色油墨預設效果圖

圖3 相應各個墨區的預置差值

從上述實驗結果可以看出，采用本文的方法進行墨量預置，預置差值基本上都控制在±4左右，如圖3。

5 結論

本文利用模糊c－均值聚類方法對優化樣本集分類，將樣本集按相似性度量劃分為4大類，計算每類的中心，并用最小距離法判斷當前工況樣本所屬的類，并由最短距離法求取與當前工況樣本距離最近的一個優化樣本，從而獲得墨量預置的參數修正優化數值，實現墨量預置數值與實際印刷的墨量值精確匹配。實驗結果表明，該系統能夠根據具體的印刷生產條件，實現墨量精確預置，具有良好的可靠性與實用性。

[1]夏自由,劉武輝.印前數據格式的靈活性和可靠性比較[J].印刷世界,2005(10):pp32～33

[2]馮瑞乾.印刷原理及工藝[M].印刷工業出版社,2005：2

[3]何清.模糊聚類分析理論與應用研究進展[J].模糊系統與數學.1998，12(2): 89-92

[4]Wu KuoLung，Yang Miin-Shen.Alterative c-means clustering algorithms[J]. Pattern Recognition，2002，35(10):2267-2278