呂理哲
最近,有一個朋友需要一份外國產品的說明,他把手上僅有的英文版說明貼到谷歌自動翻譯去轉了一下,整整兩頁的技術說明,翻譯成中文之后,居然一個字都不用修改就可以轉給客戶看了。
去年底,Google翻譯算法換成了神經網絡翻譯機器(Nueural Machine Translation,NMT) 取代了原來用的自然語言處理算法(NLP natural Language Processing),翻譯品質幾乎和有經驗的技術編輯做的一樣出色。
翻譯機器采用了人工智能最熱門的“機器學習”技術,讓機器像人一樣學習兩種語言,機器不眠不休而且運算速度又快,很快就能從小學程度進展到專家的水平,機器翻譯的能力進步飛速。
什么是機器學習?就是把事物的處理程序編成電腦可以演算的邏輯,再提供足夠的樣本,讓電腦依照演算法練習并比對答案,就像我們小時候背唐詩,有人背得夠多夠熟,沉浸于大量的詩詞之中,找出詩詞的邏輯,終于可以吟詩作對,做出令人驚艷的作品。
機器學習的速度非常快,晚上教電腦學習,我們把已知的詩詞都輸進去,第二天一早,電腦已經可以寫詩了。即使電腦寫詩不是為了抒發情感,一樣也能感動人,因為他學習的數據來源就是人類情感的泉源。
機器學習就是將“人工智能”植入電腦,電腦可以學習任何人類的工作,只要這個工作的“內容”可以利用“數字”來描繪,電腦都學得會,不論是深奧的圍棋還是簡單的點鈔機。
機器學習不是今天才有的新玩意,只是今天機器學習的方法和環境更有效率而已,各行各業的數字化一直是專業師傅教電腦工程師,工程師教電腦學習的過程。
印刷業是最好的例子,從CDR的文件到印版上的印紋,到控墨臺的墨鍵,到快遞的交貨地點,如果利用電腦來幫忙,一定比人來處理更有效率。這是因為十幾年以來,軟件工程師學會了各個工序的內容,利用數字來描繪印刷工序的屬性,最后轉換成幫忙處理印刷生產和管理的電腦軟件。
印刷流程中幾乎所有工序早已經數字化了,電腦還能學習什么?
只要是還需要人手處理的部分都值得電腦去學習,今天,技術供應商為了幫助印刷廠提升競爭力,都將目標指向了如何節省人力成本。
自動化已經替代了許多人手,有哪些部分需要讓自動化更進一步?
現在的印刷廠聘請了許多PS師傅來處理文件,因為客戶送來的文件不規范,一個文件上面有好幾個版面,必須經過整理才能轉換成一個個與訂單關聯的PDF。如果電腦學會像人一樣能判斷版面的范圍和正反面,自動處理并輸出PDF,就能節省很大一部分人力,這是電腦需要學習的第一項。
電腦已經管理訂單,管理好的訂單被打印成施工單,用來指揮生產流程,電腦需要學習的第二項就是如何教會電腦將施工單的內容,變成指揮印前工序的命令,訂單確認了以后,生產系統就可以自動開始工作了。
還有一個人手無法解決、成本無法控制的是文件轉換中出現錯誤造成的損失,印前流程從設計原稿,匯出PDF小版,小版拼成大版的PDF,經過精煉在RIP上生成CTP版上的印紋,最后上機印刷,以上每一個工序都對文件內容進行了重新組合,再交給下一個工序,PDF文件本身是程序語言,重新組合的過程中偶爾會改變表面上文字或是圖片的屬性,到了下一個工序,版面內容就被改變了。
這種錯誤只能怪電腦,就怕萬一錯誤出現在重要的活件上,損失就無法估計了。由于不同工序采用不同廠商的軟件,要教會電腦不出錯根本不可能,解決的辦法就是教會電腦來審稿,這是電腦需要學習的第三項。在工序之間把不同階段的文件,取出來校對,在CTP制版以前過濾出被改變了的版面。
目前,國內不同的技術供應商正努力于這3個方面,機器學習和人類的學習一樣需要經驗,經驗越多,電腦的執行能力就越強。
今天,高鐵站的自動柜員機可以提供賣票和取票的服務,連進站檢票也都由機器取代了人工,其實,20年前的車站就有了類似的機器,只是今天的機器經驗豐富,就變聰明了,不論是工程師學習改善機器的功能,還是機器自己會去學習,都可能促成智能印刷。
今天,機器學習的新概念成為了人工智能進步的主要動力,如果我們以為人工智能只會發生在特定的領域和印刷行業無關,那就是對技術發展的無知。
目前,印刷管理所追求的,正是教電腦學習整理文件,指揮生產工序和自動審稿,等到應用成熟以后,智能印刷將會向前邁進一大步。endprint