文/Mario Holl
符合嚴格的監管框架條件并不斷追求更高的藥品質量——這是制藥行業在加工和生產過程中需要嚴苛遵守的特殊要求,以充分確保產品和患者的安全。有些過程尤其如此,如產品裝入注射器、小瓶或安瓿瓶等初級包裝物后的質量控制過程,制藥企業需要識別出每個產品中可能存在的產品缺陷、雜質甚至污染,實現100%的監控。而現在,InspectifAI 公司副總裁Mario Holl 指出,機器學習可以給這些視覺檢測工作帶來巨大飛躍。
質量檢測主要有三種形式:人工完成所有產品的檢測、人在機器幫助下完成產品的半自動檢測以及全部由機器完成的全自動檢測。其中,全自動檢測會設置多個相機來為每個產品拍攝照片,然后再通過軟件實時評估這些照片,由此分揀出有缺陷的產品。
不過這種方法目前還存在技術限制,尤其是在產品無法簡單地被分為“好”或“壞”時,原因是現在的圖像評估依然基于一些傳統方法,如灰度值分析,這種方法有時會增加誤剔率,即“好產品”卻被錯誤剔除掉。結果就是往往需要對這些產品進行第二次的人工比對,以確保真正區分出好產品和壞產品,這一耗時耗力的過程會給制藥企業增添高達數百萬的成本。采用合適的自主學習系統,可以有效避免上述問題的發生。
機器學習系統可以記錄人類的專業知識并將其反映在技術結構中。機器學習可大致分為“監督學習”和“無監督學習”兩種形式,在無監督學習中,無需事先費力地進行分類即可呈現數據集。這種學習系統可以識別模式、群組或類似結構,但不會因學得的內容獲得任何“獎勵”,因此學習過程很難受到影響,因為它的學習純粹基于自己的“觀察”。而在監督學習中,數據集是分類的,即有效數據的相關信息在學習之前就已存在,這些數據可用于學習過程,為學習系統提供正確學習內容的“獎勵”,使學習行為能夠被控制。
因此,“監督學習”為視覺檢測提供了一種可能的解決方案——由檢測專家對圖像進行預分類,系統使用這些圖像來學習,做出決策。對于難以檢測的產品,這種方案的優勢尤其明顯,因為系統事先“學習”了人工檢測專家的評估經驗和知識。
“InspectifAI”系統為自己設定了將高質量神經網絡引入視覺檢測設備的目標,同時考慮了所有的監管框架條件,此外它是“與設備無關”的,即不依賴于特定的檢測設備制造商。不僅如此,這一系統還使用了邊緣計算平臺作為檢測設備和云軟件之間連接的“橋梁”。
為了優化視覺檢測系統,可以先將邊緣設備連接至檢測設備,這使得設備能夠在云環境中系統地獲取和存儲圖像數據,以及實現神經網絡的本地上傳和高效運行。相關圖像數據經過一次性采集后便會由檢測專家在軟件的幫助下進行分類。
完成相關圖像集的分類后,下一步是進行神經網絡的訓練,首先圖像集會被劃分為子集,其次在訓練過程中,訓練數據集會被用來形成節點權重、層數等。模型在這一過程中會學習圖像特征和模式,最終形成神經網絡的決策。
獨立統計的測試數據集為神經網絡展示了未知的圖像,并檢查了它們的分類和映射保真度,這樣人們最終就會得到一個能夠根據正確圖像特征做出正確決策的模型。為了確保這一點,系統除了設定了訓練和測試集的分類參數外,還設定了許多其他參數,它們共同構建了一個高維參數空間。
InspectifAI 的數據專家在系統中還應用了多種技術,包括模型訓練和深入的模型及數據分析技術。憑借這些技術,人們能夠控制模型的“學習”過程,并最終獲得符合制藥行業監管要求的高質量模型。同時模型訓練技術還具有能夠保證質量的作用,如果在模型訓練中出現了錯誤分類的圖像數據,數據專家就會了解由此產生的模型弱點,并可以通過重新分類進行補救。模型只有在分類質量滿足所有要求,并進行版本化后才會上傳至邊緣設備。
通過由檢測專家主動對圖像進行分類,并將這些數據記錄并結合至技術結構中,人類的知識才能“傳授”給檢測設備。將人類的知識與機器學習相結合,可以做出更好的檢測決策、保證更低的誤剔率。
機器學習系統在視覺檢測領域具有巨大的潛力,甚至超出了人們的預估。它的一個巨大優勢是以神經網絡形式“綁定的知識”可以很容易地進行轉移,這使得神經網絡能夠不受機器和場所限制,多次使用,這大幅減少了反復創建模型的工作量。
同時,為特定藥品開發的神經網絡也可用于其他物理性質類似的產品,兩種產品的好/壞定義越相似,效果就越好。只需很少的工作量和圖像就可以通過重復訓練為現有模型提供額外的知識,由此產生的新模型便可以為新產品做出高質量的可靠決策。
簡而言之,機器學習能夠為視覺檢測工作帶來巨大的飛躍,配置工作減少、性能大幅提高以及擴展潛力巨大僅僅只是它在制藥行業視覺質量控制方面的幾個明顯優勢,它的更多潛力還有待人們去挖掘。