國網安徽省電力有限公司 李傳昌
機器人流程自動化(RPA),是一套通過模擬人工操作進行自動流程執行處理的軟件。RPA可以代替辦公人員操作電腦和軟件,自動完成各類軟件系統的工作和業務處理,準確高效地實現業務流程自動化,將辦公人員從每日的重復工作中解放出來,提高生產效率,切實減少基層負擔,從而讓管理更有體系,進一步提升管理效率,激發員工創新活力。
近年來,安徽公司積極探索“大云物移智”等信息技術,結合實際業務,創新開發了一批行之有效的信息化應用成果,有效助力現場精準管控,服務電網工程建設管理。隨著“三集五大”體系建設的不斷深化,公司基層員工的負擔不斷加大,亟需建設一個機器人流程自動化系統以將辦公人員從每日的重復工作中解放出來,提高生產效率。
一套完整的RPA主要包括四大功能模塊,分別為管理控制臺(WEB管理端)、應用編輯器(面向應用開發者的客戶端)、人工智能(AI服務端)和機器人(面向用戶的客戶端)模塊。各模塊之間的功能邏輯為:應用開發者通過應用編輯器開發、發布應用到WEB管理端;用戶先在自己個人PC上安裝機器人模塊并運行軟件,再從WEB管理端以新建定時任務的方式實現定時調度機器人來運行指定的應用,從而實現流程自動化;若需要人工智能(AI)進行識別處理,由應用開發者在必要處調用AI服務端接口,實現結合AI識別的流程自動化。
應用中心:管理通過編輯器發布的應用;
任務管理:通過新建任務實現定時調度機器人來執行發布的應用;
機器人監控:管理機器人客戶端信息,包括機器人客戶端標識、在線狀態等
日志管理:管理操作審計日志及定時任務調度機器人執行結果日志。
資產管理:對企業賬號密碼等敏感數據進行變量化的設置。通過在控制臺設置為變量,方便流程開發時調用,同時滿足安保對于賬號等敏感信息的要求。變量的存儲都是采用密文,只有具備權限的賬號才能查看。
系統管理:提供組織機構、成員、角色權限等管理功能。
通過應用編輯器可快速開發自動化應用,以拖拽可視化組件的方式實現流程的自動化辦理功能,整個過程零編碼。
組件包括:
網頁:包括打開、跳轉、滾動頁面、關閉網頁、獲取文本、獲取網頁元素的HTML代碼、上傳文件、下載文件和OCR方式點擊等功能;
窗口:包括獲取窗口、激活窗口、關閉窗口、隱藏窗口、最大化窗口、最小化窗口、OCR方式點擊等功能;
鼠標鍵盤:支持輸入熱鍵功能;
EXCEL組件:包括啟動保存、關閉、創建、重命名Sheet、獲取單元格值、獲取區域值、獲取行值、獲取列值和查找單元格等功能;
循環和判斷組件:包括按照次數循環、條件循環、循環相似控件、循環列表內容、繼續循環、退出循環、條件分支、捕獲異常和重試等功能;
流程組件:支持獲取工程參數信息;
編程組件:包括設置變量值、讀取資產變量值、延遲執行、調用自定義腳本、記錄日志等功能;
數據處理組件:包括字符串操作、數學運算、列表操作、字典操作等功能;
系統組件:包括運行程序、關閉進程、設置剪貼板內容、獲取剪貼板內容、獲取當前時間和日期等功能。
通過在編輯器中拖拽組件,以可視化的方式編輯組件實現自動化功能,應用開發即為可視化的自動化流程開發,整個過程零編碼。
對開發的應用進行調試,可快速觀看應用執行全過程是否存在異常,如存在則拋出異常,便于開發者針對異常進行修改。
應用開發調試通過后,發布應用到管理控制臺,供用戶機器人客戶端調用來完成用戶的自動化流程工作。
(1)OCR能力模塊
OCR能力模塊提供方便結合具體業務調用的卡證識別功能,包括:
文字識別;
文字發票識別;
機動車統一發票識別;
火車票識別;
身份證識別;
營業執照識別;
房產證識別;
銀行卡識別;
駕駛證識別;
行駛證識別;
護照識別;
不動產證識別;
食品經營許可證識別;
銀行開戶許可證識別;
表格識別。
(2)人工智能(AI)自學習模塊
當需要對OCR能力模塊中沒有提供的場景進行圖片文字識別時,可通過簡單的頁面操作,快速訓練專用的圖片文字識別(OCR)功能。
(3)模板配置
通過對一張具有代表性的圖片進行key/value的規則屬性配置,形成初始化的模板;作為配置的圖片最好選擇清晰、無遮擋、無
反光的圖片更有利于模板的配置。(4)數據集管理
上傳至少30張同類圖片作為訓練集,至少10張圖片進行測試集。上傳圖片后,分別對上傳的圖片進行標注,通過標注訓練圖集上的value值,形成一批可用的訓練數據。這些已標注好的數據會按比例分成訓練數據和評測數據。
(5)模板訓練
基于深度學習算法進行的機器自學習過程,系統會根據標注數據自動強化模板的識別率,提高模板的容錯性。訓練集的數據越多對模板訓練的效果就越佳。訓練是個反復的過程,可以分多個批次進行訓練,每個批次建議上傳更多的圖片進行標注以達到自學習的目的。
(6)模板評測與發布
模板評測是用于對經過訓練的模板進行效果評測打分。在每個訓練批次中可實時查看效果評估對比。評測指標分為OCR識別率和KV字段識別率,OCR識別率是文字本身的識別效果,KV字段識別率是指模板在評測過程中所有字段的平均識別結果。通常情況下,KV字段識別率/OCR字段識別率>90%,是較為可用的狀態,用戶也可根據自己的標準進行效果評估。根據評測結果,用戶可以選擇最為理想的訓練版本作為發布版本,并發布上線。發布成功后即可獲得模板ID,在RPA的編輯器中,可通過模板ID進行圖片信息的結構化識別。
(7)NLP
自然語言處理包括分詞、詞性標注、命名實體、情感分析、中心詞提取、智能文本分類、文本信息抽取等。
(8)其它識別
提供將語音識別為文字及提取文字功能。
識別視頻流文件,如施工時現場視頻中的安全帽識別。提供識別結果提取功能。
機器人的主要功能是執行任務,機器人可以執行手動觸發、定時觸發的任務:
人工手動觸發:手動執行開發好的應用程序。在一個企業里,開發人員開發好的應用可以發布到應用中心里,其他人就可以通過機器人去獲取這個應用,通過審批之后就可以運行這個應用,并且支持多人在自己電腦上同時使用,互不影響。
定時自動觸發:定時執行開發好的應用程序。在一個企業里,開發人員開發好的應用可以發布到應用中心里,其他人在控制臺就可以獲取這個應用,通過審批之后設置定時任務去執行這個應用。

圖1 系統總體架構圖
在J2EE技術體系,可采用MVC應用框架,由界面控制器組件、界面操作組件、JSP網頁組件和服務代理單元組成。其中界面的顯示由JSP網頁組件完成,網頁上的具體操作由界面操作組件通過服務代理單元調用業務邏輯層的具體服務來完成,由界面控制器組件負責統一調用不同的界面操作組件、JSP網頁組件,從而完成RPA流程在IDE中的設計工作。
中控層構建于JAVA企業版平臺之上,借助于SG-UAP平臺將表現邏輯、業務邏輯與數據邏輯分離,進行基于構件的開發。SG-UAP工作流平臺,通過流程驅動技術實現了業務流程過程的標準化管理,包括圖形化工具建模、快捷的流程定義、動態的流程重組、靈活流程控制、完善的流程審核以及統一的任務管理等功能。
中控層把流程任務數據下發給執行層,執行層安裝在用戶個人辦公PC上,利用其計算及存儲資源實現指定流程的定時自動化辦理。
總結:通過開展基于RPA的電力業務系統自動化處理系統建設,實現了聯動多個業務系統,自動執行完成工作,自動化地串起一系列操作流程,讓流程再造,并且不會影響現有IT系統的功能與穩定性,相較于傳統的增效方式,RPA能最大程度地平衡效率與成本,且投資回報周期較短。它既不像增加人工那樣效率不高且易出錯,也不像傳統模式開發軟件那樣需要投入較大成本,能夠最大程度地平衡效率與成本。