馬振宇 趙娟
(廣州英碼信息科技有限公司,廣東廣州 510663)
穿戴移動式動態心肺監測儀用于心臟疾高危病人的日常居家監測,能夠預防心臟猝死等疾病。目前,醫院普遍使用的心電、心音設備為12導聯動態檢測儀(holter),功能單一,在同一時間段,采集用戶的心電信號或者心音信號,不能綜合監測用戶的多個信號從而集中判斷并發情況。Hotler的功耗比較大,體積也很大,一般只能待機1~2天。因為心臟的部分病癥從檢測到異常到猝死只有10分鐘,必須連續采集心電心音的數據才能及時預警急救。Holter需要把數據傳輸到后臺服務器計算心電監測,計算滯后嚴重,不能滿足心肺的實時計算和全天候即時預警的需求。
在對體積嚴格的穿戴移動式人工智能應用的場合,能效(能效=算力/功耗)是衡量系統的最重要指標。人工智能邊緣計算芯片最重要的資源是算力,最消耗功耗的場景也是在進行人工智能推理計算的時候,僅僅只是芯片本身控制功耗或者開關外圍電路不能有效控制功耗,需要系統的角度對計算資源進行控制才能達到能效最優。
參考文獻[1]介紹了多模態控制的方法,給本文的功耗控制提供了理論基礎和思路啟發。文獻[2]提出的多模態人工智能方法,也啟發了本文的人工智能算法的模態控制。文獻[2]介紹了低功耗AI芯片的體系架構,為功耗控制策略提供了硬件基礎,如圖1所示。

圖1 穿戴式人工智能動態心肺監測儀示意圖Fig.1 Schematic diagram of a wearable artificial intelligence dynamic heart and lung monitor
本設備的硬件框架圖如圖2。主要由多模態信號采集模塊、AI數據處理模塊、電源管理、電池、人機操作接口、無線通信模塊、語音模塊組成。

圖2 硬件框圖Fig.2 Hardware block diagram
(1)多模態信號采集模塊集成了十二導聯心電信號采集,胸阻抗信號采集,同時可以采集心、肺音信號和血氧信號。
(2)數據處理和主控制模塊。數據處理模塊采用FPGA和低功耗SOC芯片相結合的架構;FPGA內部具有數萬個邏輯單元和乘加器,通過選擇合適的架構,設計成并行計算的人工智能數據處理單元及硬件加速器,單芯片處理能效率最高可以達到1TOPS/W以上,計算能力強大,可快速對心肺信號處理和人工智能算法推理,實時對心肺功能的異常預警和干預。
軟件系統架構如圖3所示分為三層,主要有主控制單元和運算單元兩個主要的功能模塊,硬件載體分別是SOC控制單元和SOC計算單元及FPGA芯片:

圖3 人工智能邊緣計算模型流程Fig.3 Artificial intelligence edge computing model process
(1)主控制單元:運行在SOC控制芯片上,基于FreeT TOS之類的輕量級實時嵌入式操作系統做多模態任務控制和計算數據調度,實現系統的功耗和并行運算的最優控制。
(2)運算單元:有兩部分,一部分運行在低功耗SOC的神經網絡模塊里,主要做實時性要求比較高的12導聯ECG計算;另一部分運行在FP G A高性能人工智能運算模塊里,主要運行心、肺音和其他實時性要求不高但數據量比較大的信號的計算。
設備的人工智能邊緣計算模型流程如圖4所示。因為本設備主要是針對心肺信號,系統采用的是輕量化的GRU或者LSTM模型。

圖4 多模態控制框圖Fig.4 Multi-modal control block diagram
表1表示對本實施例的心音監測部分的計算模型在輕量化后對系統的計算資源的評估,因為在本設備的多模態數據輸入中,心音是計算量最大的部分,但是對實時性要求不高,需用用計算能力強的芯片進行計算。而多導聯心電信號的特性是實時性要求高,需要連續計算,但是波形不復雜,采樣頻率低,比較適合低功耗、計算能力一般的多路計算資源進行計算。

表1 邊緣計算模型參數Tab.1 Edge computing model parameters
因為本設備的輸入是多模態的數據輸入源,但是對于心肺監測的應用而言,并不需要每次都啟動所有的計算資源進行計算。比如心房顫動,只需要12導聯的心電波形即可,并不需要心音檢測;而心力衰竭需要心音檢測,但是6個導聯的心電波形即可。因此,我們可以根據應用端的模型的需求,調配計算資源的使用,從而達到優化系統功耗的目的。系統的計算資源就包括芯片級別的SOC和FPGA。再往下一個層級就是兩個芯片內部的各個計算模塊,他們可以分別單獨控制。同時芯片的計算主頻和電壓也是影響功耗的重要因素,所以也是本方法的控制對象。系統的計算資源就包括芯片級別的SOC和FPGA。再往下一個層級就是兩個芯片內部的各個計算模塊,他們可以分別單獨控制。同時芯片的計算主頻和電壓也是影響功耗的重要因素,所以也是本方法的控制對象,如表2所示。

表2 穿戴式設備的計算資源與功耗控制層級Tab.2 Computing resources and power consumption control levels of wearable devices
基于以上分析,這個多模態功耗控制的基本思路是根據系統運行的需求或者狀態采用不同調度策略的控制方式,即根據系統的實際運行狀態,不同運行條件下調度最合適的資源,實現系統計算及時性和功耗消耗結合后的能效最高。
多模態控制框圖如圖5所示,這個方法是采用閉環控制,首先獲取應用模型的計算資源需求和完成時間要求,然后通過多模態控制決策計算,得到最優的計算資源調度。進入到系統后實際運行,同時通過監測系統的實際功耗及計算結果評估。以功率最低為控制指標,將模擬時間和實際時間反饋到多模態控制決策計算進行持續優化,得到最佳完成時間和最佳硬件資源。
表3是不同計算資源對應的運算速度和功耗。結果表明基于同一個應用模型,投入不同的計算資源,產生的能效比不一樣。比如第1行和第2行,投入同樣的8核cluster,主頻從175Mhz降低到15.4Mhz,降低了11.4倍,但是功耗從70mW降低到3.7mW,功耗降低了18.9倍。證明在速度滿足的情況下,通過降低主頻可以實現功耗最低。

表3 不同計算資源對應的運算速度和功耗Tab.3 Computational speed and power consumption corresponding to different computing resources
本文研發的方法通過優化設備里最消耗功耗的人工智能推理計算模塊的使用,能夠使計算資源能效最優,為設計開發出能夠長時間監測心臟狀態并及時預警突發性心臟疾病的設備提供技術基礎,具有很高的科技含量和良好的社會意義。