彭曉暉 徐志偉


摘要:針對物端計算系統面臨的“昆蟲綱悖論”和“數據過于集中”2大生態問題,從計算系統的角度,討論分析了其在系統架構、應用層協議、資源管理、開發與運行時、計算負載調度5個方面面臨的挑戰。提出了物端控域計算機設計愿景,即將物端計算系統劃分為具有相同或兼容管理策略的控域,并將每個域看作一臺分布式計算機,為其設計物端信息總線架構原型。
關鍵詞:邊緣計算;物端計算;物端控域計算機;體系架構;應用層協議
Abstract: To address the two ecosystem problems of things system: “Paradox of Classis Insecta” and “Centralized Data”, five challenges of things system in perspective of computing system are discussed in this paper. These challenges include system architecture, application protocol, resource management, application development and runtime environment, and computing payload scheduling. Then, the design vision of the physical-zone-of-control computer is put forward, which divides things system into multiple zones of control with same or compatible management policy. The physical information bus architecture prototype which regards every zone as the distributed computer is finally proposed.
Key words: edge computing; things computing; physical zone of control computer; system architecture; application protocol
1 物端系統的背景
1.1 萬物互聯與物端計算系統
信息技術正在進入人機物三元計算的萬物互聯新時代,計算設備正在被賦予了各種具體的形態并融入到物理環境中[1],我們稱這樣的設備為物端設備,例如溫濕度傳感器、攝像頭等。物端設備正以指數級增長的方式連入互聯網,形成物端計算系統,是邊緣計算[2]的重要組成部分。物端系統不斷地從物理世界感知多源異構的數據,傳輸到信息世界進行計算,信息世界數據處理的結果也通過其反饋到物理世界,物端系統是感知和控制數據的出入口,是未來人機物三元計算空間的咽喉要塞。物端計算系統天生位于網絡的邊緣,具有天然的近數據源優勢。將計算遷移至物端系統可以大幅減少網絡帶寬消耗,縮短應用響應延遲和保護用戶數據安全和隱私。
物端計算機的顯著特征是需要與物理世界進行交互,不斷地感知物理世界狀態,并通過反饋控制改變物理世界狀態。例如,空氣凈化器可以根據小于2.5 μm的細顆粒物(PM 2.5)傳感器數據,調整凈化器的凈化強度,直至達到設定的目標。這是人機物三元空間中典型的感知-計算-控制循環,也是未來萬物互聯時代的基本計算模式之一。其中,控制環節可以是系統根據某種策略或算法自動執行,或由用戶根據計算結果選擇控制動作。
在現有的物聯網架構中,由于物端計算機的軟硬件平臺還未完全準備好計算負載遷移至離環境和人更近的物端上,該循環的計算環節通常在云端進行,造成應用的響應延遲和不確定性。人機物三元計算環境中,大量的應用對實時性有較為苛刻的要求。我們在利用亞馬遜的Alex語音控制打開臥室照明燈的實驗中,每次開燈平均耗時3 s以上[3]。如圖1所示,智能音箱采集的語音數據傳輸到位于美國的亞馬遜云計算服務中心進行解析,識別出的開燈命令發送到位于新加坡的設備控制服務器,通過應用程序編程接口(API)打開位于本地的照明設備。由于數據通路過長,云計算模式顯著增加了開燈操作的時延和不確定性。
1.2 物端計算系統的生態問題
物端計算系統面臨的第一個生態問題是數據過于集中。隨著聯網的設備不斷增加,其產生的數據也是呈指數級增長。據國際數據公司(IDC)預測,到2025年,全球數據年產量將達160 ZB,其中75%以上是產生于網絡邊緣和物端設備[4]。近年來人工智能和大數據的發展顯示了用戶數據在下一代信息系統中的重要作用,以至于被譽為信息時代的“新石油”。然而各大設備廠商均將物端設備感知到的用戶數據收集到私有或公有的云計算中心存儲和分析。邊緣計算、霧計算和物端計算等新的計算模式均旨在將云計算中心的負載向下遷移,這種遷移目的之一也是為了解決數據過于集中的問題。萬維網(Web)發明者Tim Breners-Lee在2018年提出了去中心化平臺Solid,以解決數據過于集中帶來的一系列問題。
物端計算系統面臨的另外一大生態問題是昆蟲綱悖論[1],即物端設備的種類像昆蟲一樣繁多,其本質描述的是系統的多樣性和無序性。多樣性體現在應用場景、芯片架構、硬件接口、操作系統、應用軟件、編程模式、通信協議等多個方面。這造成了物端計算機應用開發、部署和運維十分困難,程序員通常需要熟練掌握從硬件選型、軟件開發到通信協議選擇的全棧知識,才能研發出高效、可靠的新產品。無序性表現在系統的架構、設計方法、編程模式等方面。由于缺乏統一的系統架構、設計和編程方法,物端應用變得十分碎片化,設備之間難以協同計算,從而對人機物三元空間人的行為做出適當的反應。
[8] BORMANN C, CASTELLANI A P, SHELBY Z. CoAP: An Application Protocol for Billions of Tiny Internet Nodes [J]. IEEE Internet Computing, 2012, 16(2): 62-67. DOI:10.1109/mic.2012.29
[9] XU Z, CHAO L, PENG X. T-REST: An Open-Enabled Architectural Style for the Internet of Things [J]. IEEE Internet of Things Journal.2019. DOI: 10.1109/JIOT.2018.2875912
[10] HUNKELER U, TRUONG H L, STANFORD-CLARK A. MQTT-S — A Publish/Subscribe Protocol for Wireless Sensor Networks[C]// 2008 3rd International Conference on Communication Systems Software and Middleware and Workshops (COMSWARE '08). India: IEEE, 2008. DOI: 10.1109/COMSWA.2008.4554519
[11] SHELLY Z, BORMANN C. 6LoWPAN: The Wireless Embedded Internet [M]. USA: Wiley, 2009
作者簡介
彭曉暉,日本東京大學博士畢業,中國科學院計算技術研究所副研究員、碩導;現主要從事物端計算系統的編程方法、應用協議與系統架構研究,研究方向為分布式系統、邊緣計算等;主持和參與了數項國家、部委級研究課題;發表論文近20篇。
徐志偉,中國科學院計算技術研究所研究員、博士生導師、學術委員會主任,中國科學院大學教授,CCF會士,曾擔任國家自然科學基金委信息科學部專家咨詢委員會委員,《IEEE TC》《IEEE TSC》等多個國際著名期刊的編委等;主要研究領域為高性能計算機、分布式計算、網格計算與系統軟件,近年來主要從事邊緣計算、海云計算系統的研究,并提出了物端計算方向;曾獲國家杰出青年科學基金、中國科學院科技進步一等獎、國家科學進步二等獎、中國科學院優秀青年科學家獎、中國科學院百人計劃資助、中國科學院杰出科技成就團隊獎等,2007年獲中國計算機學會“王選獎”;發表論文100余篇、專著3部。