999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

視頻云網平臺中智能算法版權管理方法

2023-04-19 18:33:22張歡歡安聰凱趙朗程周安福馬華東
計算機研究與發展 2023年4期
關鍵詞:資源用戶服務

張歡歡 安聰凱 趙朗程 周安福 馬華東 袁 藝 曹 寧

1 (北京郵電大學計算機學院(國家示范性軟件學院)北京 100876)

2 (中電信數智科技有限公司 北京 100035)

(zhanghuanhuan@bupt.edu.cn)

近年來,視頻物聯、視頻會議等新型視頻網業務快速發展,思科發布的《網絡可視化報告》中指出,2022年的視頻流量超過了全球互聯網下行流量的82%,視頻網業務成為了物聯網、移動互聯網最主要的業務類型. 視頻網業務通常需要云端資源與網絡資源共同協作來提升視頻用戶體驗質量,視頻云網融合對視頻用戶體驗質量保障起到了至關重要的作用.然而,視頻網具有用戶設備廣泛互聯、連接量大、交互性強等特點,對云網平臺中的算力資源提出了非常高的管理與計算需求. 特別地,在視頻云網平臺中,涵蓋了大量智能算法,例如實時視頻監控中的智能車輛識別算法、智能人臉識別算法等. 面對大量的、異構的智能算法,如何對其進行有效管理,從而支持應用服務的快速部署是一個重要的科學問題. 然而,傳統的智能算法與云端資源具有綁定規則,不同服務商之間的智能算法缺乏統一的調用機制,導致它們無法快速整合和有效使用. 對于用戶而言,智能算法的部署繁瑣且過于專業化,用戶很難自主完成智能算法與云端資源的裝載以及授權過程;對于算法提供商而言,過于專業化的實現過程導致其算法版權很難得到廣泛推廣和使用,導致算法的商業價值大大降低.

本文提出“算法即服務”理念,建立了新型的“服務—算法—資源”動態互聯服務體系,有望解決視頻云網平臺中算法快速迭代、應用需求動態時變與算法版權固化管理的矛盾. 進一步地,本文的核心目標是將多家智能算法提供商共同組成的算法生態和快速發展的云節點計算生態“軟硬”結合,以更高的效率為終端用戶提供廣泛的“云—邊—端”服務能力.

此外,我們發現支持動態服務互聯的關鍵問題在于快速迭代的人工智能算法需要按量計價的細粒度權限管理,然而,傳統的、面向固定內容的“買斷式”數字版權管理系統已經無法提供有效支持,導致了算法生態與云生態的割裂. 為此,我們提出智能算法版權管理(algorithmic intelligence right management,AIRM)系統. 結合算法版權管理中細粒度、低時延需求等特性,AIRM 針對服務層算法版權管理和資源層計算資源管理,設計了版權資源服務化和流動性算力網絡2 個主要方法,從而支持“共享式”版權管理模式,具體闡述有2 點:

1)版權資源服務化. 設計版權資源按需時域劃分方法,將有限的版權資源在軟件級別擴張為數倍乃至數十倍的細粒度可用服務單元,提高對智能算法版權資源的利用率. 具體來講,對于每個算法版權,AIRM 系統根據用戶鑒權頻率確定其時域服務單元劃分個數,每個算法版權的授權過程由AIRM 系統統一調度. 繼而,AIRM 系統為每個服務單元定義二級服務密鑰,它用于服務單元所屬用戶獲取算法版權的時域授權,從而獲得時域連續的算法服務,進而提高智能算法服務效率.

2)流動性算力網絡設計. 打破單個節點算力資源與版權資源的僵化匹配模型,將廣泛的節點計算資源抽象為算力網絡;與版權服務單元相協調,提高系統的整體服務能力. 它包括2 個主要步驟:首先,根據上層服務需求,設計經驗驅動的算力單元劃分方法;其次,將云端物理資源切分為細粒度的算力單元作為資源調度單位,多個算力單元可以再自由組合和交換,為多個服務單元提供流動性計算能力,從而實現更高的并行計算效率.

我們將智能算法版權服務與算力網絡環境部署在中國電信視頻分析平臺授權管理模塊,系統服務部署在云平臺虛擬化后的虛擬機容器中,實驗平臺由權限認證服務集群、算法存儲服務集群以及邦聯平臺計算資源池3 個組成部分. 實驗結果表明,相比于傳統的版權管理方案,AIRM 系統可以在相同算力資源條件下,將并發服務能力提高19.9 倍. 此外,在相同服務量的情況下,AIRM 系統可將版權響應時間降低18.36%. 針對2 種智能算法組合服務的應用場景,AIRM 可以將組合服務量提升8 倍,證明了其在多種類算法、多任務處理下的有效性能提升.

1 相關工作介紹

新型視頻網業務種類眾多,例如城市安防監控中進行人員識別、道路監控中進行車輛識別與追蹤[1],這些應用的部署離不開視頻云網平臺中智能算法與算力網絡的支撐[2]. 本節將分別從算法版權管理與算力網絡2 個方面介紹相關工作.

1)算法版權管理. 數字版權管理(DRM)是一種保護高價值數字資產并控制其分發和使用的系統,文獻[3]中介紹了傳統DRM 的基本框架,包括內容提供者、內容分發者、交易中介和消費者4 種角色.消費者從內容分發者和交易中介處分別獲取加密內容和秘鑰以實現內容讀取,內容通過非對稱加密以進行保護. 在云服務場景下,DRM 的私鑰僅供一個消費者實例使用,這一設計雖然保護了版權但也導致了算法版權無法在容器間高效流動的問題[4-5]. 近年來,隨著人工智能的發展,研究者開始關注于算法模型的加密方法[6-10]. 文獻[9]通過在神經網絡的標準化層中加入驗證機制,以保證算法僅在擁有權限的情況下可用,另一些工作[7,10]通過配置神經網絡權重以構建數字水印從而達到版權管理的目的. 文獻[3?10]工作提升了DRM 智能算法加密、解密效率,而未關注于算法服務場景下DRM 的系統架構不足,因此無法解決視頻應用中的智能算法種類多、版本迭代快導致的DRM 執行效率低等問題. 而本文提出的AIRM 系統將在實現算法模型加密的基礎上,優化智能算法版權管理架構的執行效率.

2)算力網絡. 算力網絡為網絡視頻應用提供了人工智能算法執行所需的算力資源以及網絡傳輸資源. 文獻[11]提出將算力與網絡資源以機器學習平臺的形式提供服務,其中算法、算力均由云計算運營商提供,并將這種方式命名為“機器學習即服務”(MLaaS).后續工作進一步關注了MLaaS 模式下集群的資源負載時間、空間特征以及資源效率優化方法[12-16],例如通過平臺內GPU 共享與任務作業時長預測可以提升機器學習算法執行過程中的效率[13]. 然而文獻[11?16]工作更關注算法的執行效率而并未考慮算法版權的高效授權過程. 盡管版權保護已被認為是算力網絡中亟待解決的問題[17],除MLaaS 相關工作外,算力網絡中數字版權的認證流程與權限管理方案已有相關研究[18-22],然而這些研究中版權所保護的內容如音視頻[20]、數據庫[22]等往往僅涉及到云環境中的儲存資源相關的版權調用. 而本文的AIRM系統將提供算力網絡調度與智能算法的版權管理的深度耦合架構,從而提升算力網絡的服務能力.

2 設計架構

本文提出了新型的動態互聯服務體系,其核心目標是將多家智能算法提供商組成的算法生態和當前飛速發展的云節點計算生態“軟硬”結合,以更高的效率為端用戶提供廣泛的“云—邊—端”服務能力.進一步來說,動態互聯服務體系從多家智能算法提供商購入一定數量的多種智能算法版權,備份在本系統內部的算法版權存儲器中. 繼而,將算法版權重新轉換為細粒度的服務單元,為其設計二級秘鑰來授權于更多的應用用戶. 同時,我們將廣泛的云節點計算資源構建為高效的流動性算力網絡,由服務單元調用其算力單元完成用戶的服務請求,最終實現“算法即服務”的應用體系.

以視頻物聯中經典應用——城市人員安防——為例,介紹其版權服務系統部署方式與成本開銷. 城市中部署了大量的攝像頭設備來監控道路安全情況,如果為每一個攝像頭都配備算力資源和智能算法版權來實現智能監控,則將面臨巨大的部署成本. 例如,2021 年中國攝像頭已增至5.6 億臺,而單個攝像頭的算法版權費用和支持圖像計算的硬件成本一般在千元級別. 所以,我們希望將眾多的端設備通過互聯服務體系在云端完成應用服務,此種部署方式將極大地降低基建部署成本和降低部署難度,有潛力提高智能算法服務的自適應性和廣泛性.

為實現這一服務體系,本文提出了支持動態互聯的系統架構. 如圖1 所示,該架構實現了算法生態(由多家算法提供商共同構成)和云計算生態(由海量計算資源構成)的動態互聯,進而提供更高效和便捷的智能算法服務. 動態互聯系統架構被設計為3 層架構:應用層、服務層、資源層. 具體來講,應用層提供與用戶直接交互的各種智能算法,它接入和整合了各種算法服務API,向用戶提供可操作的用戶界面;服務層封裝了多樣、異構的音視頻智能應用算法版權,將多種應用的多個智能算法版權在該層實現集中式管理和細粒度調用;資源層實現了由海量云端節點計算資源互聯構成的算力網.

3 算法設計

本文針對服務層算法版權管理和資源層計算資源管理設計了2 個主要方法:

Fig.1 Dynamic interconnection service system of "Algorithm-Service-Resource"圖1 “算法-服務-資源”動態互聯服務體系

1)版權資源服務化. 將有限的版權資源在軟件級別擴張為數倍甚至數十倍的細粒度可用服務單元,提高對智能算法版權資源的利用率.

2)流動性算力網絡. 打破單個節點算力資源與版權資源的僵化匹配模型,將廣泛的節點計算資源抽象為算力網絡,與版權服務單元相協調,提高系統的整體服務能力.

版權資源服務化與流動性算力網絡分別在本服務體系的服務層和資源層實現,后者對前者是透明的,服務單元只需要向下層遞交資源請求即可完成調用,而無需關注底部資源層如何實現算力調度,這樣的分層設計可以提高服務層的算法服務可擴展性.接下來將具體闡述2 個方法的設計原理.

3.1 版權資源服務化

首先,介紹傳統“買斷式”數字版權管理方法(DRM). 用戶從版權提供商購買智能算法版權,并自己組建計算資源進行使用. 這種方式導致算法版權和計算資源高度耦合,只能被單個用戶使用,并且要求用戶有較高的專業技能來完成部署,嚴重降低了算法版權的利用率和可用性. 我們發現,用戶使用算法版權獲取服務主要包括2 個步驟:1)鑒權. 判別用戶是否具有算法版權. 2)計算. 智能算法調用計算資源來完成服務. 重要的是,鑒權事件是一次性發生或者時域間歇性發生的. 直觀來講,版權提供商驗證用戶是否具有算法權限的過程是在時域上離散發生的,并不會一直保持鑒權過程. 這意味著可以使用一個版權為多個用戶時分交替授予服務權限. 基于此發現,本文提出了互聯服務體系的首要設計——版權資源服務化,它將有限版權資源通過時分復用的方式劃分為多個時域,獨立授權服務單元(下文簡稱服務單元),以向更多用戶提供無差別甚至更優的算法服務.

但版權資源服務化的實現卻面臨一個重大挑戰:在現有的版權管理體系下,版權資源與用戶計算資源一對一高度耦合,無法實現版權在多用戶之間的動態流動使用. 為了解決這一難題,我們將多種應用的多個智能算法版權在服務層實現集中式管理,提出智能算法版權管理系統AIRM. AIRM 系統的約束條件包括算法版權服務響應時間上限Tmax、版權數量N、硬件算力資源C,在此約束下,服務單元優化目標S可定義為:

其中,fS(Ai)表示給定的第i個版權Ai的可擴增的服務單元數量,fT(Si)表示某個服務單元的響應時間,fC(S)表示所有服務單元所需的算力資源. 綜上所述,本文所提出的AIRM 系統旨在通過對N個智能算法版權的細粒度管理提高有限版權資源的并發服務能力,在4.2 節深入分析了本文算法用例的服務能力性能增益.

AIRM 還包括版權存儲器和服務單元調度器2 個模塊(如圖2 所示),前者存儲了來自多個算法提供商的算法版權,后者對算法版權的細粒度進行調度.

Fig.2 Design of AIRM module圖2 AIRM 模塊設計

以視頻監控中人臉年齡識別應用為例,將多個人臉年齡識別算法版權邏輯定義為版權集合A={A1,A2,…,An},并存儲在版權存儲器中. 繼而,AIRM通過版權資源服務化技術將A轉換為服務單元集合S,存儲在服務單元調度器. 不同于傳統版權管理系統,AIRM 服務單元不會按照時域獨享算法版權,而是在定期的鑒權時刻動態請求版權資源來獲取算法使用權限. 如圖3 所示,假如一個人臉年齡算法版權在滿足每個用戶始終保持鑒權成功的前提下可以通過時域切分為j個時分復用的服務單元,則S={S1,1,S2,2,…,Si,j},其中Ai為Si=提供鑒權服務,該過程的具體實現方法如算法1 所示.

Fig.3 Cyclic authorization for service units in AIRM圖3 AIRM 的服務單元循環授權

算法1.版權資源按需時域劃分方法.

輸入:智能算法版權集合A={A1,A2,…,An},每個算法版權的鑒權間隔集合T=每個算法服務用戶鑒權時間需求ti,用戶服務狀態vj;

輸出:按需服務單元集合S.

具體來說,AIRM 不直接讓用戶通過算法版權獲取算法應用能力,而是自定義時分密鑰,將每個算法版權拆解成更多的服務單元,設置授權時間片來循環,為更多的用戶提供服務. 考慮到不同算法版權的鑒權間隔要求存在明顯差異,我們提出了版權資源按需時域的劃分方法. 詳細地說,依據每個算法具體的鑒權時間間隔T將版權資源按用戶所要求的鑒權時間需求t定制化切分為T/t個服務單元. 舉例來說,算法版權A1需要在10 s 內為n個用戶循環鑒權,若每個用戶鑒權時間為1 s,則n=10/1=10;算法版權A2需要在5 s 內為m個用戶循環鑒權,若每個用戶鑒權時間為0.25 s,則m=5/0.25=20. 因此,在流程上,對于A中的每個智能算法版權Ai,為其建立服務單元映射集Si,同時獲取用戶要求的鑒權時間間隔按照按需計算的服務單元數量上限逐漸向每個Si中增加服務單元,并將其直接分配給用戶使用. AIRM 也會持續更新S中所有服務單元的服務狀態(已完成服務、正在服務、待激活等),以便用戶釋放的服務單元被及時分配給新用戶使用.

AIRM 對版權資源的時域劃分是動態調整的. 對于不同的算法版權,其切分的版權資源時隙由其用戶端所要求的應用服務授權,間隔進行定制化切分.在這一機制下,每種算法版權可以為用戶提供連續的算法服務,即使出現偶然的版權資源響應超時,AIRM 也會及時將用戶請求切換至新的服務單元來重新響應. 除此之外,切分好的版權授權時隙會定期通過在用戶側收集到的服務日志進行動態更新,更新周期一般為5~7 天,在本文實驗中介紹的人臉屬性識別算法示例的授權時隙分別為40 ms.

對于每個算法版權,AIRM 根據用戶鑒權頻率確定其時域服務單元劃分個數,每個算法版權的授權過程由AIRM 平臺統一調度. 繼而,AIRM 為每個服務單元定義二級服務密鑰,它用于服務單元所屬用戶獲取算法版權的時分授權,從而獲得時域連續的算法服務. 除此之外,由于用戶本身網絡環境的差異,其對算法應用的調用頻率存在差異,所以算法版權的鑒權時間差存在一定浮動. 集中式的版權資源服務化管理方式可以協調多個算法版權在廣泛的用戶中按需流動,而不是簡單地將一個版權時域分發給固定的j個用戶. 這也是本文提出的“共享式”AIRM智能版權管理系統與傳統“買斷式”DRM 系統的本質區別. 因此,本文對智能算法資源實現了更細粒度的服務級調度而非傳統DRM 低效的版權級調度.

隨著邊緣云計算技術的快速發展,視頻數據的云端集中式處理已逐漸成為一種流行的、輕便的解決方案. 一方面,新興的視頻/圖像采集器有較強的壓縮和抽幀能力,所產生的數據流量較小甚至不足1 Mbps,不會對網絡產生較大壓力;另一方面,本文所提出的AIRM 系統只會在云端處理音視頻數據,處理結果會以HTTP 消息進行通信,數據量小不會對網絡傳輸帶來額外壓力.

3.2 流動性算力網絡

3.1 節所介紹的基于版權資源服務化的AIRM 系統在服務層實現了有限數量版權的時域服務化切分,以提高多用戶并行服務能力,但是此過程要求更靈活的服務計算資源調度技術. 因此,我們為動態互聯服務體系的資源層設計了基于流動性結構的算力網絡. 現有的彈性資源調度方案只是單純的資源層,對物理傳輸、計算資源的彈性分配缺乏與上層應用版權服務的深度結合. 與其不同的是,AIRM 通過細粒度的物理資源虛擬化技術將云端物理資源細粒度切分并動態映射到版權服務單元以獲取算力支持. 特別地,本文的流動性算力網絡體現在多個資源層算力單元在多個應用層服務單元之間動態映射,進而提供動態算力支撐,而不是簡單的算力單元與服務單元一對一強綁定,這有利于在用戶量較小時也可以利用閑置的算力資源,以提高用戶服務響應時間.更近一步,本文所提出的AIRM 系統還支持跨平臺、跨域的流動,不會局限于局域網絡與單一平臺.

流動性算力網絡包含2 個關鍵設計:

1)根據上層服務單元需求(服務需求本質上等同于傳統管理系統中的用戶業務需求),將一定額度的云端算力分配給服務單元,并在完成服務后及時回收;

2)將云端物理資源切分為細粒度的算力單元作為資源調度單位,多個算力單元可以再自由組合和交換,為多個服務單元提供流動性計算能力,實現更好的并行計算效率.

為實現流動性算力網絡的構建,需要解決2 個科學問題:

1)如何劃分算力單元,并將物理資源進行邏輯劃分成可以通過容器技術實現的問題. 劃分后的算力單元代表了系統服務層向資源層的最小計算資源調度粒度. 一般來說,更小的算力單元代表更細的計算資源粒度,造成的計算資源浪費也相對更小. 但是,更小的算力單元也需要更復雜的算力網絡結構,會增大算力調度的時間開銷.

2)如何實現多個算力單元在多個服務之間的并行流動的問題. 算法服務的完成需要多項物理資源,比如磁盤I/O、GPU 浮點運算等都具有并行服務能力. 但是,如果算力單元和用戶服務一對一耦合,則必然導致對單個算力單元內置資源的串行運行,這將導致較高的資源浪費問題,也會消耗服務提供商更多的運營成本,在實際系統中難以實施.

算法2.經驗驅動的算力單元劃分方法.

輸入:算法Ai擬被調用的次數J,歷史經驗中算法Ai第j次調用的算力資源Ui, j,平臺當前待劃分的算力總量G;

輸出:擬劃分的算力列表S.

為了解決問題1),本文設計了經驗驅動的虛擬化算力劃分方法. 首先從電信的應用服務平臺收集了大量智能算法應用請求的運行軌跡,獲取各種算法對物理資源的開銷要求. 經過聚類分析后發現:這些算法對物理資源的需求存在明顯且非常稀疏的分界線,簡單的算法應用對物理資源要求較低,比如視頻人臉屬性(性別、年齡)的識別;而復雜的算法應用對物理資源的要求較高,比如監控視頻中人臉相似性分析. 所以,我們根據算法在歷史經驗中的算力需求,將物理資源劃分為不同粒度的算力單元,使其可以保證同時滿足簡單算法和復雜算法服務的算力要求. 算力單元的劃分粒度根據應用平臺用戶使用情況周期性動態調整,其具體方法如算法2 所示. 算力單元的劃分方法將根據文中算法2 輸出的算力列表S進行,具體地,根據每個算法的歷史調用記錄及當前的可用算力,對算力列表S進行動態更新. 在每次的算力劃分中,會將可用待劃分算力G分配給每一種算法,且每種算法的單次調用算力相同. 系統首先計算歷史經驗中智能算法Ai的平均算力,此后從G中扣除智能算法Ai被分配到的算力值,該值由記錄中Ai的算力Ui占總記錄算力∑U比例而得,即扣除值為(Ui/∑U)×G. 此后計算單次算力Si并按調用次數添加到列表S中.

為了解決問題2),本文設計了邏輯資源重組的算力合并方法. 一般來說,多個算力單元是物理非鄰接的,無法實現在真實物理層面的資源合并,但是在邏輯上可以合并多個算力單元. 如圖4 所示,將多個算法服務單元的計算任務進行拆解(操作系統級別的并行化計算),并分發至邏輯可合并的多個算力單元以最大化并行處理,從而極大降低服務單元計算任務的處理時間,并將在4.2 節進行相關實驗驗證.

Fig.4 Resource merging of multiple computation units圖4 多算力單元的資源合并

當算力資源不足時,服務請求響應時間將增長,若響應時間超過該服務所設閾值,判定為AIRM 系統處于過載狀態. 在此種情況下,一方面,AIRM 會即刻觸發服務請求排隊機制,此機制采用先進先出(FIFO)策略來響應用戶請求. 另一方面,AIRM 會快速擴容資源層算力服務單元,來消除短期的服務請求過載問題,恢復服務的響應時間在正常范圍內. 恢復所需的具體時長將受到平臺空閑算力資源、網絡情況等因素的綜合影響,但是盡量保證在毫秒級別達到穩定狀態.

4 實 驗

本節將介紹視頻云網平臺中,版權資源服務化與流動性算力網絡性能的評估方法及相關實驗結果.將使用并發用戶服務量、算法版權響應時間2 個性能指標,在算力資源變化的條件下評估視頻云網平臺中不同智能算法的服務性能. 此外,針對不同應用場景中對異構算法服務串行處理的需求,我們測試了組合算法的服務能力與響應時間.

4.1 實驗方法

1)實驗環境部署. 實驗所涉及的版權服務與算力網絡環境部署在中電信數智科技視覺智聯平臺運行,其基于中國電信云計算基礎架構,系統服務均部署在云平臺虛擬化后的虛擬機或容器中,包括權限認證服務集群、算法存儲服務集群以及邦聯平臺計算資源池3 個組成部分. 其中,邦聯平臺資源池提供計算資源以實現諸如AIRM 管理器、AIRM 容器以及其上層應用的負載. 由虛擬化的節點支撐系統服務的3 個組成部分,每個虛擬機節點的配置為Intel Xeon 8 核CPU、NVIDIA Tesla T4 GPU 與24 GB RAM內存,針對計算資源池的場景,本文將這些計算資源劃分為200 個算力單元以組成算力網絡并運行多個算法版權實例. 實驗過程中,由客戶端向平臺提交算法服務請求,客戶端配置為Intel Core i5-1035G4 CPU、16 GB RAM 內存. 實驗網絡環境包括中國電信千兆網與教育網(CERNET)千兆網. 實驗過程中算法服務提供HTTPS 接口,通信報文以JSON 的格式進行傳輸,加密方式采用RSA 簽名,以供客戶端提交請求和接收算法執行結果.

2)智能視頻應用. 本文所設計的版權管理方法可適用于任一類智能算法,例如人臉識別、車輛識別、語音識別等. 本文以人臉識別計算應用為例開展實驗. 將視頻監控中的人臉圖片幀用于人臉識別. 具體包括人臉屬性識別與人臉相似度計算2 個算法,人臉屬性識別用于系統并發服務性能的評估,算法的具體模型均由中電信數智科技視覺智聯平臺提供.此外,多種算法還會被同時調用以進行算法的組合適配實驗.

3)模型輸入. 人臉識別應用的輸入圖像由線上隨機抓取或在實驗場地拍攝而獲得,包括25 張人臉圖像,圖片大小為14~147KB,在實驗過程中不斷隨機抽取圖像并提交請求. 由于本文的研究問題在于算力網絡與其版權流動、服務能力,故不關注算法推理結果的準確性,無需涵蓋標簽的數據集.

4)算法調用過程. 用戶選擇一段視頻/圖片上傳至系統平臺,并且選擇調用智能算法. 這一應用請求會經由應用層接口下發至服務層,由AIRM 創建人臉識別服務單元接受用戶數據,同時調用資源層算力單元計算識別結果,此結果會被服務層向上傳遞回應用層展示給用戶. 在此過程中,應用層按照API 規范向其發送請求,包括算法服務碼、服務密鑰、RSA簽名等. 在平臺完成服務計算后,將識別結果回傳至用戶端,內容包括結果編碼、結果描述、服務應答時間戳等.

5)對比方法. 在DRM 對比實驗中,根據算法復雜度為每種算法版權配置不同的算力,實驗為每個人臉屬性算法版權配置35 GFLOPS 算力,而為每個人臉相似度算法版權配置43 GFLOPS 算力,每個算法版權可服務單一容器內的服務請求.

6)性能評估指標. 本文所采用的4 個主要評估指標為:

①并發服務量. 算法平臺在一定算力條件和服務種類的前提下,每秒內可負載的用戶最大請求數量由成功返回結果的請求數量除以總耗時計算得出.

②并發服務能力增益. 智能算法版權管理系統并發服務量與傳統方案的并發服務量之比.

③響應時間. 算法平臺收到了用戶請求后,調用算法版權和硬件資源處理該請求的完成時間. 注意,本處強調的響應時間不包括用戶請求在網絡鏈路上的傳輸時間.

④智能算法版權組合適配效率. 在2 種智能算法組合串行服務場景下,系統并發服務量與增益.

4.2 系統并發服務能力增益

為了評估系統的版權資源服務化能力,本文將量化系統的并發服務能力增益,即比較AIRM 與傳統DRM的服務能力差異. 本實驗將并發服務量,即最大負載容量作為基本指標用以后續評估. 實驗中面臨的變量是計算資源,在有限的資源下算法平臺可同時處理用戶請求的數量有限,此外不同的算法對硬件資源的開銷也存在區別. 在本文中,固定實驗中調用的算法為人臉屬性識別,它是一種常見的算法應用. 用戶可以將一張圖片發送至算法平臺,算法平臺將調用版權、執行算法,輸出該照片是否存在人臉,以及人臉中的一些必要屬性,比如年齡估算、性別分析等.為了與傳統的DRM 版權管理方案進行對比,在實驗中設定為每個算法版權配置35 GFLOPS 算力(FP16).

圖5 展示了在人臉屬性識別應用中,本文所提出的AIRM 系統與傳統DRM 在不同的算力支撐下并發用戶服務量的對比結果. 由于版權“買斷式”的缺陷,DRM 的服務量僅能隨著算力的擴大而緩慢增長,即每35 GFLOPS 增加一個服務量.相較而言,AIRM 得益于版權資源的高效分發,實現了更高量級的并發服務量. 例如,當算力為350 GFLOPS(FP16)時,DRM的服務量為10,AIRM 的并發服務量則可達到185;當算力達到3500 GFLOPS(FP16)時,DRM 的服務量為100,AIRM 的并發服務量可以擴展到2077.

Fig.5 User service capacity of AIRM and conventional DRM圖5 AIRM 與傳統DRM 用戶服務量

本文進一步定義了并發服務能力增益指標用以描述AIRM 并發能力的提升:平臺擁有的版權數量固定,在傳統版權管理方法或AIRM 方法下,分別能夠支撐的應用數量之比(1/n,n為AIRM 多路應用數量),即系統的并發服務能力增益,也即DRM 與AIRM 的服務量之比. 結果表明,在相同的算力資源下,AIRM平臺的最大用戶服務數量是傳統DRM 平臺的19.9倍(平均值),并且隨著算力資源的逐漸上升,AIRM的優勢更加明顯.

4.3 智能算法版權響應時間

為了評估AIRM 在版權分發服務時延上的優化效果,本文對比了AIRM 與傳統DRM 的算法版權響應時間. 根據中國電信視頻云平臺的業務量,在設置不同的版權數量、不同算力的情況下,分別記錄每個應用從收到算法請求到生成算法實例的響應時間.版權與算力的關聯與4.2 節中并發服務能力增益評估時的設定一致,每個算法版權配置35 GFLOPS 算力(FP16). 本組實驗中DRM 版權管理方案與AIRM方案均服務了20 路用戶請求. 將系統處理總時長與算法請求數量進行相除,即為該次實驗的請求平均響應時間. 其中系統處理總時長遵循中國電信視頻分析平臺授權管理模塊的處理時長,而不包括實驗過程中圖像數據上傳和下載時間,因其會受到公網網絡波動的影響.

圖6 展示了AIRM 與傳統DRM 在不同的算力資源下用戶請求響應時間的對比,DRM 的響應時間均在0.49 s 左右,而AIRM 的響應時間隨著算力的增長從0.49 s 逐漸降至0.40 s,降低算法版權響應時間18.36%. 該結果表明:隨著算力資源的增長,AIRM 平臺處理相同數量用戶請求的響應時間逐漸降低,而DRM 平臺由于版權服務過程冗余,多個算法版權無法流動,即使算力資源增長也不會對響應時間產生增益. 此外,算力資源對響應時間的增益并不是無限的,隨著用戶請求被充分分發至多個算法版權,響應時間將逐漸收斂,不再繼續下降. 在響應20 路用戶請求,本實驗的算力和集群部署條件下,AIRM 的響應時間大致收斂在0.40 s. 我們猜測,該收斂時間會隨著服務數量、算力部署情況的變化而產生不同結果.此外,根據算力與AIRM 響應時間的關系,可依據響應時間來評判系統是否處于過載狀態,評判閾值一般被設定為傳統DRM 系統理論響應時間(本實驗即為圖6 中的時間上限0.49 s),當AIRM 響應時間超過這一閾值時,判定系統處于過載狀態,將進行算力單元擴容,此過程會在毫秒級別內處理完成,盡早恢復到穩定狀態.

Fig.6 User request response time of AIRM and conventional DRM圖6 AIRM 與傳統DRM 下的用戶請求響應時間

4.4 智能算法版權組合適配效率對比

在視頻云的相關應用中,廣泛存在著算法組合的需求. 算法版權的組合適配需要版權資源服務化與算力網絡的共同支持,從而實現不同的算法版權與算力資源在系統內的分發流動. 典型的案例是在視頻監控人臉識別的需求中,需要同時利用到人臉屬性識別(簡稱“算法-1”)與人臉相似度計算(簡稱“算法-2”)2 種智能算法. 大多數場景中,“算法-1”對計算資源需求小,版權價格便宜,適合長時間的待機監控檢測;而“算法-2”版權價格昂貴且計算資源消耗高. 為了實現減小開銷的目的,AIRM 僅在“算法-1”檢測到必要目標時調用“算法-2”,以此降低版權與算力負載. 通過AIRM 實現“算法-1”與“算法-2”的組合適配,可以降低應用成本,在有限的版權資源數量下實現更大的應用容量.

本實驗將評估AIRM 在算法版權組合適配應用場景中的效率. 在本節實驗中為了使算力與版權的對應更符合應用場景設定,在DRM 對比實驗中設定為每個人臉屬性算法版權配置35 GFLOPS 算力,而為每個人臉相似度算法版權配置43 GFLOPS 算力.實驗將分多組不同的算力進行,實驗過程中由客戶端向AIRM 連續發出請求. 客戶端首先批量進行人臉屬性算法請求,持續0.5 s;再批量請求人臉相似度計算,持續0.5 s,以此循環直至達到預置的請求數量.

在算力為350~3500 GFLOPS 變化時,AIRM 的組合服務能力與DRM 服務能力的服務量對比如表1所示. 從實驗結果中可以觀察到AIRM 相比于DRM仍然具有顯著的服務能力提升效果,例如在算力為350 GFLOPS 時,DRM可以完成4 組算法服務,而AIRM 可以完成30 組算法服務,即實現了7.5 倍的提升. 在不同算力條件下,AIRM 組合服務量平均有8倍的提升,表明了智能版權管理系統在算法組合適配條件下的優越性能.

Table 1 AIRM Algorithm Combination Service Capability Gain表1 AIRM 算法組合服務能力增益

對比4.2 節中僅進行人臉屬性識別時的服務能力,在算法組合時相同算力的服務能力會有所下降,例如表1 中算力為350 GFLOPS 時,AIRM 組合服務量為30,而圖5 中該算力下AIRM 服務量為185. 這是由算法組合的資源負載提升導致,在相同的時間內處理2 種算法的請求,會導致并發服務量下降,尤其是人臉相似度計算(“算法-2”)對算力資源的要求更高.

此外,對比表1 與4.2 節中的服務能力增益,算法組合的AIRM 并發服務能力增益為8 倍,而單一人臉屬性識別的服務能力增益約為20 倍. 這種增益能力的變化是由于AIRM 對不同計算復雜度的算法并行能力不同,計算復雜度低的算法會具備更強的版權并行分發能力;而組合算法提高了計算復雜度,致使AIRM 的并發增益能力衰減. 此外,目前的實驗設定中AIRM 將2 種算法分2 批次處理,2 個算法提交的請求數量相同,這是在以最大的業務容量下做出的假設,實際情況中“算法-2”的請求量將小于“算法-1”的請求量. 若在實驗過程中進一步優化2 個批次中“算法-1”與“算法-2”的提交請求數量比例,AIRM 的算法組合服務能力還將進一步得到提升.

5 總結與展望

智能視頻云技術正在加速發展,視頻云服務對云網平臺中的算力資源提出了非常高的要求,針對大量的智能算法管理問題,本文提出了“算法即服務”理念,建立了新型的“服務—算法—資源”動態互聯服務體系,有效解決算法快速迭代、應用需求時變與智能算法版權固化管理的矛盾. 本文還提出智能算法版權管理系統,設計了細粒度版權資源服務化與流動性算法網絡化方法,實現智能算法版權管理相關功能模塊. 特別地,在中國電信視頻分析平臺授權管理模塊的實際部署與規模化分析驗證了本文所設計方法的先進性.

針對本文所提出的智能算法版權管理系統,未來可以在2 個方面繼續開展研究:1)面向大規模商用系統的智能版權低時延調度方法. 在實際系統中,不同的應用平臺對算法請求具有不同的響應時間要求,如何設計具有實時可擴展能力的智能算法版權管理方法,為未來的研究工作之一. 2)智能算法版權管理系統中的安全問題. 在系統實際使用過程中,如何實現用戶終端與系統的安全接入、安全連接與可靠性恢復,將在未來工作中展開深入研究.

作者貢獻聲明:張歡歡提出了算法主要思想;安聰凱設計了算法實現方法;趙朗程完成了實驗方案;周安福與馬華東負責整個項目研究思路,提出指導性意見并修改論文;袁藝和曹寧提出了在實際系統中的應用思路及建設方案,并提供實驗平臺支持應用驗證.

猜你喜歡
資源用戶服務
基礎教育資源展示
一樣的資源,不一樣的收獲
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
資源回收
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
主站蜘蛛池模板: 欧美啪啪网| 亚洲美女一级毛片| 好吊色国产欧美日韩免费观看| 天堂成人在线视频| 日本免费a视频| 日韩资源站| 极品国产在线| 自拍偷拍一区| 亚洲第一视频网| 色精品视频| 永久在线播放| 又爽又黄又无遮挡网站| 亚洲欧美成人影院| 精品人妻无码中字系列| 午夜久久影院| 午夜欧美理论2019理论| 91在线播放免费不卡无毒| 大学生久久香蕉国产线观看| 宅男噜噜噜66国产在线观看| 色AV色 综合网站| 亚洲精品视频免费| 国产精品蜜芽在线观看| 国产成人免费视频精品一区二区| 久久国产精品影院| 国产在线麻豆波多野结衣| 日本欧美中文字幕精品亚洲| 国产91av在线| 国产女人水多毛片18| 一区二区午夜| 欧美翘臀一区二区三区| 亚洲福利片无码最新在线播放| 女人爽到高潮免费视频大全| 久久精品视频亚洲| 欧美不卡二区| 国产av色站网站| 97精品国产高清久久久久蜜芽| 激情综合激情| 久久久久久久久18禁秘| 67194在线午夜亚洲| 亚洲国产黄色| 亚洲系列中文字幕一区二区| 91精品啪在线观看国产| 女人毛片a级大学毛片免费| 久久久久国产精品熟女影院| 永久在线精品免费视频观看| 久久久精品国产SM调教网站| 免费无遮挡AV| 国产精品真实对白精彩久久| 欧美丝袜高跟鞋一区二区| 波多野结衣一区二区三区四区| 亚洲色图另类| 国产黄网永久免费| 干中文字幕| а∨天堂一区中文字幕| 韩国v欧美v亚洲v日本v| 福利片91| 一本久道久久综合多人| 亚洲男人天堂久久| 久久精品人妻中文视频| 欧类av怡春院| 国产人成午夜免费看| 免费观看精品视频999| 国产簧片免费在线播放| 手机在线看片不卡中文字幕| 中文字幕1区2区| 亚洲国产综合精品中文第一| 亚洲欧美精品在线| 久久午夜夜伦鲁鲁片不卡| 18黑白丝水手服自慰喷水网站| 波多野结衣在线一区二区| 国产色婷婷| 无码福利日韩神码福利片| 国产免费好大好硬视频| 热热久久狠狠偷偷色男同| 国产精品免费入口视频| 日韩欧美国产另类| 久久精品娱乐亚洲领先| 日韩毛片免费| 九九视频免费在线观看| 午夜丁香婷婷| a天堂视频| 欧美 国产 人人视频|