999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Spark Streaming中參數與資源協同調整策略

2019-06-07 15:08:13梁毅劉飛常仕祿
軟件導刊 2019年1期

梁毅 劉飛 常仕祿

摘 要:Spark Streaming是一種典型的批量流式計算平臺,可用于處理持續到達的數據流。流式數據最重要的兩個特征是波動性和時效性。利用動態調整系統參數和動態調整資源滿足不同數據到達速率的響應延遲,但調整參數的方式具有局限性,其用戶成本較大。因此提出一種參數和資源協同調整策略,采用動態鄰域粒子群算法找到一種滿足SLO目標且使用資源最少的系統方案。實驗表明,AdaStreaming與DyBBS相比,延遲性降低了70.1%,在資源使用量上比DRA降低了42.1%。

關鍵詞:Spark Streaming; 動態鄰域粒子群;參數配置;資源分配

DOI:10. 11907/rjdk. 181652

中圖分類號:TP301文獻標識碼:A文章編號:1672-7800(2019)001-0045-03

Abstract:Spark Streaming is a typical batched streaming processing system that can be used to process continuously arriving data streams. The two most important characteristics of streaming data are its volatility and timeliness. The method of dynamical parameter configuration and dynamical resource allocation are proposed to guarantee the end to end latency with different data arrival rates. However, the method of dynamical parameter configuration has limitation on scope of application, and the method of dynamical resource allocation will bring greater cost to users. Therefore, this paper proposes a parameter and resource coordination adjustment strategy, using dynamic neighborhood particle swarm algorithm to find a solution that can achieve resource minimization on the premise of meeting the SLO goal. Experiments show that AdaStreaming reduced latency by 59% against DyBBS, and reduced the amount of resources by 34% against DRA.

0 引言

隨著大數據應用場景的多樣化,各種行業產生了海量流式數據[1-3]。流式數據最重要的兩個特征是波動性和時效性,不同時刻流式數據到達的速率是波動的,且需在一定時間內完成處理[4]。Spark Streaming[5]是一種典型的批量流式計算平臺,被工業界和學術界廣泛采用。

隨著云計算的發展,許多流式計算平臺被部署到云上,為用戶提供靈活的服務[6]。對于這類部署在云上的Spark Streaming平臺,滿足用戶SLO和最小化資源使用以降低用戶成本成為最重要的兩個目標[7-8]。現有研究主要從3方面進行優化:①數據丟棄[9-11]。但該方法不適用具有“至少執行一次”語義保證的應用;②動態調整參數配置[12-13]。然而,當數據速率激增時,當前資源分配情況下可能出現調整參數無法使延遲滿足需求的情況;③動態調整資源。當數據處理落后于數據流入時,會增加分配的資源數量以提升數據處理速率[14]。考慮到云環境按需付費的服務模式,該方法會給用戶帶來巨大的成本開銷。

本文通過分析影響Spark Streaming平臺性能的一些因素,提出一種參數和資源協同調整策略AdaStreaming。該策略采用一種動態鄰域粒子群算法,在滿足SLO的前提下,選擇一種資源使用量最少的參數和資源調整方案,并以此為依據進行系統調整。實驗表明,與動態調整參數的DyBBS方法相比,本文提出的AdaStreaming在延遲上降低了59%,與動態調整資源的DRA方法相比,AdaStreaming在資源使用量上降低了34%。

1 Spark Streaming

Spark Streaming構建于Spark[15]之上,其處理流程如圖1所示。流入系統的數據以一定的劃分間隔分割成分開的數據塊,然后以一定批次的劃分間隔劃分為獨立的批次任務,并按順序提交到Spark引擎中執行。根據上述處理過程,可以看出數據塊劃分間隔和批次劃分間隔是影響系統性能的兩個重要參數。

2 SparkStreaming中參數與資源協同調整策略

2.1 動態鄰域粒子群算法

粒子群優化算法(Particle Swarm Optimization,PSO)是一種基于迭代的優化算法,易于實現且無較多參數需要調整[16-18]。動態鄰域粒子群(DNPSO)算法可在不同階段考慮不同目標,用于多目標約束優化問題的求解[19-20]。對于兩個目標的問題,第一個目標[f1]可確定粒子鄰域,第二個目標[f2]作為度量粒子質量的適應度函數。因此鄰域函數[f1]找到粒子i的鄰域[Ni]后,粒子i在t+1時刻的個體最優位置可由式(1)計算。

主站蜘蛛池模板: 中文字幕久久亚洲一区| 国产精品亚洲专区一区| 亚洲综合18p| 激情爆乳一区二区| 波多野结衣无码中文字幕在线观看一区二区 | 妇女自拍偷自拍亚洲精品| 免费一级成人毛片| 国产不卡国语在线| 91成人在线免费观看| 亚洲三级网站| 毛片基地美国正在播放亚洲 | 久精品色妇丰满人妻| 深爱婷婷激情网| 国产精品太粉嫩高中在线观看| 欧美日在线观看| 午夜小视频在线| 亚洲日韩久久综合中文字幕| 美女内射视频WWW网站午夜 | 国产精品主播| 日韩小视频在线播放| 少妇人妻无码首页| 国产精品一区二区国产主播| 亚洲欧美日韩久久精品| 亚洲无码在线午夜电影| 亚洲无码免费黄色网址| 国产精品欧美激情| 韩国v欧美v亚洲v日本v| aa级毛片毛片免费观看久| 日本欧美中文字幕精品亚洲| 欧美在线综合视频| 福利片91| 免费Aⅴ片在线观看蜜芽Tⅴ| 亚洲乱码在线视频| 98超碰在线观看| 熟妇无码人妻| 久久精品午夜视频| 国产无码性爱一区二区三区| 午夜在线不卡| 第一区免费在线观看| 一区二区三区四区精品视频| 亚洲天堂首页| 区国产精品搜索视频| 97se综合| 亚洲综合色吧| 国内精品小视频福利网址| 青草精品视频| 她的性爱视频| 九九热精品视频在线| 国产一级毛片在线| 国产v精品成人免费视频71pao| 91网站国产| 欧美综合一区二区三区| 大陆精大陆国产国语精品1024| 在线免费看黄的网站| 一本大道香蕉久中文在线播放 | 国产黄网永久免费| 亚洲国产日韩欧美在线| 亚洲床戏一区| 色噜噜狠狠色综合网图区| 亚洲欧美国产五月天综合| 精品国产www| 白丝美女办公室高潮喷水视频| 成AV人片一区二区三区久久| av无码一区二区三区在线| 无码专区第一页| 五月婷婷激情四射| 99热这里只有精品久久免费| 国产在线观看91精品亚瑟| 久久综合丝袜长腿丝袜| 成人中文在线| 国产第二十一页| 无码视频国产精品一区二区| 亚洲专区一区二区在线观看| 久久亚洲日本不卡一区二区| 亚洲AV无码一二区三区在线播放| 国产精品亚洲五月天高清| 精品91自产拍在线| 成人日韩欧美| 国产欧美精品专区一区二区| 有专无码视频| 成人国产精品2021| 波多野结衣一区二区三区四区|