999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Caffe并行實現算法研究

2017-10-09 08:36:20
福建質量管理 2017年16期
關鍵詞:深度模型

(沈陽理工大學信息科學與工程學院 遼寧 沈陽 110159)

Caffe并行實現算法研究

孟思彤辜陽

(沈陽理工大學信息科學與工程學院 遼寧 沈陽 110159)

本文首先分析了單機版本Caffe的缺點和實現分布式的原因,再分別介紹了Caffe的基于同步式SGD、異步式SGD和改進的異步SGD三種不同的并行實現方式,最后通過分析了三種方式的優缺點,得出改進的異步式SGD效果最好結論。

Caffe;同步式SGD;異步并行;改進異步式SGD

一、引 言

隨著對深度學習領域研究的深入,有證據表明增大模型參數規模和訓練數據集,能有效的提高模型準確率。152層殘差網絡(ResNet)結構[1]的提出和大數據時代超過TB的訓練數據,帶來了精度上的提升,同時也帶來了巨大的訓練時間成本,僅僅使用目前的單機版本深度學習工具加GPU計算的方式,已經不能滿足其要求的計算能力和存儲空間。當前熱門的深度學習工具,如TensorFlow、MXNet、Torch、CNTK等都在設計初期,基于參數服務器結構實現了自己的分布式版本,支持并行訓練。

Caffe作為一個高效、實用的老牌開源深度學習框架[2],已經在計算機視覺,文本處理,自然語言識別等領域取得卓越成就,得到了學術界和工業界廣泛的認可。然而Caffe在設計初期聲稱的高速運算,只是簡單的采用GPU加速計算,并沒有實現并行訓練的方式,這顯然與當前深度學習的發展趨勢不符。

分布式深度學習框架包含模型并行和數據并行兩種,由于數據并行化在實現難度、容錯率和集群利用率方面都優于模型并行化,所以現有的分布式深度學習框架大多采用數據并行方式,本文所討論的SGD并行算法也是基于數據并行。

二、同步式SGD

前不久,雅虎開源了基于Spark平臺的Caffe并行版本CaffeOnSpark,與其他專門搭建的深度學習集群不同,支持直接在Spark集群上進行深度學習,避免了訓練數據的傳輸,同時支持yarn的管理調度,能同時進行多個訓練任務。CaffeOnSpark在參數同步時采用的是同步式SGD結構,標準的同步SGD算法,每次迭代都分為三個步驟,首先,從參數服務器(Parameter Server,PS)中把模型參數w拉取(pull)到本地,接著用新的模型參數w計算本地mini-batch的梯度Δw,最后將計算出的梯度Δw推送(push)到PS。PS需要收集所有worker的梯度,再統一進行平均處理更新模型參數,同步式算法如圖1所示。

圖1 同步式SGD算法圖

當集群中各個機器之間性能有差異時(即計算一個mini-batch花費時間不同),將會導致所有的worker都要等待計算最慢的一個執行完,產生等待時間開銷,我們稱為木桶效應問題。當忽略機器之間的性能差異,所有worker同時完成一個mini-batch計算,則會一起向參數服務器發送梯度值,而沒有搶占到資源的worker會被放入等待隊列排隊,參數服務器向worker發送更新后的參數時,同樣是依次發送,worker需要排隊等待,浪費計算時間,我們稱為通信沖突。

三、異步式SGD

當前熱門的分布式深度學習框架大多采用異步隨機梯度下降算法(ASGD),參數服務器只要接收到worker的梯度值就進行更新,把更多的時間用于計算,而不是等待參數服務器的平均操作,消除了木桶效應問題,并且利用梯度的延遲更新,減少了網絡通信量,降低網絡通訊造成的時間開銷,獲得明顯加速。文獻[3]證明算法是收斂的,但是通信沖突問題仍然存在,而且還會導致梯度值過時問題,計算梯度需要消耗時間,當某個節點算完了梯度值并且將其與參數服務器的全局參數合并時,全局參數可能已經被更新了多次,梯度值過時會降低算法的收斂速率,同時導致模型準確率下降。

四、改進的異步式SGD

在上述問題的研究基礎上,我們發現機器性能差異越大,即完成一個或多個mini-batch的時間差越大,通信等待時間越小。文獻[4]提出一種改進的異步式隨機梯度算法,采用隨機數據分片方式,進一步加大完成時間差,使其盡可能小,達到進一步減少訓練時間目的。針對ASGD算法的梯度值過時問題,改進的異步式算法使用了一種弱同步策略,在系統性能跟算法收斂速率之間進行權衡,引入參數s來控制模型更新,只有在接收到n個Caffe進程的s次梯度更新,模型參數才進行更新。

五、結束語

同步式SGD算法實現了Caffe的并行,ASGD算法實現了Caffe的異步并行,改進的異步算法通過分析ASGD算法的通信沖突,發現可以通過加大各個worker完成mini-batch的時間差,能緩解通信沖突,并采用一種弱同步策略,減弱梯度過時的影響。通過實驗驗證,改進的ASGD算法確實能帶來訓練速率和模型準確率的提升,但同時也帶來了一些額外的超參數,如npush和npull間隔的輪數,參數服務器進行更新的次數s,比起同步式SGD調參更為困難。

[1]Kaiming He,Xiangyu Zhang,Shaoqing Ren,et al. Deep Residual Learning for Image Recognition[J]. In CVPR,2016.

[2]Yangqing Jia. Caffe: A fast open framework for deep learning [EB/OL]. http://caffe.berkeleyvision.org.

[3]Zinkevich M,Langford J,Smola A. Slow learners are fast [C]. Advances in Neural Information Processing Systems 22 (NIPS 2009),2009:2331-2339.

[4]Dean J, Corrado GS, Monga R, et al. Large scale distributed de-ep networks [C]. International Conference on Neural Information Processing Systems. Curran Associates Inc. 2012:1223-1231.

孟思彤(1993-),女,漢族,遼寧本溪人,碩士,研究方向網絡管理與系統監控,深度學習;辜陽(1993-),男,漢族,湖北漢川人,碩士,研究方向圖像處理與分析技術,深度學習。

猜你喜歡
深度模型
一半模型
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
深度觀察
深度觀察
深度觀察
深度觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 日本精品中文字幕在线不卡| 亚洲天堂日韩在线| 玖玖免费视频在线观看| 国产免费久久精品99re不卡| 亚洲成人www| 成人在线视频一区| 国产亚洲高清视频| 亚洲无码一区在线观看| 十八禁美女裸体网站| 丰满人妻被猛烈进入无码| 午夜视频www| 亚洲欧美色中文字幕| 四虎国产精品永久一区| 亚洲综合专区| 无码网站免费观看| 欧美在线伊人| 岛国精品一区免费视频在线观看| 蜜臀av性久久久久蜜臀aⅴ麻豆| 777国产精品永久免费观看| 她的性爱视频| 国产精品亚洲αv天堂无码| 国产香蕉一区二区在线网站| 国产91精品调教在线播放| 国产手机在线ΑⅤ片无码观看| 波多野结衣二区| 亚洲中文久久精品无玛| 日本亚洲成高清一区二区三区| 欧美在线综合视频| 91久久偷偷做嫩草影院| 99视频精品在线观看| 91啦中文字幕| 四虎影视国产精品| 久久6免费视频| 国产成人综合日韩精品无码不卡| 国产亚洲现在一区二区中文| 精品国产一二三区| 性喷潮久久久久久久久| 一级毛片免费的| 久久综合伊人 六十路| 美女一级免费毛片| 国产精品黑色丝袜的老师| 亚洲色图狠狠干| 午夜免费小视频| 日本三级精品| 欧美成人手机在线观看网址| 亚洲一区二区三区国产精品 | 日韩在线视频网站| 美美女高清毛片视频免费观看| 国产一级二级在线观看| 成人精品午夜福利在线播放| 亚洲高清无码久久久| 亚洲黄色片免费看| 亚洲无码精品在线播放| 国产成人久久综合一区| 手机永久AV在线播放| 亚洲精品久综合蜜| 在线毛片免费| 亚洲va视频| 亚洲欧州色色免费AV| a级毛片免费播放| 国产精品hd在线播放| 一本一本大道香蕉久在线播放| 欧美一区二区精品久久久| 国产在线啪| 日韩欧美中文| 超清无码一区二区三区| 国产成人喷潮在线观看| 国产视频 第一页| 国产天天色| YW尤物AV无码国产在线观看| 国产成人啪视频一区二区三区| 91精品专区| av天堂最新版在线| 久久久久久国产精品mv| 国语少妇高潮| 日韩免费毛片视频| 在线观看欧美国产| 色网在线视频| 国产综合网站| 亚洲一区二区三区中文字幕5566| 国产精品成人不卡在线观看| 成人蜜桃网|