999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

核外架構的進化

2011-12-31 00:00:00盤駿
計算機世界 2011年8期

和微架構方面一樣,Sandy Bridge的架構方面也具有了很大的變化。這個變化來自兩個方面的考慮:性能和可擴展性,其中后者包括了要面對越來越多的處理器核心的問題,還有要面對來自GPU挑戰的問題。針對GPU的壓力,英特爾一方面采取了更寬的256位AVX向量運算提升CPU處理能力,一方面采取了在CPU內直接融合GPU的方法。關于GPU的部分可以寫出多個長篇內容,因此這里主要談及Sandy Bridge其它方面的架構變化。

這個變化就是Sandy Bridge采用了新的Ring Bus環形總線來連接各個CPU核心、LLC緩存(就是L3緩存)、融合進去的GPU以及System Agent(就是系統北橋)部分。自從Nehalem開始使用融合核心策略后,不同產品線的處理器都基于同一種核心,只是具有不同的核外架構(稱為Uncore架構),這個核外架構在不同的產品線上必須進行不同的設計,對應地芯片組也要進行變化。在核心數量比較少的時候,這很容易辦到,然而在高端服務器上,核心數量很高,這種方式就難以具有匹配的性能,并且開始變得難以實現。實際上,高端8核心的Nehalem-EX處理器就采取了和桌面/移動端完全不同的Uncore架構:使用了一個環形總線,而在后來加入GPU的Westmere后,新加入的GPU迫使內存控制器和CPU核心分立,并和GPU一起集成到一個相對落后的45nm制程的芯片上,影響到了性能和功耗。現在,這個Nehalem-EX的環形總線技術被應用到了Sandy Bridge全線產品線上來。

革命性的環形總線

通常的處理器使用Crossbar交叉開關來連接多個組件,在部件較少時性能表現良好,然而其復雜度隨著連接件數量的提升呈幾何級數增長。采用環形總線的話,則是呈線性增長,結構簡單并且布線也更方便,可以很容易地擴展到更大數量的連接部件,并且可以很方便地加入如GPU等獨立構造。在Sandy Bridge上,這個總線實際上是直接放置在LLC緩存上方,比交叉開關占地面積更小,布線更加方便。

這個環形總線其實由四條獨立的環組成,分別是數據環(Data Ring)、請求環(Request Ring)、響應環(Acknowledge Ring)、偵聽環(Snoop Ring)。其中用來傳輸數據的數據環的寬度是32B(128bit),剛好是L3緩存線的一半。和Nehalem-EX的一樣,這個數據環應該還是雙向的,這樣通過自動選擇最近的線路,對目標的存取延遲可以降低到平均只有一個環的一半。

Sandy Bridge環形總線上分布著多個Ring Stop,叫做“站臺”,這個“站臺”和Nehalem-EX的并不太一樣,其實仔細看的話,Sandy Bridge的環形總線和Nehalem-EX的也不太一樣。Nehalem-EX的環顯得更大一些,每個CPU/LLC塊上只有一個連接點,而Sandy Bridge的顯得很纖細,每個CPU/LLC塊上具有兩個連接點,這種差異的具體細節尚不清楚。

環形總線是全流水線化的,并且運行在核心頻率/電壓上,因此其帶寬會根據不同的型號/工作狀態而變化,并且可以根據加入站臺的數量而擴展。當然,站臺數量的增加會增長總線的寬度,并會對應地增加延遲,每個站臺之間的傳輸時間是一個時鐘周期。理論上,3.4GHz的Sandy Bridge每個站臺可以具有108.8GB/s的帶寬,4個核心就具有435.2GB/s的理論帶寬,由于數據經過不同的站臺的時候,該站臺需要等待而無法傳輸數據,因此實際的帶寬無法達到理論值。

LLC:L3緩存的變化

環最主要的作用是將CPU核心與L3緩存聯結起來,L3緩存是處理器的最低一級緩存,因此也叫Last Layer Cache(LLC)。每一個CPU/LLC塊上具有一個稱為Interface Block(接口塊)的部件來負責和Ring通信,每個接口塊上包含了一個獨立的緩存控制器,負責回應緩存請求、維持一致性和排序,并在L3緩存未命中、芯片件偵聽以及非緩存請求時和System Agent通信。實際上,Sandy Bridge實現了一個分區化的分布式仲裁緩存架構。

除去使用環形總線的EX系列,Nehalem/Westmere的L3是一個單塊的大緩存,具有統一的32B(256bit)帶寬,到了環形總線架構之后,就不再是這樣了。和Nehalem-EX/Westmere-EX一樣,Sandy Bridge將LLC分成多個具有32B寬度接口的緩存塊,系統內存的物理地址還通過Hash機制分布到所有的緩存塊上,因此實際上所有的緩存塊都可以同時運作,增加了帶寬、簡化了一致性問題并避免了熱區效應,其性能和沒采取環形總線的時候相比具有著巨大的提升。

每一個LLC緩存塊都具有和原來Nehalem/Westmere的大緩存塊類似的結構,在桌面處理器上,每個核心將會對應一個LLC緩存塊,而每個2MB容量的LLC塊屬于16路組相連。在服務器產品線上,每個核心仍然對應一個緩存塊,然而由于去掉了GPU模塊,因此LLC緩存塊獲得了更大的面積,其容量提升到了2.5MB,對應地,組相連也提升到20路,這些進一步提升了其緩存命中率表現。

Sandy Bridge的L3緩存仍然使用了包含式的設計,在上級緩存上具有的內容在L3緩存上具有同樣的副本,和Nehalem一樣,Sandy Bridge也提供過核心有效位來提供偵聽過濾器的作用,只是增加了GPU對應的位,因為Sandy Bridge的緩存是CPU、GPU共享。

除了緩存的分布式仲裁、運作帶來的高帶寬之外,Sandy Bridge的緩存延遲實際上也得到了降低,大約從原有的35#12316;40個時鐘周期降低到26#12316;31個時鐘周期。延遲的降低一部分是因為小的緩存塊本身就具有較低的延遲,存取對應的標記和數據都比原有的單個大緩存塊要快。延遲降低的另一個原因是現在LLC緩存運行的頻率和核心頻率保持了一致。在Nehalem/Westmere上,LLC緩存運行于Uncore頻率,通常是比核心頻率要低的。一致的運行頻率還避免了不同頻率區間傳遞信號的懲罰,最終讓Sandy Bridge延遲表現更好。

System Agent:更快速的北橋

System Agent系統代理扮演原有的北橋角色,連接內存控制器、PCI Express總線以及PCH(類似南橋芯片),此外還帶有PCU功率控制單元管理其他部件的頻率/電壓,實現Turbo Boost 2.0功能,System Agent還負責引出GPU的顯示輸出。在帶有GPU的Sandy Bridge處理器上,CPU/LLC、GPU運行于動態的電壓和頻率,而System Agent則運行于固定的電壓和頻率。和傳統的分立北橋和上一代Lynnfield的多芯片同封裝相比,完全集成在一起的System Agent盡可能地消除了各個部件間的聯線,可以提供更好的延遲表現。

通過使用新的環形總線,Sandy Bridge以更有效率的方式對CPU、LLC、GPU和System Agent進行了組織,提供了更高的內部帶寬和更低的L3存取延遲,并且可以很好地融合新加入的GPU模塊,并適應高端服務器市場上的大數量處理器核心場景。在下回,筆者將介紹Sandy Bridge全新的GPU部件,敬請期待。

主站蜘蛛池模板: 无套av在线| 欧美国产日产一区二区| 久久国语对白| 国产精品一线天| 国产成人a在线观看视频| 99久久精品无码专区免费| 中文字幕日韩欧美| 婷婷综合亚洲| 天天综合亚洲| 又污又黄又无遮挡网站| 原味小视频在线www国产| 国产高清不卡视频| 乱人伦视频中文字幕在线| 国产极品美女在线观看| 亚洲中文字幕23页在线| 欧美a级在线| 中国毛片网| 欧美午夜久久| 亚洲天堂网在线视频| 亚洲国产日韩视频观看| 国产小视频在线高清播放| 国产在线观看一区精品| 国产精品熟女亚洲AV麻豆| 亚洲综合18p| 91激情视频| 欧美高清三区| 婷婷伊人久久| 亚洲免费三区| 成人午夜精品一级毛片| 亚洲综合在线最大成人| 免费一级成人毛片| 国产不卡网| 91精品国产一区自在线拍| 色综合手机在线| 亚洲第一视频区| 国产一区二区视频在线| 亚洲国产精品成人久久综合影院| 国产成人三级| 97se亚洲综合不卡 | 国产精彩视频在线观看| 亚洲视频一区在线| 欧美国产日韩在线| 亚洲日产2021三区在线| 国产一区二区三区在线无码| 999精品视频在线| 啪啪免费视频一区二区| 国产一级妓女av网站| 午夜老司机永久免费看片| 另类综合视频| 亚洲丝袜第一页| 99尹人香蕉国产免费天天拍| 亚洲一区免费看| 免费人成在线观看成人片 | 久久精品无码国产一区二区三区| 青青草国产免费国产| 久久天天躁夜夜躁狠狠| 亚洲嫩模喷白浆| 亚洲v日韩v欧美在线观看| 国产精品漂亮美女在线观看| 久久国产成人精品国产成人亚洲| 视频一区视频二区中文精品| 亚洲男人的天堂在线| 嫩草在线视频| 日韩亚洲综合在线| 日韩高清中文字幕| 欧美成人二区| 91麻豆国产在线| 成人亚洲视频| 国产成人精品一区二区| 亚洲人成网7777777国产| 国产精品无码AⅤ在线观看播放| 亚洲va视频| 日本人又色又爽的视频| 国产精品青青| 一级黄色欧美| 国产免费久久精品99re不卡| 国产欧美亚洲精品第3页在线| 91九色国产在线| 国产亚洲欧美另类一区二区| 色婷婷在线播放| 四虎AV麻豆| 欧美国产日韩在线|