嚴立忠
容器的使用正在迅速增長。Cloud Foundry和ClearPath Strategies在2016年6月進行的一項調(diào)查顯示,64%的受訪者表示計劃在明年將容器的使用主流化。隨著容器使用量的不斷增加,解決監(jiān)控問題以提高容器的性能、使用和故障排除能力至關(guān)重要。然而,有效的監(jiān)控需要一種由分析驅(qū)動的方法,不僅能通知開發(fā)人員和運維部門正在發(fā)生的情況,還能夠幫助這些團隊挖掘其容器使用情況和性能數(shù)據(jù),從而獲得可行的洞察力。
當出現(xiàn)錯誤時會發(fā)生什么?出現(xiàn)問題時,快速了解事件的具體細節(jié)至關(guān)重要。在容器中運行的應(yīng)用發(fā)生錯誤是容器問題最常見的來源,但并非唯一來源。容器問題也可能由操作系統(tǒng)、存儲、網(wǎng)絡(luò)、數(shù)據(jù)庫或其它部件等底層基礎(chǔ)架構(gòu)的問題引起。因此,容器監(jiān)控解決方案必須具有可見性和分析能力,幫助用戶確認問題的根源。如果不能快速準確地做到這一點,可能會引發(fā)更長的停機時間,從而給組織造成重大成本和風險。
容器具有獨特的特征,將對組織應(yīng)選擇的監(jiān)控解決方案產(chǎn)生影響。比如,容器是短暫的,可以在幾秒鐘內(nèi)啟動和停止這一事實。這需要一個監(jiān)控解決方案,可以利用日志記錄和度量值界面,并在該容器不再運行后保留相關(guān)信息。此外,容器監(jiān)控解決方案不僅要具備分析容器的能力,而且還要能夠提供對應(yīng)用堆棧其他組件可用性、性能和使用情況的洞察力。
對于有效和高效的容器監(jiān)控來說,最重要的要求也許就是擁有一個源于容器的解決方案。……