李 策,李方軍,王 華,王亞婷
(1.國網甘肅省電力公司信息通信公司,蘭州 730050;2.國網甘肅省電力公司,蘭州 730010)
當前,基于網絡服務器日志的使用方法主要是在網頁瀏覽器中可以自動地獲得用戶的行為采集數據常使用的日志采集方法,主要是分析和采集基于網絡和Web的服務器對用戶的日志采集信息的自動研究和采集數據。所謂基于服務器的自動日志采集文件顧名思義即實時地統計、實時地記錄一連串的日志活動,包含主要服務器對顧客的日志請求和服務器自動給予的次要顧客響應。在實際的自動日志分析和采集的過程中具體的自動日志采集形式,取決于使用web服務器的日志類型根據使用網絡以及自動生成的數據日志格式不同。
基于Web服務器自動日志的實現方法的著重獲得日志文件經過分析后存在巨大價值的結果數據。①一方面使用web網絡服務器的自動生成的日志采集文件,所產生的成本較低;②與人為自動建造的日志數據可用性環境研究所得的數據相比,在一個能更好地反映服務器的日志采集文件中所得到的日志數據的可用性環境中真實地反映了訪問者的真實使用狀況 ;③與抽取有限用戶在有限時段內在內分析獲得統計數據相比較,采用Web服務器日志文件分析方法獲取的大量數據信息,可以對任意時間內的指定或海量用戶的行為分析數據,這樣的數據分析結果對進行用戶行為分析有著不可比擬的優勢,也就是我們可以用數據采集和發掘等其他的技術手段來分析這些用戶。
基于服務器日志的一些缺點服務器日志的數據分析方法,還有很多不足之處,因此日志數據分析文件被合理的設計成主要用于分析網站根據級別和性能的統計分析數據,坦白的說就是能夠提供大量日志文件的記錄分析 的網站和研究數據生產性必要的統計數據用網站相比,稍稍有一些不足,研究的潛在的數據生產性只有少量的統計數據是盡可能提供的,而可能性也只有盡可能提供一部分具有誤導性的統計數據。這可能是因為只要現在的web代理服務器發送了出去的請求用戶就能看到請求的頁面,一旦現在的用戶不需要發出請求,那么現在的web代理服務器并不記錄過去的訪問網頁與當前訪問者之間究竟發生了什么。
幾個典型的有關日志文件所獲數據不足,存在誤導性數據的例子:
(1)Who正在訪問某一網站。若應用想讓所有者知曉究竟是某些人正在訪問某一網站,就必須要求日志文件中包含當前網站訪問者的動態Id和地址代理服務器的客戶端登錄標識,日志的文件提供著關于顧客的動態Ip和地址的代理客戶端的登錄信息。這些顧客動態Ip和地址在一般情況下都提供有關Internet服務提供商的用戶動態Ip。且很多時候是可以通過代理服務器去訪問某個地址的,這種情景下,就無法支持讓用戶知曉怎樣的情況下可以訪問怎樣的網站。
(2)用戶在每頁的停留時間。日志文件所能夠記錄的訪問停留時間只是用戶開始日志文件傳輸的時間,而不是傳輸任務完成的時間。在下載頁面的過程中,不能有效記錄用戶開始瀏覽頁面的時間。若記錄頁面顯示的時間,倘若用戶因事離開,只能是當前的日志文件請求和下一個會話中能夠接收到請求的網站用戶之間的對話時間來大概計算停留在此頁面的時間。
(3)怎么確定在網站成功完成操作任務。這個問題涉及到日志文件的適應性設計問題,單單通過日志管理的文戶是基本不可能被回答的,倘若判斷"用戶是否完成審批?是否成功提交?"此類操作結果不難被推斷出來。然而,倘若想要十分確認的回答"訪問者有沒有找到預查詢信息?"如此需求,若只是通過單一日志方式進行分析,結果是差強人意的。
Click Traces Analyzerr是一套網站輔助工具,該工具基于用戶通過服務器的日志以及下載文件方法獲取數據,是專門進行分析、統計網站訪問軌跡以及用戶操作行為的典型有效的數據分析工具。Click Traces Analyzer工具的致力于深入地探知大量網站用戶的訪問需求以及瀏覽網站行為、習慣分析設計等強大的數據分析功能,而后將大量復雜數據采用相對簡單的數據分析方法展示出來,大大地增強了數據分析輔助工具的功能和可用性,管理分析數據技術人員在按需進行數據分析時,網站的訪問行為狀態可全盤掌握。
現實的工作環境下進行的訪問操作,這樣就可以避免一般性的人為干擾以及嘈雜環境條件等干擾因素,這樣客戶端獲取和收集到的用戶行為數據就會更加真實。
相較于其他常用的基于日志文件類的數據收集分析方法,從訪問者PC端獲取和收集得到的行為分析結果要更加準確,更加地能夠有效克服上述的眾多復雜問題。
因為采用客戶端方式記錄操作行為數據,故而客戶端的程序會自動執行追溯用戶訪問記錄的路徑,瀏覽的網頁等。這種跟蹤情況是不會因為用戶行為改變的,與用戶是不是通過本機緩存或通過代理服務器進行網頁訪問無關。
通過比較客戶端收集、分析用戶行為數據方法優劣對比,使用的用戶會通過瀏覽器來訪問內部業務系統,多核智能瀏覽器會紀錄訪問痕跡,瀏覽器后臺分析中心會對用戶訪問數據做用戶行為分析,例如:智能運維運行監控。
智能運行監控模塊通過客戶端收集和分析用戶行為數據的方法,可自動采集用戶終端基礎信息:自動采集個人終端的計算機配置(內存、CPU、帶寬、品牌等基礎信息),用于實時掌握全省終端情況,建立臺賬信息,為后續終端精益化管理提供良好基礎。
智能運行監控可自動采集用戶訪問頁面數量及效率:自動采集每個用戶訪問的每個頁面時長,為公司定位各業務系統以及業務模塊的響應性能提供真實有效數據,為后續優化系統性能及系統升級改造提供數據支撐。
全程記錄用戶的所有訪問行為,真實反映各業務系統的應用情況,為公司辨別“僵尸”系統提供有力手段。對用戶操作行為數據進行分析,在大數據時代創造新價值。
多核瀏覽器作為電力企業各系統訪問的客戶端,強大的后臺管理功能可以對終端用戶訪問網址進行監控,發現異常可通過后臺直接禁止該瀏覽的使用,同時該瀏覽器可以和企業中臺進行對接,瀏覽器以微服務、微應用的形式調用中臺各類應用。提升電力企業內部業務系統訪問便捷性,同時可以對業務系統訪問進行集中訪問控制。根據電力企業目前業務系統的訪問情況,通過多核瀏覽器可以有效解決各部門科室業務系統訪問繁瑣問題,同時也可以通過瀏覽器與企業中臺進行對接,對電力企業內微服務微應用通過瀏覽器進行數據共享等。