摘要:傳統的網站只是在頁面上使用計數器進行簡單的訪問者數量的統計。隨著網站運營規模的擴大,依靠這種簡單的數量統計并不能真正對網站運營狀況做以全面的評估,難以為網站運營提供有意義的參考;基于Web的網站訪問流量統計系統在功能上強化了對用戶行為的統計和分析,有利于網站管理者、開發者根據目標客戶使用網站的實際情況制定網站經營戰略,調整網站運營架構,進而對網站整體進行更有意義的改進。
關鍵詞: 流量分析;網站營銷;流量統計;cookie;javascript
中圖分類號:TP311文獻標識碼:A 文章編號:1009-3044(2008)05-10000-00
1 引言
網站經營狀況的調查可以從多個方面進行,比如廣告投放效果、單位時間網站訪問量、用戶調查、在國際排名網站的排名情況等一系列指標。以上這些指標體系大體可以分為兩方面:一是人(用戶)對網站的直接評價,也叫感性評價;二是通過定量的數據分析得出的統計結果,也叫理性評價。這兩種評價方式應該有機結合,克服對方的缺點,才能真正得出有利于網站發展的客觀評價結果。而在定量分析的方法中對訪問者流量的采集和分析又是網站調查必不可少的重要手段。
從網站管理者的角度來講,網站訪問流量分析是指在獲得網站訪問量基本數據的情況下,對有關數據進行統計、分析,從中發現用戶訪問網站的規律,并將這些規律與網絡營銷策略等相結合,從而發現目前網絡營銷活動中可能存在的問題,為進一步修正或重新制定網絡營銷策略提供依據的一種分析方法。網站訪問流量分析是進行網絡效果評價和網絡營銷診斷的重要依據。
隨著計算機網絡技術的發展,大部分網站訪問流量統計方法已經由傳統的簡單計數器計數的方式轉變為對Web服務器訪問日志進行分析或者使用嵌入式腳本對網站訪問情況進行實時監控的方式。傳統的網站訪問流量統計分析只是采用計數器的方式對訪問者進行數量上的統計,并不能針對訪問者行為進行跟蹤和記錄,實際應用意義不大。而且,由于網絡環境復雜性的存在,致使計數器統計方式統計的數據缺乏準確性,在一定程度上無法正確的反映網站的實際運營情況。為解決該問題,眾多網站都采取了日志分析和腳本嵌入分析的方法對網站訪問流量和實際用戶行為進行統計分析。這兩種統計分析方法對于網站經營者而言,可以對大部分有意義用戶訪問數據進行獲取、統計和分析工作,從而對網絡營銷戰略的制定起到積極的推動作用。新型的網站訪問流量分析方法還可以為網站的管理者和開發者提供有意義的用戶行為信息,以便對網站的邏輯結構、服務器負載、網站運行狀況等具體情況進行更具有針對性的改進。
2 流量分析的重要評價指標
流量分析是從用戶使用的角度,掌握用戶的實際使用情況從而對一個網站的運營狀況進行分析的一項重要手段。它對網站的內容評價、實施評價、運行狀況評價和服務質量評價具有重要的指導意義。流量分析不僅能夠給網站建設者提供參考,也能夠給經營決策者提供分析報告,進而更好的進行網站營銷工作。進行流量分析的數據指標有很多,其中最重要的有:
訪問量:訪問的用戶數,20分鐘內的重復訪問不記入訪問量
獨立訪問者數量:該項指標描述了網站訪問者的總體狀況,指在一定統計周期內訪問網站的訪問者數量(例如每天、每月),每一個固定的訪問者只代表一個唯一的用戶,與訪問次數無關。獨立訪問者越多,說明網絡營銷的效果卓有成效,是網站評價中最有說服力的評價指標之一。
頁面瀏覽數量:在一定統計周期內所有訪問者瀏覽的頁面數量。
每用戶頁面瀏覽數量:指在一定時間內全部頁面瀏覽數量與該段時間內額所有訪問者數量之比,即一個用戶瀏覽的網頁數量。這一指標表明了訪問者對網站內容或者產品信息感興趣的程度,也就是常說的網站“粘性”。
訪問者的停留時間:包括在頁面的停留時間和在網站的停留時間,該指標能夠反映出用戶對網站中哪些頁面的內容感興趣,能夠幫助進一步對網站進行結構上、內容上的優化。
用戶地理方位:根據用戶的IP地址,再配合IP數據庫得到網站訪問者的地理方位。
用戶入站方式(直連、搜索):該項數據可以確定出用戶進站的方式,幫助網站營銷人員進一步優化網站廣告投放方式,提高網站推廣的效率。
獲得以上數據后,可以根據實際需求進行個性化的數據分析。與數據挖掘技術相結合,可以對用戶信息行為進行進一步研究。
3 實現方式
網站流量分析過程中最重要的是網站流量數據的獲取。通過某種方式獲得網站的訪問記錄,包括訪問量、獨立用戶數量、總用戶數量、頁面瀏覽數、用戶地理方位等等一系列對網站運行分析具有指導性意義的數據記錄。分析數據就是采用某種算法對采集的數據記錄進行綜合分析,從而從數據上把握網站運行的狀態,進而制定下一步運營策略。目前,獲取數據主要有兩種方法:日志分析法和腳本嵌入法。下面簡單介紹一下這兩種方法:
主流的Web服務器軟件如IIS和Apache都具有一套完整靈活的日志系統。以apache的日志文件access.log中的一條記錄為例:127.0.0.1 - - [04/Jun/2007:09:08:13 +0800] \"GET /network_dns/content.html HTTP/1.1\" 304 – 我們可以從中分析出訪問這的IP地址、訪問時間、訪問者所在的時區、訪問方式、用戶請求訪問的內容和用戶使用的應用層協議。日志分析是網站流量分析最簡易、最普遍的方法之一,日志分析的方式僅僅需要對日志文件內容進行數據挖掘工作,所以不受時間地點的限制也不會對服務器的穩定運行造成任何影響。目前有眾多日志分析軟件能夠提供Web流量的數據挖掘和分析工作。比較著名的有:Webtrends、AWStats、Webalizer。不過日志分析方式也存在著一些不足:首先,日志分析僅僅局限于對Web服務器軟件提供的Web運行日志文件進行分析,盡管可以通過日志配置的方式來增加一些重要的數據指標,但Web服務器日志提供的數據指標項目畢竟有限,使得在用戶訪問細節方面很難深入,通常都只是對現有數據進行簡單的匯總,這種模式化的分析結果難以與網絡營銷策略結合起來。第二,對于大型網站來講,日志分析并不方便,可能會耗費分析機的大量CPU資源,數據匯總的速度也受到日志文件大小的影響,長期數據匯總的結果還要占用大量硬盤空間。第三,日志分析難以實現實時的分析,網站管理員必須把日志數據下載到另外一臺分析服務器上進行分析,這樣數據的時效性受到了一定的影響。
除了日志分析法,還可以采用基于Web方式的腳本嵌入式的數據獲取分析方法。這種方法是在需要統計的網站頁面上嵌入一段javascript代碼,該代碼的作用就是向統計分析服務器發送各種統計數據,包括訪問者的各種信息。在服務器端一般具有處理程序來實時存儲和處理javascript代理程序發送過來的數據,大多數分析系統都是采用數據庫來存儲流量統計數據,使用Web的方式向網站管理者提供網站運行報告,形成一整套流量分析系統平臺(如圖1)。

圖1流量統計平臺工作原理圖
以下是腳本嵌入法的分析原理和實現過程。
在被監控Web頁面上設置 js文件,該文件的作用就是獲取訪問者的信息,并將搜集到的訪問者信息寫入到客戶端的cookie當中供服務器程序取用。這些訪問這信息都是與流量統計有關的各種統計指標,比如訪問者操作系統的屏幕分辨率、訪問者入站時間、訪問者瀏覽器安裝各種插件的狀況等一系列數據。以下是一段簡單的js代碼,說明js程序是如何獲取用戶信息的:
//取得用戶數據的函數代碼
function vis_getUrlStat(vis_urlPmv, vis_site, vis_urlDoc, vis_pname, vis_typeClick, vis_vars)
{
var vis_getvars='';
if (vis_vars) {
for (var i in vis_vars){
if (!Array.prototype[i]){
vis_getvars = vis_getvars + 'a_vars['+ escape(i) + ']' + \"=\" + escape(vis_vars[i]);
}
}
}
var vis_da = new Date();
var vis_src = vis_urlPmv;
vis_src += '?url='+escape(vis_urlDoc)+'pagename='+escape(vis_pname)+vis_getvars;
vis_src += 'id='+vis_site+'res='+screen.width+'x'+screen.height+'col='+screen.colorDepth; //訪問者屏幕分辨率情況
vis_src += 'h='+vis_da.getHours()+'m='+vis_da.getMinutes()+'s='+vis_da.getSeconds();//訪問者入站時間
vis_src += 'flash='+vis_fla+'director='+vis_dir+'quicktime='+vis_qt+'realplayer='+vis_rea;
vis_src += 'pdf='+vis_pdf+'windowsmedia='+vis_wma+'java='+vis_jav+'cookie='+vis_cookie;//客戶端瀏覽器安裝插件情況
if ((vis_typeClick) (vis_typeClick != \"\")) vis_src += 'type='+escape(vis_typeClick);
vis_src += 'ref='+escape(vis_rtu);
return vis_src;
}
在訪問流量分析系統上設置數據處理程序程序,該程序的作用是將cookie中的信息進行處理并存入到數據庫中,數據庫操作的一段代碼如下:
//將統計數據插入到數據庫中
$r = query(\"INSERT INTO \".T_VISIT.\" (idsite, idcookie, returning, last_visit_time, server_date, server_time, md5config, referer, os, browser_name, browser_version, resolution, color_depth, pdf, flash, java, javascript, director, quicktime, realplayer, windowsmedia, cookie, local_time, ip, hostname_ext, browser_lang, country, continent, total_pages, total_time, entry_idpage, entry_idpageurl, exit_idpage) VALUES ('$idSite', '$idCookie', '$returningVisitor', CURRENT_TIME(), '$serverDate', '$serverTime', '$md5Config', $refererUrl, '$os', '\".$a_browser['shortName'].\"', '\".$a_browser['version'].\"', '$resolution', '$colorDepth', '$pdf', '$flash','$java', '$javascript', '$director', '$quicktime', '$realPlayer', '$windowsMedia', '$cookieAccept', '$localTime','$ip2long', '$hostExt', '$browserLang', '$country', '$continent', 1, '\".DEFAULT_TIME_PAGE .\"', '$idPage', '$idPageUrl', '$idPage')\");
$idVisit = mysql_insert_id();
腳本嵌入法具有很多優點,同時也有不足之處。它的優點有:
(1)數據全面:可以統計各種數據 甚至包括用戶客戶端軟件的信息、分辨率、逗留時間等一系列指標;
(2)實時遠程查看:網站管理者可以實時進行遠程查看,隨時掌握網站的運行情況;
(3)數據管理方便:通過使用數據庫進行數據的存儲,提高了數據管理的效率,便于流量數據信息的提取和挖掘。
缺點有:
(1)嵌入的js腳本可能會增加一部分Web服務器負擔;
(2)要有一臺專門做分析服務的服務器,增加運營成本,不過,目前互聯網上有眾多提供免費流量分析的網站如google analyse等,可以選擇運行成熟的公司代為管理流量分析系統來解決該問題。
4 存在的問題
基于Web的網站數據統計系統的建立只是整個網站營銷分析的第一步,僅僅應用于流量數據的采集和整理,網絡營銷真正需要的是結合網站自身特點進行更深層次的分析。在流量分析的過程中,經常采用數據挖掘技術來對獲取的流量數據進行歸納和整理,最終分析出對網站營銷具有指導意義的分析結果。這個分析結果一定要與網站具有針對性。
雖然,目前的流量統計系統能夠獲得各種各樣的網站訪問數據,但如果結合互聯網網站服務的多樣性來講,流量統計分析的國內外標準的難以統一致使分析結果沒有可比性,同一的流量分析指標并不是適合所有的網站。
5 結束語
基于Web的網站數據統計系統克服了傳統的簡單的計數分析和日志分析中數據類型相對簡單的弊端。能夠提供豐富的分析指標,網站管理者能夠對用戶的訪問數量,頁面的訪問數量,以至訪問者的來源等一系列數據指標進行統計和管理,進而制定對更加切合實際的網絡營銷規劃。
參考文獻:
[1]蔡巍,王飛龍.政務網站的性能測試與流量分析[J].廈門大學學報, 2004,vol.43(增刊):336-339.
[2]焦蓉梅.淺談網站流量統計分析法[J].科技信息,2007, (6):518.
收稿日期:2008-01-12
作者簡介:李聳(1979-),男,遼寧沈陽人,沈陽理工大學現代教育技術中心助理工程師;房明(1977-),男,遼寧沈陽人,沈陽理工大學現代教育技術中心工程師。