黃國賢
摘要 在大數據的獲取、分析與應用的時代,運用移動互聯網APP進行開發用戶的企業和個人不斷增多。對APP用戶的行為和需求分析是成敗的關鍵所在,因此,創建移動互聯網APP數據倉庫成為必然的選擇。本文對于移動互聯網APP數據倉庫的應用實踐進行了探討和研究。
關鍵詞 移動互聯網APP;數據倉庫;應用;研究
中圖分類號TP3
文獻標識碼A
文章編號1674-6708(2016)156-0067-01
在互聯網快速發展的今天,數據倉庫作為數據挖掘與儲存的支撐平臺得到了廣泛的運用。在數據倉庫中人們的行為數據都將被記錄積累下來,為分析者提供了良好的信息渠道和數據支撐。移動互聯網APP具有用戶流量較小、變化迅速、數據雜亂等特點,因此,使用市面上已有的大型數據倉庫并不合適,可為其開發小型數據倉庫,對移動互聯網APP的用戶進行有效的數據積累與分析。
1 移動互聯網APP數據倉庫的應用需求
對于移動互聯網APP數據的記錄與挖掘,需要結合APP自身以及其用戶使用規律的特點。首先,移動互聯網APP自身數據規模較小,因此,其數據倉庫也需要具備小巧、靈活的特點,不需要太大的存儲空間,但能及時對數據進行靈活的反映。其次,移動互聯網APP的數據規律并不穩定,需要數據庫及時頻繁上傳數據,能夠對當日的數據盡快做出分析,讓APP的開發者有充足的時間對數據的變化做出反應。最后,數據倉庫的可靠性和有效性不可忽視,不能遺失有效數據,同時保證所上傳給APP開發者的數據與前端數據在數量、參數和信息維度上保持高度一致,確保數據的及時準確有效。
2 移動互聯網APP數據倉庫的設計思路分析
對于移動互聯網APP的數據倉庫設計思路結合了APP用戶的使用特點和數據規律。首先,用戶使用APP過程中所展現的信息狀態,表現為關系型的數據聯系,包括:用戶個人信息,粉絲數目,與其他用戶的互動,登錄時間的規律規則等。因此,對于數據的統計和整理工作,需要利用它們之間的兼容性以及數據庫的主從關系,將數據自動地同步到所建立的數據倉庫中。其次,在APP用戶的使用過程中,每當用戶進行一次操作,便會在服務器端產生一條用戶的行為日志。它們往往以日志文件的方式存儲下來,規模較大、隨意性較強。因此,對于這類數據,需要每間隔一個特定的時間便將他們錄入到數據倉庫中。在數據轉化過程中,注意數據的整齊性和有效性,以及改變格式的失真風險。此外,對于在客戶端產生的數據,其數據存在形式往往具有無規則、隨機性強的特點,但這樣的數據形式可以用來展現用戶對APP的使用全貌。對于此類數據,需要將其完整地體現出來,可用于分析用戶的使用規則,摸索用戶體驗的實際操作。最后,在前端數據錄入數據倉庫后,還需要對其進行檢驗,包括檢驗數據的一致性,是否存在多余參數和無效格式等。
3 數據倉庫在投入使用中的應用實踐
3.1 移動互聯網APP數據倉庫收集到的數據情況
在移動互聯網APP數據倉庫的投入使用過程中,經過數據遷移,原始數據主要形成了以下3種數據形式:1)同步到集成前端數據庫中的數據。這一部分的數據,是沒有經過加工直接同步到位的數據。它們是即時性的,具有自動同步功能,在任何時刻進行查詢都可以獲取實時數據資料。但由于經過的整理較少,因此,這個數據庫中的數據,并不利于整體信息的收錄和分析,更適合即時性的資料查詢。2)來自服務器的集成數據。這些數據是經過格式化的,收錄在數據倉庫中提前建好的格式匹配的數據表中。由于用戶的資料和行為日志是不斷地生成并更新的,因此,這部分的數據資料是每隔一段時間(通常由自己設定)自動收集上來的。在收錄這部分資料前,系統會對于之前的信息進行切斷式的總結,以防止丟失必要的數據資料。格式化的服務器日志數據,比直接集成的數據資料所占空間更大,因此,這部分數據庫的規模,比集成前端的數據庫規模大十倍左右。同時,因為其采用截斷式的數據收集方式,為了避免前端數據被影響,數據的導入時間一般設定在服務器較為空閑的時刻。3)來自客戶端的集成日志。來自客戶端的操作日志,具備有序性、不完整性,它們是非格式化的數據。為保證其完整和規范,需要在導入到數據倉庫前,集中對其進行格式化的操作。首先,需要進行數據清理和補齊。因為這部分數據在收錄過程中會收錄到系統自動生成的日志或者機器人操作產生的日志,因此,需要根據APP自身的特點,進行數據清理。而部分數據會有缺失字段的現象,通過設置,可以對發生字段缺失的數據進行補齊。然后,對數據進行格式化處理,將所有字段進行整理,形成統一完整的文本。最后,在數據倉庫中建立好與格式相匹配的數據表,將格式化后的數據信息導入到數據倉庫中。
3.2 數據倉庫對于數據的存儲管理情況
移動互聯網APP數據倉庫對于數據的存儲和管理方式決定了其對外表現數據的形式,這部分正是數據倉庫運行的關鍵。APP數據倉庫的組織管理方式主要表現在以下3個方面:1)利用關系數據庫系統。對于大規模的數據存儲,保證其有序性及可操作性的關鍵在于關系數據庫系統對數據的管理,隨著時間的積累,數據也不斷增多,關系數據庫系統仍可以保持數據倉庫的穩定性和有效性。2)并發操作技術的運用。由于用戶訪問系統數據短小密集,數據與數據之間多處于并行狀態,這時需要并行操作,使用戶的需求得以均勻分擔,不會造成數據堵車。除此之外,對于整體信息數據,并行操作系統還能做到對所查詢的信息進行分解并行,對查詢數據進行分割處理,使數據信息得以有效利用。3)優化決策支持查詢。移動互聯網APP數據倉庫的關系數據庫系統對于決策支持查詢有所欠缺,但結合優化查詢器、數據庫索引機制、數據連接策略等多部分的使用,決策支持查詢逐步得到優化。從基礎的通用查詢到決策優化查詢,移動互聯網APP數據倉庫的管理功能正在逐漸強化,并逐步向支持多維度分析查詢進步發展。
3.3 移動互聯網APP數據倉庫的數據表現
數據倉庫最根本的功能便是對于數據的表現,通過其反映的數據狀況,開發者才能采取相應的應對措施。現存的移動互聯網APP數據倉庫對于數據的表現形式主要集中在:多項數據的挖掘、數理統計與分析以及數據行為多維分析等方面。在數據倉庫的應用當中,多維分析起到的作用最為強大,可以有效幫助開發者進行多角度的比較;數理統計的應用最為廣泛,有效利用即可獲取十分可觀的效益。
4 結論
綜上所述,移動互聯網APP數據倉庫的使用可以為開發者提供有效的參考信息。數據倉庫在數據的挖掘和表現中都具備強大的性能和使用價值,并且其投入較小,是性價比較高的輔助系統。在數據挖掘與分析方面,移動互聯網APP也有很大的進步空間,需要研發者對其進行不斷的創新,使其充分發揮潛能,提供更有價值的信息。