方曉洪 陸濤 吳金成 何建兵
【摘 要】隨著城市公共交通一卡通互聯互通的發展,越來越多的企業重視數據的價值與利用,然而現有的數據挖掘方法已經滿足不了一卡通跨區域多領域的數據應用要求。本文從需求和技術等兩個方面進行分析說明建立基于Hadoop計算模型的城市公共交通一卡通數據挖掘方法的可行性。
【關鍵詞】IC卡;云計算;大數據挖掘;Hadoop
0 引言
公共交通在我國經濟發展與日常生活中占據著非常重要的地位,為了鼓勵與便利市民公共交通出行,大部分城市都采用了發行非接觸式公交IC卡的方式,實現了大眾乘坐公交、地鐵等公共交通的便捷支付。隨著區域經濟一體化融合發展,跨區多領域的應用將是城市公共交通一卡通未來的發展趨勢。廣東嶺南通股份有限公司(下稱“嶺南通公司”)在政府的支持和地市的配合下承擔粵港澳城市公共交通一卡通互聯互通工程建設,致力于打造服務于區域經濟發展的現代公共交通信息化管理平臺。本文將結合嶺南通跨區多領域應用的發展趨勢,分析了基于云平臺的IC卡大數據挖掘的需求,對云計算和大數據挖掘技術進行分析,從而給出相應的一個解決方案。
1 IC卡數據挖掘云平臺需求分析
近年來,我國公交IC卡發展十分迅猛,覆蓋范圍廣泛,卡片發行量巨大,由此而產生的數據量異常龐大,以往基于數據統計的“小數據”模式已經滿足不了現代公共交通信息化應用的需要。隨著信息技術的發展,如今的IT技術已經足夠有條件實現一種新的基于大數據思維模式的人工智能?;贗C卡的大數據挖掘技術不僅可以全面掌握龐大的數據信息,還能對這些有意義、有價值的數據進行專業化的分析與處理,從中挖掘潛藏其中的內在價值,并通過這些價值的利用來提高交通出行效率和管理水平[1]。
通過文獻研究可以發現,國內外已有不少專家學者對IC卡數據分析與利用進行過相關的研究,如James J.(2002年)和Zhao(2004年)先后運用出行鏈的思想結合紐約市公交AFC數據得到了下車站點推到方法;Yves Croissant(2013年)等人基于公交IC卡數據對居民的日常出行行為進行研究以及國內東南大學陳學武等人(2004年)對IC卡數據的采集、分析及應用進行了相關探索。隨著人們對公共交通出行數據重視程度的提高,國內外學者對IC卡數據分析挖掘的研究也越來越多。由上面可以發現國內外有關IC卡數據的研究雖然給后來人提供了重要的理論基礎和寶貴的經驗,但是他們的研究一般僅限于某一個城市或者單一的交通工具或者單一的主題分析與研究,缺乏對跨區域公交數據的相關研究,面對城市共交通一卡通跨區域多領域應用(互聯互通)的發展趨勢,迫切需要建立一種理論來填補這一空白。
2 基于云計算的大數據挖掘技術
數據挖掘旨在發現大量的數據中客觀存在的一些規律,而這種規律需要通過相關技術分析數據才能夠獲得。盡管目前數據處理技術在不斷地提高,但是在數據規模日益增大的背景下,人們對海量數據的快速高效處理又提出了新的需求。隨著公共交通出行比例日益增加和城市公共交通一卡通的跨區多領域應用的發展,日常刷卡公交支付行為產生了海量的公共交通出行數據,規模可達GB、TB、PB級別的數據集隨處可見,傳統的技術要處理這些數據顯得力不從心了。
云計算是當今信息技術產業變革的結果,是對分布式、并行處理和網格計算的進一步發展,它是一種基于互聯網的計算,同時能夠向各種互聯網應用提供硬件服務、基礎架構服務、平臺服務、軟件服務、存儲服務的系統。對用戶來說,云計算可以降低成本、提高了靈活性和擴展性,采用云計算架構模式能夠降低信息系統的復雜性。在云計算的架構中,復雜的計算過程、資源管理都集中在位于“云端”的數據中心層面實現,用戶付費使用云計算產品和服務,無需考慮云端后臺的技術復雜性。
為了解決海量數據計算分析的問題,國內外學者相繼提出了基于集群、基于網格、基于Agent等各種分布式數據挖掘平臺,雖然在一定程度上提高了數據挖掘系統的處理能力,但容易衍生出一些自身難以解決的問題。如果能將云計算融入數據挖掘,通過云平臺的大規模數據并行計算,可以解決海量數據挖掘的效率問題。結合嶺南通數據源的特點,基于云計算的大數據挖掘技術滿足了未來城市公共交通一卡通互聯互通的發展趨勢,建立一個嶺南通“云”平臺系統是順應了這一發展的要求,如圖1所示。
圖1 嶺南通“云”平臺系統架構
3 基于Hadoop的嶺南通數據挖掘云平臺
3.1 Hadoop框架原理
Hadoop是Apache軟件基金會所研發的一個能夠對大量數據進行分布式處理的軟件框架,是GFS和MapReduce的Java實現。Hadoop實現了MapReduce并行編程模型,提供了分布式文件系統HDFS(Hadoop Distributed File System),為分布式計算提供底層存儲支持。一個MapReduce作業由大量Map和Reduce任務組成,它將大規模數據處理作業拆分成若干個獨立運行的Map任務,分配到不同的機器上去執行,生成某種中間格式的文件,再由若干個Reduce任務合并這些中間文件或得最后輸出文件。HDFS是一個由名字節點NameNode和若干個數據節點DataNode的組成。NameNode負責存儲文件系統中的元數據和控制外部客戶的訪問,DataNode用來存放實際的數據。每個文件都被劃分成若干個64M的數據塊,這些數據塊被分散的存儲到各個DataNode上,HDFS為了保證數據的安全性,還會為數據進行備份存儲到不同的機器上。用戶從NameNode那里獲取數據的位置信息后,直接與存放數據塊的DataNode進行通信。
3.2 基于Hadoop 的嶺南通數據挖掘模型
基于Hadoop的嶺南通數據挖掘模型大體上可以分為三層,如圖2所示。
最底層為云計算服務層,提供分布式并行數據處理和大數據的云存儲。分布式存儲為數據保存多份副本保證數據發生災難時不影響用戶的正常使用,提高了數據的安全性。
數據挖掘處理層位于云計算服務層之上,包括大數據的預處理和數據挖掘算法的并行化。數據預處理對形態各異的海量數據進行抽取、轉換、清洗和集成等,預處理后的數據提高了數據挖掘的質量,使挖掘的過程變得更有效、更容易。數據挖掘算法的并行化是大數據挖掘的關鍵,需要進一步深入研究,使得改造后的挖掘算法和并行化策略能直接應用在云計算平臺上的挖掘任務。
最頂層是面向各類用戶的用戶層。改成主要接受各類用戶啊的請求,并將其傳遞給中層和底層,最后將最終的數據挖掘結果展示給用戶。用戶可以通過可視化的界面監視任務的執行,并且方便的查看執行結果。
基于云計算的大數據挖掘模式是大數據挖掘的主流方式?;谠朴嬎愕拇髷祿诰蚍漳軌驗椴煌幠5钠髽I應用,使得各類用戶能夠方便地定制和提交數據挖掘任務,直接使用數據挖掘能力,不必關心數據挖掘具體執行者,挖掘數據存在的隱藏價值。
4 結束語
本文從城市共交通一卡通發展需求分析,可以發現基于云計算的大數據挖掘技術是合理和可行的。利用Hadoop的分布式文件系統靈活擴展的特性可以解決公交一卡通公司快速增加的數據存儲問題。利用基于Hadoop的嶺南通數據挖掘模型在面向大眾、企業內部管理和政府決策方面的對應數據分析與利用能夠發揮極大的優勢,對打造區域城市公共交通一卡通信息服務平臺具有很大的幫助和應用前景。
【參考文獻】
[1]顧建國.走進大數據時代的常州智慧公交:專訪常州市公共交通集團公司董事長、總經理蔡健臣[J].人民公交,2013(07):24-32.
[2]洑云龍.云平臺下的數據挖掘研究[D].南京:南京郵電大學,2013.
[3]楊來,史忠植,梁帆.基于Hadoop云平臺的并行數據挖掘方法[J].系統仿真學報,2013,25(05):936-944.
[4]韓艷,關宏志,嚴海.公交IC卡數據分析處理方法[J].交通標準化,2010(19):14-18.
[5]羅華群,易國平.校園一卡通數據的挖掘與應用[J].科技信息,2010(01): 41-42.
[責任編輯:孫珊珊]
【摘 要】隨著城市公共交通一卡通互聯互通的發展,越來越多的企業重視數據的價值與利用,然而現有的數據挖掘方法已經滿足不了一卡通跨區域多領域的數據應用要求。本文從需求和技術等兩個方面進行分析說明建立基于Hadoop計算模型的城市公共交通一卡通數據挖掘方法的可行性。
【關鍵詞】IC卡;云計算;大數據挖掘;Hadoop
0 引言
公共交通在我國經濟發展與日常生活中占據著非常重要的地位,為了鼓勵與便利市民公共交通出行,大部分城市都采用了發行非接觸式公交IC卡的方式,實現了大眾乘坐公交、地鐵等公共交通的便捷支付。隨著區域經濟一體化融合發展,跨區多領域的應用將是城市公共交通一卡通未來的發展趨勢。廣東嶺南通股份有限公司(下稱“嶺南通公司”)在政府的支持和地市的配合下承擔粵港澳城市公共交通一卡通互聯互通工程建設,致力于打造服務于區域經濟發展的現代公共交通信息化管理平臺。本文將結合嶺南通跨區多領域應用的發展趨勢,分析了基于云平臺的IC卡大數據挖掘的需求,對云計算和大數據挖掘技術進行分析,從而給出相應的一個解決方案。
1 IC卡數據挖掘云平臺需求分析
近年來,我國公交IC卡發展十分迅猛,覆蓋范圍廣泛,卡片發行量巨大,由此而產生的數據量異常龐大,以往基于數據統計的“小數據”模式已經滿足不了現代公共交通信息化應用的需要。隨著信息技術的發展,如今的IT技術已經足夠有條件實現一種新的基于大數據思維模式的人工智能?;贗C卡的大數據挖掘技術不僅可以全面掌握龐大的數據信息,還能對這些有意義、有價值的數據進行專業化的分析與處理,從中挖掘潛藏其中的內在價值,并通過這些價值的利用來提高交通出行效率和管理水平[1]。
通過文獻研究可以發現,國內外已有不少專家學者對IC卡數據分析與利用進行過相關的研究,如James J.(2002年)和Zhao(2004年)先后運用出行鏈的思想結合紐約市公交AFC數據得到了下車站點推到方法;Yves Croissant(2013年)等人基于公交IC卡數據對居民的日常出行行為進行研究以及國內東南大學陳學武等人(2004年)對IC卡數據的采集、分析及應用進行了相關探索。隨著人們對公共交通出行數據重視程度的提高,國內外學者對IC卡數據分析挖掘的研究也越來越多。由上面可以發現國內外有關IC卡數據的研究雖然給后來人提供了重要的理論基礎和寶貴的經驗,但是他們的研究一般僅限于某一個城市或者單一的交通工具或者單一的主題分析與研究,缺乏對跨區域公交數據的相關研究,面對城市共交通一卡通跨區域多領域應用(互聯互通)的發展趨勢,迫切需要建立一種理論來填補這一空白。
2 基于云計算的大數據挖掘技術
數據挖掘旨在發現大量的數據中客觀存在的一些規律,而這種規律需要通過相關技術分析數據才能夠獲得。盡管目前數據處理技術在不斷地提高,但是在數據規模日益增大的背景下,人們對海量數據的快速高效處理又提出了新的需求。隨著公共交通出行比例日益增加和城市公共交通一卡通的跨區多領域應用的發展,日常刷卡公交支付行為產生了海量的公共交通出行數據,規模可達GB、TB、PB級別的數據集隨處可見,傳統的技術要處理這些數據顯得力不從心了。
云計算是當今信息技術產業變革的結果,是對分布式、并行處理和網格計算的進一步發展,它是一種基于互聯網的計算,同時能夠向各種互聯網應用提供硬件服務、基礎架構服務、平臺服務、軟件服務、存儲服務的系統。對用戶來說,云計算可以降低成本、提高了靈活性和擴展性,采用云計算架構模式能夠降低信息系統的復雜性。在云計算的架構中,復雜的計算過程、資源管理都集中在位于“云端”的數據中心層面實現,用戶付費使用云計算產品和服務,無需考慮云端后臺的技術復雜性。
為了解決海量數據計算分析的問題,國內外學者相繼提出了基于集群、基于網格、基于Agent等各種分布式數據挖掘平臺,雖然在一定程度上提高了數據挖掘系統的處理能力,但容易衍生出一些自身難以解決的問題。如果能將云計算融入數據挖掘,通過云平臺的大規模數據并行計算,可以解決海量數據挖掘的效率問題。結合嶺南通數據源的特點,基于云計算的大數據挖掘技術滿足了未來城市公共交通一卡通互聯互通的發展趨勢,建立一個嶺南通“云”平臺系統是順應了這一發展的要求,如圖1所示。
圖1 嶺南通“云”平臺系統架構
3 基于Hadoop的嶺南通數據挖掘云平臺
3.1 Hadoop框架原理
Hadoop是Apache軟件基金會所研發的一個能夠對大量數據進行分布式處理的軟件框架,是GFS和MapReduce的Java實現。Hadoop實現了MapReduce并行編程模型,提供了分布式文件系統HDFS(Hadoop Distributed File System),為分布式計算提供底層存儲支持。一個MapReduce作業由大量Map和Reduce任務組成,它將大規模數據處理作業拆分成若干個獨立運行的Map任務,分配到不同的機器上去執行,生成某種中間格式的文件,再由若干個Reduce任務合并這些中間文件或得最后輸出文件。HDFS是一個由名字節點NameNode和若干個數據節點DataNode的組成。NameNode負責存儲文件系統中的元數據和控制外部客戶的訪問,DataNode用來存放實際的數據。每個文件都被劃分成若干個64M的數據塊,這些數據塊被分散的存儲到各個DataNode上,HDFS為了保證數據的安全性,還會為數據進行備份存儲到不同的機器上。用戶從NameNode那里獲取數據的位置信息后,直接與存放數據塊的DataNode進行通信。
3.2 基于Hadoop 的嶺南通數據挖掘模型
基于Hadoop的嶺南通數據挖掘模型大體上可以分為三層,如圖2所示。
最底層為云計算服務層,提供分布式并行數據處理和大數據的云存儲。分布式存儲為數據保存多份副本保證數據發生災難時不影響用戶的正常使用,提高了數據的安全性。
數據挖掘處理層位于云計算服務層之上,包括大數據的預處理和數據挖掘算法的并行化。數據預處理對形態各異的海量數據進行抽取、轉換、清洗和集成等,預處理后的數據提高了數據挖掘的質量,使挖掘的過程變得更有效、更容易。數據挖掘算法的并行化是大數據挖掘的關鍵,需要進一步深入研究,使得改造后的挖掘算法和并行化策略能直接應用在云計算平臺上的挖掘任務。
最頂層是面向各類用戶的用戶層。改成主要接受各類用戶啊的請求,并將其傳遞給中層和底層,最后將最終的數據挖掘結果展示給用戶。用戶可以通過可視化的界面監視任務的執行,并且方便的查看執行結果。
基于云計算的大數據挖掘模式是大數據挖掘的主流方式?;谠朴嬎愕拇髷祿诰蚍漳軌驗椴煌幠5钠髽I應用,使得各類用戶能夠方便地定制和提交數據挖掘任務,直接使用數據挖掘能力,不必關心數據挖掘具體執行者,挖掘數據存在的隱藏價值。
4 結束語
本文從城市共交通一卡通發展需求分析,可以發現基于云計算的大數據挖掘技術是合理和可行的。利用Hadoop的分布式文件系統靈活擴展的特性可以解決公交一卡通公司快速增加的數據存儲問題。利用基于Hadoop的嶺南通數據挖掘模型在面向大眾、企業內部管理和政府決策方面的對應數據分析與利用能夠發揮極大的優勢,對打造區域城市公共交通一卡通信息服務平臺具有很大的幫助和應用前景。
【參考文獻】
[1]顧建國.走進大數據時代的常州智慧公交:專訪常州市公共交通集團公司董事長、總經理蔡健臣[J].人民公交,2013(07):24-32.
[2]洑云龍.云平臺下的數據挖掘研究[D].南京:南京郵電大學,2013.
[3]楊來,史忠植,梁帆.基于Hadoop云平臺的并行數據挖掘方法[J].系統仿真學報,2013,25(05):936-944.
[4]韓艷,關宏志,嚴海.公交IC卡數據分析處理方法[J].交通標準化,2010(19):14-18.
[5]羅華群,易國平.校園一卡通數據的挖掘與應用[J].科技信息,2010(01): 41-42.
[責任編輯:孫珊珊]
【摘 要】隨著城市公共交通一卡通互聯互通的發展,越來越多的企業重視數據的價值與利用,然而現有的數據挖掘方法已經滿足不了一卡通跨區域多領域的數據應用要求。本文從需求和技術等兩個方面進行分析說明建立基于Hadoop計算模型的城市公共交通一卡通數據挖掘方法的可行性。
【關鍵詞】IC卡;云計算;大數據挖掘;Hadoop
0 引言
公共交通在我國經濟發展與日常生活中占據著非常重要的地位,為了鼓勵與便利市民公共交通出行,大部分城市都采用了發行非接觸式公交IC卡的方式,實現了大眾乘坐公交、地鐵等公共交通的便捷支付。隨著區域經濟一體化融合發展,跨區多領域的應用將是城市公共交通一卡通未來的發展趨勢。廣東嶺南通股份有限公司(下稱“嶺南通公司”)在政府的支持和地市的配合下承擔粵港澳城市公共交通一卡通互聯互通工程建設,致力于打造服務于區域經濟發展的現代公共交通信息化管理平臺。本文將結合嶺南通跨區多領域應用的發展趨勢,分析了基于云平臺的IC卡大數據挖掘的需求,對云計算和大數據挖掘技術進行分析,從而給出相應的一個解決方案。
1 IC卡數據挖掘云平臺需求分析
近年來,我國公交IC卡發展十分迅猛,覆蓋范圍廣泛,卡片發行量巨大,由此而產生的數據量異常龐大,以往基于數據統計的“小數據”模式已經滿足不了現代公共交通信息化應用的需要。隨著信息技術的發展,如今的IT技術已經足夠有條件實現一種新的基于大數據思維模式的人工智能?;贗C卡的大數據挖掘技術不僅可以全面掌握龐大的數據信息,還能對這些有意義、有價值的數據進行專業化的分析與處理,從中挖掘潛藏其中的內在價值,并通過這些價值的利用來提高交通出行效率和管理水平[1]。
通過文獻研究可以發現,國內外已有不少專家學者對IC卡數據分析與利用進行過相關的研究,如James J.(2002年)和Zhao(2004年)先后運用出行鏈的思想結合紐約市公交AFC數據得到了下車站點推到方法;Yves Croissant(2013年)等人基于公交IC卡數據對居民的日常出行行為進行研究以及國內東南大學陳學武等人(2004年)對IC卡數據的采集、分析及應用進行了相關探索。隨著人們對公共交通出行數據重視程度的提高,國內外學者對IC卡數據分析挖掘的研究也越來越多。由上面可以發現國內外有關IC卡數據的研究雖然給后來人提供了重要的理論基礎和寶貴的經驗,但是他們的研究一般僅限于某一個城市或者單一的交通工具或者單一的主題分析與研究,缺乏對跨區域公交數據的相關研究,面對城市共交通一卡通跨區域多領域應用(互聯互通)的發展趨勢,迫切需要建立一種理論來填補這一空白。
2 基于云計算的大數據挖掘技術
數據挖掘旨在發現大量的數據中客觀存在的一些規律,而這種規律需要通過相關技術分析數據才能夠獲得。盡管目前數據處理技術在不斷地提高,但是在數據規模日益增大的背景下,人們對海量數據的快速高效處理又提出了新的需求。隨著公共交通出行比例日益增加和城市公共交通一卡通的跨區多領域應用的發展,日常刷卡公交支付行為產生了海量的公共交通出行數據,規??蛇_GB、TB、PB級別的數據集隨處可見,傳統的技術要處理這些數據顯得力不從心了。
云計算是當今信息技術產業變革的結果,是對分布式、并行處理和網格計算的進一步發展,它是一種基于互聯網的計算,同時能夠向各種互聯網應用提供硬件服務、基礎架構服務、平臺服務、軟件服務、存儲服務的系統。對用戶來說,云計算可以降低成本、提高了靈活性和擴展性,采用云計算架構模式能夠降低信息系統的復雜性。在云計算的架構中,復雜的計算過程、資源管理都集中在位于“云端”的數據中心層面實現,用戶付費使用云計算產品和服務,無需考慮云端后臺的技術復雜性。
為了解決海量數據計算分析的問題,國內外學者相繼提出了基于集群、基于網格、基于Agent等各種分布式數據挖掘平臺,雖然在一定程度上提高了數據挖掘系統的處理能力,但容易衍生出一些自身難以解決的問題。如果能將云計算融入數據挖掘,通過云平臺的大規模數據并行計算,可以解決海量數據挖掘的效率問題。結合嶺南通數據源的特點,基于云計算的大數據挖掘技術滿足了未來城市公共交通一卡通互聯互通的發展趨勢,建立一個嶺南通“云”平臺系統是順應了這一發展的要求,如圖1所示。
圖1 嶺南通“云”平臺系統架構
3 基于Hadoop的嶺南通數據挖掘云平臺
3.1 Hadoop框架原理
Hadoop是Apache軟件基金會所研發的一個能夠對大量數據進行分布式處理的軟件框架,是GFS和MapReduce的Java實現。Hadoop實現了MapReduce并行編程模型,提供了分布式文件系統HDFS(Hadoop Distributed File System),為分布式計算提供底層存儲支持。一個MapReduce作業由大量Map和Reduce任務組成,它將大規模數據處理作業拆分成若干個獨立運行的Map任務,分配到不同的機器上去執行,生成某種中間格式的文件,再由若干個Reduce任務合并這些中間文件或得最后輸出文件。HDFS是一個由名字節點NameNode和若干個數據節點DataNode的組成。NameNode負責存儲文件系統中的元數據和控制外部客戶的訪問,DataNode用來存放實際的數據。每個文件都被劃分成若干個64M的數據塊,這些數據塊被分散的存儲到各個DataNode上,HDFS為了保證數據的安全性,還會為數據進行備份存儲到不同的機器上。用戶從NameNode那里獲取數據的位置信息后,直接與存放數據塊的DataNode進行通信。
3.2 基于Hadoop 的嶺南通數據挖掘模型
基于Hadoop的嶺南通數據挖掘模型大體上可以分為三層,如圖2所示。
最底層為云計算服務層,提供分布式并行數據處理和大數據的云存儲。分布式存儲為數據保存多份副本保證數據發生災難時不影響用戶的正常使用,提高了數據的安全性。
數據挖掘處理層位于云計算服務層之上,包括大數據的預處理和數據挖掘算法的并行化。數據預處理對形態各異的海量數據進行抽取、轉換、清洗和集成等,預處理后的數據提高了數據挖掘的質量,使挖掘的過程變得更有效、更容易。數據挖掘算法的并行化是大數據挖掘的關鍵,需要進一步深入研究,使得改造后的挖掘算法和并行化策略能直接應用在云計算平臺上的挖掘任務。
最頂層是面向各類用戶的用戶層。改成主要接受各類用戶啊的請求,并將其傳遞給中層和底層,最后將最終的數據挖掘結果展示給用戶。用戶可以通過可視化的界面監視任務的執行,并且方便的查看執行結果。
基于云計算的大數據挖掘模式是大數據挖掘的主流方式。基于云計算的大數據挖掘服務能夠為不同規模的企業應用,使得各類用戶能夠方便地定制和提交數據挖掘任務,直接使用數據挖掘能力,不必關心數據挖掘具體執行者,挖掘數據存在的隱藏價值。
4 結束語
本文從城市共交通一卡通發展需求分析,可以發現基于云計算的大數據挖掘技術是合理和可行的。利用Hadoop的分布式文件系統靈活擴展的特性可以解決公交一卡通公司快速增加的數據存儲問題。利用基于Hadoop的嶺南通數據挖掘模型在面向大眾、企業內部管理和政府決策方面的對應數據分析與利用能夠發揮極大的優勢,對打造區域城市公共交通一卡通信息服務平臺具有很大的幫助和應用前景。
【參考文獻】
[1]顧建國.走進大數據時代的常州智慧公交:專訪常州市公共交通集團公司董事長、總經理蔡健臣[J].人民公交,2013(07):24-32.
[2]洑云龍.云平臺下的數據挖掘研究[D].南京:南京郵電大學,2013.
[3]楊來,史忠植,梁帆.基于Hadoop云平臺的并行數據挖掘方法[J].系統仿真學報,2013,25(05):936-944.
[4]韓艷,關宏志,嚴海.公交IC卡數據分析處理方法[J].交通標準化,2010(19):14-18.
[5]羅華群,易國平.校園一卡通數據的挖掘與應用[J].科技信息,2010(01): 41-42.
[責任編輯:孫珊珊]