999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于運單及POI數據的快遞企業客戶發現方法

2021-02-07 01:04:58黃玉萍鄭夢飛
物流技術 2021年1期
關鍵詞:信息

黃玉萍,鄭夢飛,謝 翔

(中國郵政集團有限公司郵政研究中心 郵政智能裝備工程技術研究中心,北京 100096)

0 引言

快遞運單是快遞包裹的唯一標識代碼,通過單號查詢可以實時跟蹤快件的物流信息。在互聯網高度發達的今天,利用網絡爬蟲可以獲得大量的快遞運單的物流信息,基于該信息可對相應快遞包裹業務進行精細分析,如:時限分析、營業網點位置分析、網絡路由分析等[1]。

POI(Point Of Information)又稱為興趣點,數據源于地圖導航服務,具有空間坐標和屬性信息,是一種表征真實地理空間實體的數據集,具有精度高、覆蓋廣、更新快、易獲取的數據特點。每一個POI 點在空間上都可以代表一個功能要素,可以是一棟房子、一個商鋪、一個郵筒、一個公交站等。近幾年隨著互聯網上POI數據的開放使用,眾多學者開始探索POI數據在相關領域的應用,如郭昭以東莞市POI數據為基礎,研究了基于POI數據的城市功能空間識別及中心城區功能復合測算方法[2]。中國測繪科學研究院曹元暉以POI數據為主要信息源,為建筑物內部及周邊一定區域范圍內的POI賦予反距離權重,通過計算不同類型POI 的加權頻數密度比例來識別建筑物功能類型[3]。廣州市交通規劃研究院的宋程基于POI、收集信令數據、互聯網位置數據等多源數據進行了城市活力區和中心城區邊界識別研究[4]。

進入二十一世紀,中國快遞繼續保持高速增長,市場規模日益壯大,市場上的各個競爭主體——快遞企業,它們對市場的爭奪日趨白熱化。因此,各個企業如何在競爭白熱化的市場中爭取新客戶、留住客戶,對企業的生存與發展具有重大的意義[5-7]。

本文研究了通過網絡爬蟲采集快遞運單,從運單信息中抽取快遞網點周邊POI信息,從而發現潛在快遞客戶資源的方法。并以某快遞公司為例,研究了其在北京地區的客戶資源分布狀況。本文的研究結果可以為其市場開拓提供輔助支撐。

1 數據源及數據獲取

1.1 數據源

本研究所采用的數據來源于通過快遞單號查詢獲得的快遞包裹軌跡信息,“快遞100”網站可提供不同快遞公司快遞單號的實時查詢,因此,本研究選擇了“快遞100”網站作為快遞運單數據的來源。本文的數據獲取對象為某快遞公司在北京地區的快遞運單數據,數據采集時段從2019 年12 月至2020 年5月,采集內容包括:單號信息、時間信息、業務內容、地點信息,累積采集2 000萬條運單數據。

1.2 運單數據獲取

從互聯網上采集大量的運單數據,需要使用網絡爬蟲來實現[8-10]。網絡爬蟲是一個可以實現定向抓取互聯網上特定頁面內容的程序,從技術層面來說就是通過程序模擬瀏覽器請求站點的行為,把站點返回的HTML 代碼、JSON 數據、圖片、視頻等爬到本地,進而提取自己需要的數據,存放起來使用。

網絡爬蟲工作首先明確要爬取的網站和數據,選擇合適的方法來抓取數據,再將解析下載下來的網頁和價值數據持久化,保存到數據庫中。網絡爬蟲的基本工作流程如圖1所示。

圖1 網絡爬蟲工作流程圖

在抓取運單數據時,需要提供運單號,在本研究中,以一個真實的快遞運單號為種子單號,按照一定的算法生成單號隊列,按隊列中的單號信息查詢運單數據,生成運單數據表。其中,編程語言為Python 3,在PyCharm 集成環境下開發,數據庫為Mysql 8.0+。接口測試工具為Fiddler,數據通過json進行交換。

1.3 運單數據結構

圖2為某快遞公司快遞產品的物流軌跡,我們將包含快遞單號,物流信息及時間的數據稱為該快遞的運單信息(簡稱運單),基于運單可以了解每一件快遞產品的物流軌跡,通過對物流軌跡的分析,可以推測快遞產品的收寄地及相應的客戶分部狀況。

圖2 快遞運單

為了提高數據的存儲與檢索效率,建立運單表,包含運單號、作業時間、業務信息、作業地點,見表1。

表1 運單表結構

2 基于運單的營業網點分析

2.1 數據處理

2.1.1 數據去重。如前文所述,本研究中運單號是基于“母單號”自動生成的,由于“母單號”不唯一,因而生成的采集單號序列間存在單號重復的問題,導致運單表中會存在一定數量的重復記錄。為了保證數據庫中記錄的唯一性,在進行數據分析之前,需要結合單號、時間組合條件對運單表進行去重處理。

2.1.2 異常值處理。本研究進行了為期6個月的數據準備,采集了某快遞公司2019年12月至2020年6月間的2000萬運單數據。由于數據采集是基于對運單號的“試錯”,即如果該運單號真實存在就返回信息,不存在就放棄,重新采集單號隊列中的下一運單,所以采集的數據存在采樣不連續的特點,如圖3所示。

圖3 采樣數據日分布圖

為了避免因數據不連續帶來的統計失真,從整體數據集中選擇2019年12月、2020年3月、2020年4月、2020年5月的數據作為分析樣本。

2.2 獲取營業網點名稱及地址

快遞公司的服務對象是其營業網點周邊的商超、住宅小區、辦公樓,即其潛在客戶分布在營業網點的周邊。要了挖掘快遞公司的客戶群體,需要先確定其末端營業網點的名稱和地址。從運單表中按“citi”+“info=攬收”條件進行查詢,可獲得該快遞公司在北京地區的營業網點名稱。查詢代碼如下:

在高德地圖開放平臺對網點名稱進行查詢,可獲得網點的結構化地址,如圖4所示。

圖4 網點地址

2.3 確定目標網點

客戶資源的價值,可以通過與其有業務往來的網點業務量大小來衡量。為了發掘有價值的客戶資源,需要對網點進行分類,將同一統計時內業務量大的網點定義為優質網點。優質網點客戶資源豐富,具有客戶資源挖掘的意義。通過對所采集數據的分析,得出同一時間段內該快遞公司90%以上的業務量集中在42個營業網點(如圖5所示),因此,將這42個營業網點作為客戶資源挖掘的目標,對其進行客戶資源的挖掘。

2.4 網點地理編碼

地理編碼,又稱為地址匹配,是從已知的結構化地址描述到對應的經緯度坐標的轉換過程。根據給定的地理名稱和查詢城市,返回地理編碼的結果列表。顯示效果如圖6所示。

3 POI數據獲取及客戶資源挖掘

高德地圖提供千萬級別的POI數據,所有數據均按三級分類,層次清晰,精度較高。POI 數據的標簽基本涵蓋了所有的設施類型,見表2。

圖5 網點同一時期業務量占比

圖6 地理編碼圖

表2 POI類別標簽

利用POI 數據,可以實現客戶資源挖掘,具體方法如下:(1)利用高德地圖開放平臺,獲得網點的地址編碼。(2)以網點為核心,搜尋一定半徑范圍內的POI 信息。(3)借助POI 對網點周邊地理信息進行分類,識別客戶資源。

高德開放平臺提供多種查詢POI信息的功能,其中包括關鍵字搜索、周邊搜索、多邊形搜索、ID 查詢四種篩選機制。本文所使用的POI 數據基于高德API 開放接口,采取周邊搜索中的關鍵字搜索和POI類型搜索方法,運用Python 編程語言編寫網絡爬取工具獲取數據并輸出。實現方法如下:

http://restapi.amap.com/v3/place/around?key=您的key&location=116.409692,39.97118&keywords= 北京&types=011100&radius=2000&offset=20&page=1&ex -tensions=all&output=json

說明:location(116.409692,39.97118)是需要查詢的中心點,keywords(北京)指定搜索城市為“北京”,types(011100)為搜索返回的POI 數據類型,radius(2000)指定搜索半徑為2km,extensions(all)為返回的數據內容,參數output(json)用于指定返回數據的格式,key是用戶請求數據的身份標識。

返回的數據為

說明:POI 點的信息都在pois 中。name 表示名稱,type 表示的類型,address 指出地址,location 表示具體的經緯度,adname 表示所屬行政區域(區縣級別),business_area表示所在商圈。

4 應用實例

從互聯網上采集某快遞公司近2 000 萬條運單信息,對其在北京地區的網點布局及客戶資源情況進行分析挖掘,研究結果如下:

4.1 確定網點位置并進行地址編碼

采用前述對運單數據的分析方法,得到該快遞公司在北京地區共有184個營業網點,在北京各個區的網點數據分布見表3。

表3 北京各區網點數量

利用高德地圖可獲得各個網點的地址編碼。圖7 為在高德地圖上標記的該公司在北京朝陽區營業網點的位置信息。

圖7 朝陽區營業網網點

4.2 確定目標網點

利用所描述的方法,對樣本數據進行分析后發現,該公司在北京地區的90%的業務量集中在42 個營業網點,因此把這42 營業網點作為客戶資源挖掘的目標。目標網點的分布情況見表4。

表4 北京各區目標網點數量

其中朝陽區的目標網點分布情況如圖8所示。

4.3 POI數據獲取及客戶資源挖掘

利用目標網點地址編碼,可從高德地圖開放平臺獲得網點周邊POI 數據,對網點周邊POI 進行分類,進行客戶資源挖掘。圖9為對網點(116.409 692,39.971 18)周邊2km 范圍內的POI 查詢結果,基于該結果可獲取客戶名稱和詳細地址,為市場推廣提供輔助支撐。

圖8 朝陽區目標網點分布圖

圖9 POI查詢結果示例

5 結語

(1)通過對快遞運單的分析,可以獲取快遞公司的營業網點的名稱,利用高德地圖開放平臺可以查詢營業網點地址編碼,進而可以獲得網點周邊一定范圍內的POI 數據,對POI 數據進行分類,可以發現潛在的快遞客戶。

(2)用來分析的運單數據是通過互聯網采集的,因數據采集的算法為“基于運單號試錯”的方法,因此,采集的數據可能存在重復或數據分布不均勻的情況,在進行數據分析前必須對網絡采集數據進行去重和去除異常值處理,避免由于所采集的數據樣本存在偏差導致分析結果出現偏差。

(3)本文研究的客戶發現方法適用于攬收商務件、經濟件等業務場景,針對電商件客戶的挖掘不在本方法研究范圍之內。

猜你喜歡
信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息超市
大眾創業(2009年10期)2009-10-08 04:52:00
展會信息
展會信息
展會信息
展會信息
展會信息
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 亚洲婷婷在线视频| 亚洲性视频网站| 高清码无在线看| 亚洲国产综合精品中文第一| 欧美中文字幕在线二区| 99伊人精品| 日韩中文精品亚洲第三区| 97se亚洲综合在线天天| 中文字幕永久在线观看| 1024你懂的国产精品| 无码啪啪精品天堂浪潮av| 试看120秒男女啪啪免费| 久久 午夜福利 张柏芝| 美女扒开下面流白浆在线试听 | 9啪在线视频| 国产精欧美一区二区三区| 国产亚洲精品无码专| 国语少妇高潮| 日本高清有码人妻| 亚洲天堂网2014| 日本手机在线视频| 亚洲第七页| 青草视频久久| 国内精品久久九九国产精品| 超碰精品无码一区二区| 精品久久人人爽人人玩人人妻| 黄色网页在线观看| 99这里只有精品6| 99青青青精品视频在线| 国产精品久久精品| 色亚洲成人| 欧洲精品视频在线观看| 欧洲日本亚洲中文字幕| 成人国产免费| 久久无码高潮喷水| 美女无遮挡被啪啪到高潮免费| 婷婷色在线视频| 成年免费在线观看| 人妻中文久热无码丝袜| 亚洲IV视频免费在线光看| 久久久久国产精品嫩草影院| 91精品啪在线观看国产| 野花国产精品入口| 国产免费网址| 网友自拍视频精品区| 一级在线毛片| 91精品综合| 麻豆AV网站免费进入| 日韩精品久久无码中文字幕色欲| 久久婷婷国产综合尤物精品| 高清久久精品亚洲日韩Av| 国产激爽大片高清在线观看| 美美女高清毛片视频免费观看| 超碰免费91| 久久美女精品国产精品亚洲| 为你提供最新久久精品久久综合| 人人爱天天做夜夜爽| 深夜福利视频一区二区| 91探花在线观看国产最新| 亚洲欧洲日韩综合| 四虎国产精品永久一区| 在线视频亚洲色图| 永久免费av网站可以直接看的| 欧美日本激情| 国产福利小视频高清在线观看| 亚洲欧美国产五月天综合| 狠狠亚洲五月天| 91久久精品国产| 中文字幕精品一区二区三区视频| 性色在线视频精品| 亚洲最大情网站在线观看 | 亚洲一级毛片免费观看| 五月激情婷婷综合| 超清人妻系列无码专区| 国产综合精品一区二区| 五月婷婷丁香色| 一级毛片免费播放视频| 国产福利大秀91| 亚洲美女久久| 亚洲国产中文在线二区三区免| 国产在线视频福利资源站| 东京热av无码电影一区二区|