邱蓉蓉
(湄洲灣職業技術學院 圖書館,福建 莆田 351100)
快遞物流業在如今的信息化生活中已成為不可或缺的一部分,特別是近年來,物流配送的需求伴隨著近年來電子商務的猛然發展也在急劇的增加,使得快遞物流業也迎來了發展的黃金期[1]。然而,縱觀快遞物流業現在的發展和時代的發展落差還很大,無論是國內自身在快遞物流業的發展瓶頸,還是與國際物流相比在技術水平上的缺陷,都在呼吁著國內快遞物流企業在技術創新方面需要未雨綢繆,提升在快遞物流業中的競爭力,進而驅動整個行業的創新發展。從企業的角度來看,我國的快遞物流企業仍然缺乏技術創新,亟須提高自身的技術水平,加強自身的技術研發能力,才能使自己在如今激烈的競爭中脫穎而出。
目前,中國快遞物流企業以民營快遞企業的發展最為迅速。民營快遞企業在整個快遞物流行業中占據非常重要的位置,從民營快遞企業中確定快遞物流的龍頭企業,相對合理。由于筆者是基于專利分析的研究。因此,將從常見的、公認的各民營快遞物流企業中,對它們申請的專利數量進行對比分析,從而選取出最能夠代表快遞物流行業中的領軍企業。
筆者基于廣東省專利大數據應用服務系統,對各個快遞物流企業的專利申請量進行檢索,檢索時間截至2018年11月。專利申請量排名如表1所示,表中列出部分企業。
雖然京東物流集團是順豐控股股份有限公司專利申請量的3倍多,但京東本身是電子商務平臺,其申請的專利并非都是物流領域方面的專利,與文中研究的物流領域不符,因此排除。由表可知,順豐的專利申請量以高達1 122的專利居首位,而其余9家快遞物流企業的專利申請量很少,甚至有7家快遞物流企業沒有任何的專利申請。

表1 快遞物流企業專利申請量排名
經初步分析,在2009年-2010年之間,順豐才開始申請專利,起初專利申請數量都較少,從2011年才開始增多,此后更是出現爆發式增長,在技術創新和專利發明方面進行廣泛布局。然而,國內其他快遞物流企業的專利情況令人擔憂,順豐速運申請的專利數量在快遞物流行業內遙遙領先,以大比分專利數甩開其他同行。因此,文章以順豐速運有限公司作為快遞物流企業的龍頭企業,對其申請的專利文獻進行分析具有一定的研究意義。
以廣東省專利大數據應用服務系統作為專利信息數據來源。在此平臺上對順豐速運申請的相關專利進行檢索和分析。檢索策略如表2所示。

表2 專利檢索方案
檢索結果共有1 122條專利數據,經過刪除重復的專利數據共得到順豐速運的694條專利數據。將順豐相關專利數量制作出歷年變化趨勢圖,如圖1所示。由于在審查專利的過程中需要一些時間,在提交申請之后到與專利公開會延遲一年半左右,造成2018年的專利沒有全部檢索出,因此,這一年專利的申請量相比于2017年會有一定的偏差,而呈現出下降的趨勢。

圖1 順豐速運專利數量歷年變化趨勢
對于專利文本的技術關鍵詞提取范圍設定為:標題,摘要和權利要求。通過構建的自定義文本詞典(見表3)和停用詞表(見表4),刪除與物流技術沒有實際意義和代表性的詞,或者是不能反映專利信息內涵的詞,將關鍵名詞、動詞等重點保留下來。

表3 自定義文本詞典(部分)

表4 停用詞(部分)
文本經過分詞處理之后,為確定提取的最佳主題數目,利用Python計算困惑度。計算的結果以可視化圖的方式呈現,其中橫軸代表主題數目,縱軸代表困惑度的值。由圖2可知,困惑度的值隨著主題數目的增多逐步遞減,而圖中的轉折點,在整個文本集合上的困惑度值較小,并且當主題數目繼續增加時,困惑度的值也不會下降很多,不會有較大幅度的變化,此時的困惑度值可視為最低,其對應的主題數目即為最佳的提取主題數目。因此,根據圖中的轉折點,將所要提取的主題數目設置為15個[2]。

圖2 最佳主題數的確定
最后,通過LDA模型對所有已有的所有專利分詞進行主題的提取,提取的15個主題結果如表5所示。

表5 提取的主題
對提取出來的15個主題,經分析可以將這15個主題歸為4個不同的快遞物流技術領域,并整理出與之相關的專利數量,如表6所示。

表6 技術領域歸類
下面對以上劃分的4個技術領域進行詳細介紹,并繪制出各個技術領域的專利申請量歷年變化趨勢圖(見圖3-圖6),從而分析每個技術領域逐年的專利申請情況。
1.4.1 分揀運輸技術領域
這一類的專利申請量在4個聚類中居首位,主要是關于分揀車、分揀柜等分揀設備、自動分揀系統、物流貨物輸送設備、運輸過程中的裝卸搬運設備等方面的專利申請。其中尤以分揀技術領域的專利申請量最為顯著,以“分揀”作為關鍵詞共檢索出118條專利量。

圖3 分揀運輸技術領域專利申請量歷年變化趨勢
由圖3可知,順豐在分揀運輸技術領域的申請量逐年上升,雖然在2003年達到高峰值后有所下降,但在后幾年又重新回升,且專利數量急劇增長,表明順豐從2015年開始對分揀運輸技術領域的關注度高漲。
1.4.2 智能物流技術領域
這類主要是有關于無人機、機器人、無人機智能吊艙、智能快遞柜、智能電池等方面的專利申請。其中尤其以無人機技術領域的專利申請量最為顯著,以無人機為關鍵詞共檢索出82條專利量。順豐是國內首推用無人機送快遞的物流企業,其致力于在航空裝備的無人化、小型化和智能化,著手開始研發和設計用于物流運送的無人機,實現了國內貨運無人機發展史上的多項突破。

圖4 智能物流技術領域專利申請量歷年變化趨勢
由圖4可知,順豐在智能物流技術領域的專利申請量的增長較不穩定,其中在2009年、2011年、2012年和2013年的專利申請量均只有一項,發展極為緩慢,直到2014年才開始迅速增長,而在2016年又有所下降。
1.4.3 物流信息化技術領域
這類主要是有關于快遞收寄件管理、運單管理、庫存管理、車輛調度管理以及員工考勤管理等系統設計方面的專利申請。近幾年,順豐積極的研發和引進先進的信息技術和設備設施,建立了行業先進水平的信息系統,實現了資源的調度以及全程監控、跟蹤快件流轉的信息。

圖5 物流管理系統技術領域專利申請量歷年變化趨勢
由圖5可知,順豐在物流管理系統技術領域的專利申請量增長在整體上呈逐步增長的趨勢,但是在2009年-2012年有關于該技術領域的專利申請量均為0,表明這兩年順豐可能沒有在物流管理系統領域方面的技術研究或者正處于研究中。
1.4.4 倉儲包裝技術領域
這類主要是有關于物流貨物的包裝設計、保溫箱及其他貨物存儲方式等方面的專利申請。在智慧物流的大趨勢下,綠色包裝的研發和應用已成為電商、物流的聚焦關注點。順豐旗下的包裝實驗室SPS中心定期為醫藥、鮮花、副食、冰鮮、3C、果蔬、生鮮等領域提供通用型的和定制化的包裝解決方案服務,最大限度地推動用戶體驗和服務品質的改善。

圖6 倉儲包裝技術領域專利申請量歷年變化趨勢
由圖6可知,順豐在包裝存儲技術領域的專利申請量的發展趨勢波動較大,在2012年和2013年各達到一次高峰期,在2009年-2015年間的發展趨勢較為緩慢,到2016年開始明顯增長。
筆者選取深圳市萬聯億通科技有限公司建設運營的萬聯網中所有物流方面的專家觀點作為網絡數據的來源,以便支持文章對快遞物流領域的趨勢發展研究。
以“物流”作為檢索的關鍵詞,利用八爪魚進行萬聯網所有相關數據的采集,可采集到的數量共4 394條。

表7 網絡數據采集方案
將所有爬取到的數據進行篩選,排除與快遞物流領域不相關和重復的文本,最終可得到有效數據共4 114條。經過對有效文本的初步整理分析,可以發現網絡文本發布的時間段在2002年-2018年之間。
首先對網絡數據逐行進行分詞處理。在處理的過程中,同樣運用構建的自定義文本詞典(見表8)和停用詞表(見表9)進行保留和過濾關鍵詞。因為網絡上的文本與專利文本的內容不同,所以,停用詞表和自定義詞表也必然會有所區別。將網絡采集的文本經過分詞處理后,接下來就可以開始相似度計算。

表8 自定義文本詞典(部分)

表9 停用詞(部分)
2.4.1 詞向量的訓練
筆者對詞向量的訓練方法是采用Genism中的Word2vec訓練工具包,這類基于分布式表示的訓練模型,能夠從大規模的、沒有明顯標記的語料之中自動學習到句法和語義方面的信息,并將其進行編碼表示[16]。在Word2vec訓練詞向量的過程中,需要手動設置包括窗口大小Window、Min-count數目和詞向量維度Size在內的3個重要參數。Window指的是上下文窗口;Min-count指的是最小詞頻訓練閾值;Size會影響到計算,增加詞向量的維度能夠增加詞向量效果,維數越大,訓練效果越好。文章將Window設值為5,Min-count的閾值設值為5,詞向量的維度則設值為300。
由于在同一領域語料下,增加不相關領域語料將會降低詞向量效果,因此,筆者將從萬聯網爬取的,約5萬多篇有關物流領域的網絡文本作為語料庫進行詞向量的訓練,訓練結束就可以直接通過計算兩個向量之間的相似度來考察這兩個詞的相似結果。一般來說,訓練的語料越多越好,為證實文章訓練模型結果的有效性,選擇以“智能”和“包裝”一詞為例,獲得該詞訓練得到的詞向量,并計算與“智能”“包裝”最相近的詞,進行排序[17]。由圖7-圖8可知,與“智能”相似的詞語主要包括有:分單、硬件、快遞柜、大腦、算法和機器人等,這些詞在日常生活中常與智能一起出現。由圖9-10可知,與“包裝”相似的詞語主要包括有:包裝材料、回收、生物降解、循環和環保等與包裝聯系密切的詞。可見,訓練效果相對較好。

圖7 “智能”詞向量

圖9 “包裝”詞向量
2.4.2 相似度計算及結果分析
在得到詞向量模型后,利用WMD算法計算與專利文本的4個主題相似的網絡文本。在計算相似度的過程中,為輸出結果的易理解和有序性,筆者設置了以下參數,分別是①ID:代表的是所有網絡文本的序號,將所有的網絡文本添加索引,依次進行編號,以便在后續分析的過程中找出相對應的文本;②Instance:代表的是相似度,即各個主題遍歷網絡文本的語料庫,逐行計算它們之間的相似距離。相似度越高,則兩個文本之間越相似,因此筆者將Instance>0.8的文本認為是最相似的,但也不排除低于0.8的文本相似性;③Text:代表的是與專利主題相似的網絡文本,但是由于計算相似度的語料庫里是已經分詞的文本,所以,結果輸出的Text并不是全文,而是分詞,需要人工尋找對應的原文。筆者將專利文本每一個主題對應的相似文本按照相似度的高低進行排序,選取排名靠前的網絡文本進行進一步的分析,驗證文本相似性[18]。以專利文本的各個主題為輸入文本,輸出與該主題相似的所有網絡文本,將相似度大于0.8文本進行統計分析,其中為了方便,Text僅列出了由人工按照ID編號找出的對應原文標題。
2.4.2.1 智能物流主題。與智能物流主題相似度大于0.8的網絡文本共有17篇,選取相似度top1的文本進行分析,結果分析:{“ID”: 182,“Instance”: 0.9280305,“Text”: 從“汗水物流”到進行“智慧物流”,物流企業如何遠走高飛?}本篇主要講的是物流硬件設備在配送、運輸、倉儲等領域已經處于智能化進程中,筆者介紹了現如今已經使用和將會使用的智能硬件設備,并詳解了這些智能設備的應用現狀和發展前景,包括智能倉儲機器人、無人叉車、外骨骼機器人、無人卡車和智能快遞柜等。
2.4.2.2 分揀運輸主題。與分揀運輸主題相似度大于0.8的網絡文本只有1篇,結果分析:{“ID”:998,“Instance”: 0.9066993,“Text”: 提高倉儲揀選效率的10種策略}本篇主要講的是提出10種揀選技術和策略以解決目前物流配送難以解決的問題。在分揀運輸方面的策略包括結合智能化存儲系統,再采用紙箱流利式貨架或使用激光導引車、起升機、叉車、托盤車和揀選車等設備提高效率;利用智能輸送分揀系統自動進行分揀;采用電子標簽揀選、多種掃描、語音技術等進一步提升揀選工位效率等。
2.4.2.3 物流信息化主題。與物流信息化主題相似度大于0.8的網絡文本也是共17篇,選取相似度top1的文本進行分析,結果分析:{“ID”:998,“Instance”:0.8793183,“Text”:提高倉儲揀選效率的10種策略}本篇主要講的是提出10種揀選技術和策略以解決目前物流配送難以解決的問題。在物流信息化方面的策略包括利用物流信息的強化管理來完善訂單與倉庫的管理和控制,如倉庫管理系統和倉庫控制系統;同時,采用揀選區位控制輸送系統與智能化物料流控制提高揀選效率。
2.4.2.4 倉儲包裝主題。與倉儲包裝主題相似度大于0.8的網絡文本只有3篇,選取相似度top1的文本進行分析,結果分析:{“ID”:998,“Instance”:0.8633111,“Text”:提高倉儲揀選效率的10種策略}本篇主要講的是提出10種揀選技術和策略以解決目前物流配送難以解決的問題。在倉儲包裝主題方面的策略包括使用特定的管理軟件用以完善訂單與倉庫管理,包括物料流控制、庫存管理與設備控制等;傳統貨架存儲庫內的手工作業效率低下、錯誤率高,文中提出可以通過增設能激活數據交互的設備來解決,實現動態、及時地將指令發送至貨品生產車間,從而提高準確率、吞吐量和生產率。
筆者主要研究了如何在專利文本和網絡文本的基礎上運用LDA主題模型和WMD相似度計算法,實現對快遞物流業的研發熱點和發展趨勢的分析。得出的結論有:①在智能物流技術領域方面,根據專利申請數量和專家的關注度,可以發現無人機、機器人、智能快遞柜等智能化物流設備的研發是最受歡迎、最熱門的領域,其研發階段已經步入高峰期,各個快遞物流企業高度重視快遞物流業新的變革模式;②在物流信息化技術領域方面,目前在分揀、運輸、配送等物流各個環節已經逐步開始實現信息化,如庫存管理系統、客戶訂單管理系統、自動分揀系統等都成功地啟動應用;③在分揀運輸技術領域方面,其主要關注熱點是如何實現貨物分揀、運輸等過程的智能化、自動化和信息化,雖然目前已經實現了全自動分揀系統的推進,但是在分揀車、分揀機器人等分揀設備方面的研發仍然不足,需要繼續在這方面尋找突破;④在倉儲包裝技術領域方面,其關注熱點是向綠色化發展,提高快遞包裝的循環利用率,減少浪費;根據不同貨物的大小、需要冷藏、保溫等特性設計出與之相適應的包裝盒、包裝袋等;同時,要合理利用倉庫空間,設計更適合的庫存模型和倉庫管理系統實現庫存的集中管理。
同時,也存在一定的局限性,包括以下幾個方面:①技術領域劃分的問題。由于物流的分揀、配送、無人機、智能等各個領域相互滲透,在分揀運輸領域也會融入智能物流領域的技術,因此,基于各個技術領域關鍵詞的專利檢索會存在與其他技術領域重合的專利文獻,造成4個技術領域的專利數量總和會超過順豐速運有效的專利數量,但整體上并不影響對各個技術領域的分析。②輸出文本的效果偏差。由于專利文本是與技術直接相關的文本,因此,主題提取的關鍵詞大部分是與物流領域的技術專業用語,而網絡文本偏向日常用語,對計算相關度的結果有一定的影響,造成輸出效果與預期的有一定的偏差。因此,還需要進一步優化模型和算法,但文中計算輸出的網絡文本仍然有較高的相似性。