


中圖分類號:F253.9 文獻標志碼:ADOI: 10.13714/j.cnki.1002-3100.2025.09.014
Abstract: In an automated stereoscopic warehouse, the inventory of cardboard box goods on pallets requires the use ofa stacker crane to transport the pallets from the vertical warehouse to the entry and exit platforms for manual inventory, and then transport the pallets back to the vertical warehouse. Onlythencantheinventoryofapalletbecompleted,and the entire calculation process will inevitably lead to time-consuming and labor-intensive work. In order to improve inventory efficiency andreduce energy consumption, and avoid the transportation of stacker cranes during inventory work, this articleadopts an intelligent inventory technology based on point cloud data to directly inventory the goods on pallets in the vertical warehouse,without the need to manually transport palletsto the entry and exit platforms for inventory. This technology mainly uses LiDAR to collect three-dimensional point cloud data (x,y,z) of cardboard boxes on pallets. A mapping grid matrix detection method is proposed to vertically analyze the three-dimensional point cloud data,and the least squares method is used to fit the plane shape data of stacked cardboard boxes in the vertical direction. The three-dimensional data is gridded and converted into two-dimensional data,and then subjected to plane fitting processing to obtain a matrix dataof fitting plane height and plane area,and then calculate thenumberofcardboard boxes.
Key words: point cloud data; stereoscopic warehouse; least squares method;planar detection; LiDAR
0引言
在全球化及電子商務的日益發展下,立體倉庫作為存儲效率及空間利用率的重要提升者,已在現代供應鏈管理中扮演著不可或缺的角色。立體倉庫的盤點工作直接關系到庫存準確性、貨物流通速度以及顧客滿意度,對整個供應鏈管理至關重要。傳統的立體倉庫庫存盤點方式依賴于將托盤用堆垛機從貨架搬移至出入站臺進行人工清點,這種方法不僅效率低下,而且容易出錯,同時導致了資源的過度消耗和成本的增加。在實際操作中,以某煙草公司的立體倉庫為例,利用堆垛機從貨架取出托盤,搬運至站臺進行人工盤點,盤點結束再將托盤搬運回立體倉庫貨架上,整個過程平均需要近八分鐘,尤其是在高峰季節,人工盤點成為制約立體倉庫運營效率的瓶頸。
目前智能盤點主流技術主要有兩種,一種是通過RFID實現,另一種是通過計算機視覺實現。RFID主要利用電子標簽和電子標簽讀寫器配合完成自動盤點,RFID讀寫器讀取其所覆蓋范圍內的電子標簽來實現自動盤點,這就要求所有商品都需要貼上電子標簽,目前主要應用場景是圖書館領域,深圳市鹽田區圖書館的智能書架,南京大學圖書館及武漢大學圖書館的盤點機器人[2-3]、上海大學圖書館的智能密集書庫、汕頭圖書館的AGV分揀等。通過RFID實現自動盤點在平庫場景下相對適用,但是在立體倉庫中就不適用,首先立體倉庫盤點是在立體倉庫內對一個托盤上的商品進行盤點,RFID讀寫器容易采集到其他托盤上的電子標簽碼,無法區分哪些是當前托盤上的標簽,哪些是其他托盤上的標簽。隨著計算機視覺與人工智能技術的不斷發展,通過視覺分析識別目標及數量的應用場景越來越多,如Zhang et al提出了一種圖像采集和識別計數方法;Gefen et al結合了Faster R-CNN與跟蹤算法,設計了一個用于對多層雞籠中的蛋雞進行計數的計算機視覺系統。計算機視覺相對RFID的應用場景更為廣泛,但是受光照影響較大,對二維平面圖像的分析比較有優勢,而立體倉庫中,托盤上的紙箱都是堆疊起來的,無法通過二維圖像直接分析出托盤上紙箱的數量。
隨著激光雷達技術和三維圖像重建的發展,通過對三維點云數據的建模和分析被廣泛應用于目標形態檢測等領域[80。由于激光雷達不會受到場景光線的影響,并且在自動化立體倉庫中,托盤上的紙箱貨物都是按一定規則進行碼垛,例如根據不同紙箱的尺寸大小,托盤上每層最多擺放的紙箱個數不同,總的擺放高度和層數不同,因此本文采用激光雷達采集托盤上紙箱的三維點云數據,提出一種映射網格矩陣檢測法對點云數據的立體表面形態和深度進行分析,根據每個紙箱的物理規格參數,準確計算出托盤上紙箱數量,達到在立庫內就可自動完成貨物的盤點工作,這不僅減少了盤點過程中托盤運輸的時間和能源消耗,也減輕了作業人員的勞動強度。
1智能盤點技術架構
智能盤點整個技術架構主要有以下3個模塊組成,分別是基礎數據模塊、點云數據采集和清洗模塊、點云數據分析模塊,如圖1所示。
其中,基礎數據模塊主要定義紙箱的規格、碼垛規則及相關擬合參數等,為數據分析提供業務邏輯支撐;點云數據采集和清洗模塊主要負責通過激光雷達采集到 (x,y,z) 坐標的三維點云數據,并對數據進行坐標遷移和清洗誤差較大的干擾數據;點云數據分析模塊主要利用對三維點云數據自上而下進行形態分析,完成點云數據的網格化處理、平面擬合等,最終完成智能盤點。

2技術實現
2.1基礎數據模塊
因業務對象的不同,如煙草業、酒業、服裝業等,所使用的包裝規格大小也不同,碼垛的規則也不一樣,因此不同的業務,需要定義不同的基礎數據和碼垛規則,為數據分析提供基礎支撐:
(1)基礎數據定義包括:紙箱的基礎規格,包括高度 Φ(HΦ) 、寬度 (W) 和長度 Ω(L) ;安裝激光雷達采集設備時,雷達距離托盤的固定高度(RTPH);托盤的基礎規則,包括寬度(TW)和長度 Ξ(TLΞ) ;在對點云數據進行二維平面分析時,檢測面的擬合參數0.9(FITV)單位為厘米, FITV=20?m (因激光雷達Mid-40的誤差為2厘米);體積容錯率為 SR=0.6 ,用于計算紙箱體積時的偏差,即假設紙箱體積是1,如果計算出總的紙箱體積是8.6,則認為有9個箱子;深度的定義:雷達到目標最上層的檢測距離(DEEP)。
(2)碼垛規則:根據目前自動化倉儲中,紙箱碼垛都采用機器人完成作業,碼垛規則為除了最上層的紙箱可能出現未碼滿的情況,其下各層每層都按最大碼放量碼滿紙箱,不存在未碼滿的狀態。
(3)激光雷達安裝規則:約定激光雷達安裝在托盤上方正中間,采集到的點云數據格式為 (x,y,z) ,存儲為CSV格式文件,其中: x 坐標值為深度, y 值為托盤長度方向的值, z 值為托盤寬度方向的值。
2.2三維點云數據采集和清洗模塊
文本采用Livox的Mid-40型號的激光雷達產品,通過非重復掃描技術對目標進行點云數據采集,每秒可采集10萬個點云數據,精度達到毫米級,檢測誤差在2厘米。為了保證對目標數據采集的覆蓋率,每次采集都需要持續進行兩秒的數據采集,共需要采集20萬個數據點,視場覆蓋率接近 100% ,以保證碼垛紙箱的三維點云數據形態分析的完整性和準確性。對數據的清洗過程(見圖2)主要經過以下幾個步驟:
(1)清洗層:主要目的是清洗激光雷達采集到的冗余字段。為了加快點云數據的分析速度,首先需要對采集到的點云數據進行清洗處理。通過Livox的Mid-40型號激光雷達采集到的初始數據,每個數據點都包含了19個字段,其中只有標識三維坐標的三個字段 (ρx,y,z) 是用于三維形態分析,因此需要通過初步清洗去除掉多余的16個數據段,以提高“點云數據清洗模塊”的效率。
(2)修剪層:主要目的是對清洗層的數據再進行修剪處理,將不在檢測范圍內的多余的數據清除。
Mid-40激光雷達的有效視場角 (FOV) 是 38.4° ,見圖3,采集的范圍是一個圓形區域的三維數據。檢測目標是碼垛在托盤上的紙箱,托盤的形狀是矩形,尺寸通常是長為 120cm ,寬為 100cm? ,立體倉庫中,托盤上的紙箱貨物都不會超出托盤的邊緣,因此需對圓形的三維數據進行修剪,將托盤區域以外的無效數據進行清洗處理。激光雷達的掃描位置是在托盤正上方,三維坐標的原點是雷達所在位置,采集區域為圓形空間,因此采集到的三維數據 (x,y,z) 中, y 值和 z 值分別檢測長度和寬度,會出現負值情況, x 值表示深度距離,既雷達到目標的距離,因此清洗原則是當 y 和 z 的絕對值大于 60cm 或 50cm ,則直接清除該點數據;當 x 值是小于等于0或大于激光雷達到托盤的距離,則直接清除該點數據,最終保留下有效形態的點云數據。由于點云數據 (x,y,z) 中,除了代表深度距離的 x 值總是正數, y 和 z 值會出現負值情況,因此為方便后期分析,通過對 y 和 z 值分別加60和50的操作,實現對點云數據坐標的遷移,保證所有點云數據都落在三維坐標的第一象限,且不會影響到三維形態,如圖4和圖5所示。



本文以檢測目標由10個紙箱組成碼垛為例,紙箱的長、寬、高分別為 30cm ( 20cm 、 13cm ,每個紙箱的表面積是 600cm2 每個紙箱的體積是 7800cm3 ,每層最大擺放4個紙箱,采集的原始點云數據和數據清洗后的數據中原始數據的精度是毫米,清洗后的精度為厘米。
2.3點云數據分析模塊
對點云數據的分析主要由兩部分組成,其一是找出托盤上紙箱商品垂直方向的表面積;其二是根據雷達到紙箱的深度距離,可計算出碼垛紙箱的高度,進而計算出整個碼垛紙箱的完整體積。為從三維點云數據中檢測到垂直方向的表面積和對應的碼垛紙箱高度,本文提出一種映射網格矩陣檢測法,其思想是建立一個 120×100 (托盤尺寸為 120cm×100cm )的二維矩陣網格M[il[jl ,每個網格表示一個點面積,即1平方厘米,共有1.2萬個網格數據,初始值為零,有值就表示有點云數據投影到該網格,該值也就是碼垛紙箱的高度。將點云數據二維化,即將三維點云數據垂直映射到二維矩陣 M 中,其中點云數據的 y 和 z 值與 M 的 i 值和 j 值相對應, M[il[j] 的值表示碼垛的高度,因為激光雷達作為原點,檢測到的三維數據中的 x 值是深度,因此 M[i∣∣j ]的值通過RTPH值減去點云數據中的深度值 x 計算而得。由于點云數據量龐大,即使對原始數據進行過清洗和修剪操作,見圖6,也會有近十多萬個數據點映射到 M 矩陣中,需要對三維點云數據中的 x 值進行最小二乘法擬合和降采樣處理,整個分析的過程如下:
(1)點云數據到二維矩陣的網格化處理。從點云數據的最上層,逐步向下掃描,每次步長為 1cm ,在 X=xi 的平面進行掃描,如果
值為空,則將點 p1(xi,yi,zi) 的 xi 值寫入到
中,否則采用最小二乘法進行取平均值擬合處理,擬合算法如下:
如果 xj 值與
值的差平方,小于FITV值的平方,則取 xj 和
的平均值,填入到
中;如果大于FITV值的平方,則保留
值不變,如式(1)所示。

經過網格化處理后,二維 M(100×120) 矩陣數據在三維坐標中的可視化顯示見圖7, M 的下標 (i,j) 對應圖中的 (y,z) 坐標值, M[i∣∣j] 的值對應 x 坐標的值,只要 M[i∣∣j] 中的值不為空,就表示存在一個點面積。
(2)擬合平面,計算目標形態總體積。根據 M 中的數據分布,可以計算出整個形態的體積,具體方法是首先將 M 中的數據按平面高度和平面面積分別進行統計;其次再對統計的數據進行平面擬合處理,因為激光雷達采集到的點云數據精度到毫米,即使在一個平面的紙箱,在點云數據中都會出現在不同的層次中。
① 對 M 中的數據按平面高度和其對應平面面積進行統計。平面高度中的數值是垂直于 x 軸的平面距離 (y,z) ,即
的值,單位為厘米;平面面積的值是距離為 M[i∣∣j] 的所有點面積之和,一個點面積為1,單位為平方厘米。對 M 中的數據進行統計后的結果如表1所示。
② 擬合平面。通過對 M 數據進行分別統計后,由表1可知,在未擬合之前,存在多個平面,比如高度為 42cm 和 41cm 的平面只差 1cm 的高度差,并且面積分別只有 40cm2 和 107cm2 ,遠小于一個紙箱的表面積 600cm2 ,這是因為由于激光雷達的檢測誤差及箱子表面的不平整導致,因此需要根據檢測面的擬合參數(FITV)來進行多個平面的擬合。Mid-40激光雷達的檢測誤差在 2cm 范圍內,因此擬合參數FITV值取正負 2cm 進行平面擬合,即真實高度的上下可接受誤差值為 2cm 具體算法過程如下:a.依據箱子高 h=13cm ,檢測高度在 15cm 至 11cm 之間的所有平面面積和S,如果小于600S,丟棄該值,表示不存在紙箱的平面。b.在1基礎上增加 12cm 作為再次檢測的高度,檢測方法同1,直至 M 矩陣中不在有數據為止。



根據上述算法過程,可得到擬合的平面只有高度為 39cm 和高度為 26cm 的平面滿足條件,如表2所示。
最后根據 (39×1140+26×1221 /每個紙箱體積 7800cm3=9.92 個,滿足體積容錯率為 SR=0.6 ,因此有10個紙箱數量。

3結論與展望
雖然目前計算機視覺和深度學習發展迅速,相關技術也應用到了識別、檢測、目標跟蹤等領域,但計算機視覺是利用計算機對圖像和視頻進行分析和理解,受到光線和外界干擾較強,而且只能通過景深圖像進行分析,二維圖像實現自動盤點;深度學習是一種機器學習的方法,通過多層神經網絡來學習數據的特征和規律,可以用來識別和分析紙箱的特征,然后通過建模來計算紙箱的體積和數量,但深度學習需要大量的數據進行訓練和調優,實際情況是紙箱種類繁多,碼垛規則不一,要收集全不同類型紙箱和不同碼垛規則的大量訓練樣本,相對困難,這也會導致最終的模型識別能力準確率較低。
本文提出的基于點云數據的智能盤點,不受光線的影響,也無需大量的樣本數據進行訓練,而是利用映射網格矩陣檢測法,將大量的三維點云數據進行擬合處理,去除大量噪音數據和無效數據,并將三維點云數據二維化,通過降低分析的數據量,快速計算出紙箱的數量。這種方法不僅可以提高盤點的效率和準確性,還可以減少人工成本和盤點錯誤率。在自動化立體倉庫等場景下,該技術可以結合人工智能等技術,實現對倉儲物流中更多細節的智能盤點,具有廣闊的應用前景。
參考文獻:
[1]尹麗棠,李星光,劉俏,等.深圳市鹽田區智慧圖書館對“智慧+”的運用[J].圖書館論壇,2020,40(1):161-163.
[2]樊慧麗,邵波.智能機器人圖書盤點創新實踐與思考——以南京大學圖書館為例[J].圖書館,2018(9):96-100.
[3]夏正偉,李全,端文慧,等.RFID圖書自動盤點機器人應用研究——以武漢大學圖書館為例[J].圖書館雜志,2020,39(1):61-66,55.
[4]魏曉萍,李紅培.基于RFID 的低利用率文獻高密度存儲——上海大學圖書館 RFID密集庫建設實踐[J].圖書館理論與實踐,2017(10):88-91.
[5]張鏡輝.圖書館AGV智能分揀系統構成分析與規劃設計——以汕頭市圖書館為例[J].圖書館學研究,2021(4):23-28.
[6]ZHANG TIANHAO,LIANG YANSEN,HE ZHIYLAplyingimagerecognitionandcounting toreserved livepigsstatitics[J].Computer Applications and Software, 2016,33(12):173-178.
[7]GEFFENO,YITZHAKY Y,BARCHILONN,etal.A machinevisionsystem to detectandcount laying hens inbatterycages[J]. Animal, 2020,14(12):2628-2634.
[8]ZHOU ZIXIANG,GONG JIE.Automatedanalysisof mobileLiDAR data forcomponent-leveldamageasessmentof buildingstructuresduringlargecoastal stormevents[J].Computer-Aided CivilandInfrastructureEngineering,2018,33(5):373-392.
[9]周鳴亮,程文,張東明,等.運營期盾構隧道結構病害的自動化檢測與三維可視化[J].應用基礎與工程科學學報,2021,29(5):1265-1279.
[10]陳鑫,王李管,畢林,等.基于點云數據的采空區三維建模算法[J].中南大學學報(自然科學版),2015,46(8):3047-3053.