


收稿日期:2023-04-19
摘? 要:
文章針對(duì)圖書(shū)損壞現(xiàn)象,提出一種基于特征提取的快速圖書(shū)損壞鑒評(píng)方法。對(duì)出借和歸還時(shí)圖書(shū)的正反側(cè)三面圖像進(jìn)行差異度檢測(cè),評(píng)判圖書(shū)損壞是否超過(guò)損壞閾值;找到差異度位置區(qū)域,并利用一種新的有監(jiān)督的分析方法對(duì)該區(qū)域進(jìn)行特征提取,繼而分類匹配,判定損壞類型和損壞程度,提示圖書(shū)館工作人員及時(shí)進(jìn)行圖書(shū)修復(fù),督促讀者愛(ài)護(hù)書(shū)籍,養(yǎng)成良好的閱讀習(xí)慣。同時(shí),文章采集某高校圖書(shū)館內(nèi)的1000本紙質(zhì)藏書(shū),將所提方法與傳統(tǒng)的特征提取方法進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果表明文章所提方法的識(shí)別精度更高。
關(guān)鍵詞:
圖書(shū)定損;特征提取;線性判別分析;局部加權(quán)均值
中圖分類號(hào):G253??? 文獻(xiàn)標(biāo)識(shí)碼:A??? 文章編號(hào):1003-7136(2024)03-0048-06
Research on Fast Book Damage Evaluation Method Based on Feature Extraction
WANG Yang
Abstract:
In view of the phenomenon of book damage, this paper proposes a fast book damage evaluation method based on feature extraction. This method detects the difference degree of the front, back and side images of books during lending and returning, and evaluates whether the damage of the book exceeds the damage threshold; finds the location area of the difference degree, and uses a new supervised analysis method to extract features from this area, and then classifies and matches to determine the type and degree of damage, prompting the library staff to repair books in time, urging readers to take good care of books and cultivate good reading habits. At the same time, this paper collects 1000 books from a university library, and compares the proposed method with the traditional feature extraction methods. The results show that the proposed method has higher recognition accuracy.
Keywords:
book damage evaluation;feature extraction; linear discriminant analysis;local weighted mean
0? 引言
隨著紙質(zhì)圖書(shū)數(shù)量的劇增,以及相關(guān)職能部門(mén)閱讀推廣活動(dòng)的開(kāi)展,越來(lái)越多的讀者參與閱讀,民眾通過(guò)閱讀獲取知識(shí)的同時(shí),分享書(shū)籍帶來(lái)的經(jīng)驗(yàn)與樂(lè)趣。尤其在一些公共圖書(shū)館、高校圖書(shū)館,藏書(shū)量更是驚人[1-2]。以高校圖書(shū)館為例,
截至2022年,中山大學(xué)圖書(shū)館紙質(zhì)藏書(shū)809.3萬(wàn)冊(cè),北京大學(xué)圖書(shū)館紙質(zhì)藏書(shū)731.2萬(wàn)冊(cè),鄭州大學(xué)圖書(shū)館紙質(zhì)藏書(shū)727萬(wàn)冊(cè)[3],蘇州大學(xué)圖書(shū)館的紙質(zhì)藏書(shū)量也毫不遜色,有420余萬(wàn)冊(cè)[4],且僅2023年蘇州大學(xué)圖書(shū)館就新增了5.64萬(wàn)冊(cè)紙質(zhì)圖書(shū)供師生借閱[5]。
由于紙質(zhì)圖書(shū)數(shù)量不斷增加,人工對(duì)紙質(zhì)圖書(shū)維護(hù)的工作量也越來(lái)越大。隨著網(wǎng)絡(luò)技術(shù)的高速發(fā)展、自助借還書(shū)技術(shù)的應(yīng)用,讀者不再受時(shí)間、地域等因素限制,在圖書(shū)館自助服務(wù)機(jī)上就能完成借書(shū)或辦理借書(shū)證等操作,甚至享受圖書(shū)館的預(yù)借送書(shū)服務(wù)。但是,現(xiàn)有的智能借還書(shū)機(jī)只能完成圖書(shū)的出借和歸還記錄的記載,并不能對(duì)圖書(shū)出借過(guò)程中出現(xiàn)的圖書(shū)損壞進(jìn)行識(shí)別和評(píng)定[6-7]。這就導(dǎo)致后續(xù)圖書(shū)館工作人員需要進(jìn)行人工鑒損,還需要人為地將鑒損數(shù)據(jù)輸入系統(tǒng),費(fèi)時(shí)費(fèi)力。并且,信息更新不夠及時(shí)會(huì)導(dǎo)致書(shū)籍的修復(fù)工作無(wú)法及時(shí)開(kāi)展,一些受損嚴(yán)重的書(shū)籍再次借出,容易造成二次損壞[8-10]。同時(shí)還會(huì)影響讀者的閱讀體驗(yàn),在一定程度上縮短了圖書(shū)的使用壽命,這對(duì)館藏資源無(wú)疑是一種浪費(fèi)。
通過(guò)對(duì)圖書(shū)外觀圖像特征提取,可以自動(dòng)判別圖書(shū)的污損程度,對(duì)圖書(shū)的修復(fù)提供科學(xué)依據(jù),以此對(duì)館藏資源實(shí)施管護(hù)。這對(duì)加快圖書(shū)流通,提升用戶滿意度,優(yōu)化館藏管理流程,提高館藏管理效能具有重要意義。
1? 研究現(xiàn)狀
我國(guó)是閱讀大國(guó),近年來(lái)圖書(shū)館新館建設(shè)如雨后春筍,各個(gè)圖書(shū)館也會(huì)根據(jù)讀者的閱讀需求、自身客觀條件來(lái)新增書(shū)籍。但是,由于借閱過(guò)程中圖書(shū)的損壞現(xiàn)象嚴(yán)重,每年有大量的書(shū)籍被迫下架[11-12]。
如溫嶺市圖書(shū)館2017年有紙質(zhì)藏書(shū)六十余萬(wàn)冊(cè),該館共外借圖書(shū)七十五萬(wàn)余冊(cè)次,相當(dāng)于每天有兩千多冊(cè)被借出,僅一年,報(bào)損入庫(kù)的書(shū)籍有近五千冊(cè)[13]。
伴隨館藏文獻(xiàn)流通量的不斷增加,圖書(shū)損壞現(xiàn)象愈加嚴(yán)重。
針對(duì)不同損壞類型的圖書(shū),其修復(fù)方式、修復(fù)周期、修復(fù)工具、修復(fù)的復(fù)雜程度均不相同,現(xiàn)階段國(guó)內(nèi)的圖書(shū)定損工作主要采用人工質(zhì)檢,圖書(shū)館工作人員逐冊(cè)翻閱檢查,不僅效率低下、人力成本高,且無(wú)法準(zhǔn)確判斷其損壞類型。國(guó)外一些知名高校圖書(shū)館及公共圖書(shū)館有序推進(jìn)智能化圖書(shū)借還系統(tǒng),通過(guò)使用智能化攝像頭,快速對(duì)圖書(shū)封面進(jìn)行拍攝,利用拍攝圖像對(duì)圖書(shū)進(jìn)行識(shí)別[14]
。但該系統(tǒng)在現(xiàn)階段仍缺乏圖書(shū)鑒損功能,故亟須提出一種可以自動(dòng)識(shí)別圖書(shū)損壞類型和程度的方法。
圖書(shū)損壞類型和損壞程度的判定主要依靠圖像識(shí)別技術(shù),圖像識(shí)別技術(shù)涉及了圖像采集、圖像預(yù)處理、圖像分割、特征提取、圖像匹配、圖像分類等。其中,圖像特征提取作為一種數(shù)據(jù)預(yù)處理方法在智能識(shí)別領(lǐng)域得到了廣泛的應(yīng)用。特征提取的目的就是把具有明顯高維特征的原始輸入空間投影到低維的表示空間,而低維的表示空間則要盡可能地保持原空間上的判別信息[15]。鑒別損壞類型和損壞程度的精確度很大程度上與特征提取技術(shù)直接相關(guān)。
目前較為經(jīng)典的幾種特征提取方法為主成分分析[16-17]、線性判別分析[18-19]以及局部保持投影[20] ,均在智能識(shí)別領(lǐng)域被廣泛地加以研究。但是,上述算法在處理圖書(shū)圖像文檔時(shí)存在一些問(wèn)題,如:針對(duì)小樣本問(wèn)題[21],傳統(tǒng)算法缺乏良好的適應(yīng)性,時(shí)間復(fù)雜度太高,魯棒性差等。故本文在線性判別分析法的基礎(chǔ)上,引用了一種新的有監(jiān)督的分析方法,該方法可以有效避免小樣本問(wèn)題,算法的時(shí)間復(fù)雜度更低,圖書(shū)鑒損的時(shí)間更短。
基于特征提取的快速圖書(shū)鑒損方法的應(yīng)用可以在延長(zhǎng)圖書(shū)使用壽命、節(jié)省購(gòu)書(shū)經(jīng)費(fèi)的同時(shí),保證文獻(xiàn)資源使用率最大化,防止館藏圖書(shū)因破損嚴(yán)重而流失。
2? 基于特征提取的圖書(shū)損壞鑒評(píng)
2.1? 圖書(shū)鑒損技術(shù)方法
圖書(shū)污損自動(dòng)鑒評(píng)是通過(guò)自動(dòng)化裝置動(dòng)態(tài)掃描圖書(shū)外觀以獲取圖書(shū)外觀的圖像數(shù)據(jù),并對(duì)圖像數(shù)據(jù)進(jìn)行智能分析,從而判別圖書(shū)的污損程度,其關(guān)鍵是實(shí)現(xiàn)圖書(shū)外觀圖像數(shù)據(jù)的精準(zhǔn)識(shí)別和智能分析。
本文設(shè)計(jì)的基于特征提取的快速圖書(shū)損壞鑒評(píng)方法的重點(diǎn)是特征提取。在線性判別分析法的基礎(chǔ)上,引用了一種新的有監(jiān)督的分析方法,該方法結(jié)合最大間距準(zhǔn)則,有效避免小樣本問(wèn)題;使用QR分解技術(shù),算法的時(shí)間復(fù)雜度更低,圖書(shū)鑒損的時(shí)間更短。
2.2? 圖書(shū)損壞鑒評(píng)流程
基于特征提取的快速圖書(shū)損壞鑒評(píng)方法的具體流程見(jiàn)圖1。
步驟1:當(dāng)讀者需要借閱書(shū)籍時(shí),在人工借還書(shū)系統(tǒng)或圖書(shū)館自助服務(wù)機(jī)上進(jìn)行書(shū)籍的借閱,而此次圖書(shū)出借時(shí)的正反側(cè)三面圖書(shū)圖像數(shù)據(jù)即為上一次該圖書(shū)歸還時(shí)正反側(cè)三面的圖書(shū)圖像數(shù)據(jù)。
步驟2:當(dāng)讀者需要?dú)w還書(shū)籍時(shí),在人工借還書(shū)系統(tǒng)或圖書(shū)館自助服務(wù)機(jī)上,獲取此次圖書(shū)歸還時(shí)的正反側(cè)三面圖書(shū)圖像數(shù)據(jù)。
步驟3:對(duì)歸還時(shí)的正反側(cè)三面圖書(shū)圖像數(shù)據(jù)進(jìn)行預(yù)處理,且將其與借閱時(shí)的正反側(cè)三面圖書(shū)圖像數(shù)據(jù)進(jìn)行差異度檢測(cè),得到圖書(shū)損壞初值,并進(jìn)行判斷。
判斷該圖書(shū)損壞初值是否超過(guò)損壞閾值,若超過(guò),則顯示圖書(shū)已經(jīng)損壞嚴(yán)重,提示圖書(shū)館工作人員及時(shí)進(jìn)行圖書(shū)修復(fù);若沒(méi)有超過(guò)損壞閾值,則進(jìn)入步驟4。
步驟4:將歸還時(shí)的正反側(cè)三面圖書(shū)圖像數(shù)據(jù)與借閱時(shí)的正反側(cè)三面圖書(shū)圖像數(shù)據(jù)分別進(jìn)行差異度處理,找到差異度位置,并對(duì)該差異度位置進(jìn)行定位。
步驟5:對(duì)具有差異度的位置進(jìn)行圖像分割提取,得到該區(qū)域的圖書(shū)破損數(shù)據(jù)。
步驟6:利用一種新的有監(jiān)督的分析方法對(duì)圖書(shū)破損數(shù)據(jù)進(jìn)行特征提取。
步驟7:特征提取后與損壞類別圖像進(jìn)行分類匹配,判定損壞類型和程度,而損壞類型可以為:劃傷、開(kāi)裂、破損、污漬、染色、涂寫(xiě)。
在圖書(shū)歸還時(shí),對(duì)損壞類型和損壞程度進(jìn)行標(biāo)注,便于圖書(shū)館工作人員在后期整理的工作中可以對(duì)破損嚴(yán)重的書(shū)籍進(jìn)行優(yōu)先的修復(fù)或更新工作,保證圖書(shū)館書(shū)籍的可用性。同時(shí),還可以根據(jù)不同的損壞類型和損壞程度,給讀者以不同的處罰措施并在其借閱登記信息上進(jìn)行記錄,督促讀者愛(ài)護(hù)書(shū)籍,養(yǎng)成良好的閱讀習(xí)慣。
2.3? 差異度檢測(cè)
在數(shù)據(jù)庫(kù)內(nèi)保存有:出借時(shí)的圖書(shū)的正面圖像數(shù)據(jù)Bp,反面圖像數(shù)據(jù)Bb,側(cè)面圖像數(shù)據(jù)Bs;讀者歸還書(shū)籍時(shí)圖書(shū)的正面圖像數(shù)據(jù)BBp,反面圖像數(shù)據(jù)BBb,側(cè)面圖像數(shù)據(jù)BBs。
對(duì)各項(xiàng)數(shù)據(jù)進(jìn)行歸一化處理,得到:
出借時(shí)圖書(shū)的歸一化正面圖像數(shù)據(jù)Vp,歸一化反面圖像數(shù)據(jù)Vb,歸一化側(cè)面圖像數(shù)據(jù)Vs,如式(1)所示;
歸還時(shí)圖書(shū)的歸一化正面圖像數(shù)據(jù)BVp,歸一化反面圖像數(shù)據(jù)BVb,歸一化側(cè)面圖像數(shù)據(jù)BVs,如式(2)所示。
其中,‖·‖2為范數(shù)2的計(jì)算。
Vk=Bk‖Bk‖2(k=p,b,s)
式(1)
BVk=BBk‖BBk‖2(k=p,b,s)
式(2)
則圖書(shū)損壞初值v如式(3)所示:
v=13∑k=p,b,s‖BVk-Vk‖2
式(3)
2.4? 差異度處理
圖書(shū)正面的差異度矩陣Vp如式(4)所示,圖書(shū)反面的差異度矩陣Vb如式(5)所示,圖書(shū)側(cè)面的差異度矩陣Vs如式(6)所示,對(duì)圖書(shū)正反側(cè)三面有差異度的位置進(jìn)行定位,然后對(duì)該區(qū)域往外擴(kuò)延一定范圍進(jìn)行圖像分割提取,得到該區(qū)域的圖書(shū)破損數(shù)據(jù)。
Vp=BBp-Bp
式(4)
Vb=BBb-Bb
式(5)
Vs=BBs-Bs
式(6)
2.5? 新的有監(jiān)督的分析方法
根據(jù)流形學(xué)習(xí)理論[22-23]可知,任意分布的大數(shù)據(jù)集均可以通過(guò)分割,劃分成若干個(gè)具有高斯分布的小局部數(shù)據(jù)區(qū)域。本文采用的分析方法的基本原理如下:當(dāng)將任意分布的大數(shù)據(jù)集分割成若干個(gè)小的局部數(shù)據(jù)區(qū)域后,每一個(gè)局部數(shù)據(jù)區(qū)域?qū)ふ乙粋€(gè)與其同一類別下的最近的類內(nèi)局部數(shù)據(jù)區(qū)域,并尋找與其他每一類別下與其最近的類間局部數(shù)據(jù)區(qū)域,并在每一個(gè)小的局部數(shù)據(jù)區(qū)域內(nèi)引入局部加權(quán)均值[24-25]來(lái)替代標(biāo)準(zhǔn)均值,使得該分析方法具有一定的局部學(xué)習(xí)能力。
如圖2所示,假設(shè)數(shù)據(jù)集類別分別為類別A、類別B以及類別C。在類別A下有一個(gè)局部數(shù)據(jù)區(qū)域a,在類別A下,找到了距離局部數(shù)據(jù)區(qū)域a最近的局部數(shù)據(jù)區(qū)域a′;在類別B下,找到了距離局部數(shù)據(jù)區(qū)域a最近的局部數(shù)據(jù)區(qū)域b;在類別C下,找到了距離局部數(shù)據(jù)區(qū)域a最近的局部數(shù)據(jù)區(qū)域c。
具體定義如下:
假設(shè)存在一個(gè)數(shù)據(jù)集X={x1,…,xn},xi∈Rd,該數(shù)據(jù)集具有以下特性:
(1)具有n個(gè)樣本數(shù)據(jù);
(2)n個(gè)樣本數(shù)據(jù)屬于C個(gè)不同的類;
(3)數(shù)據(jù)子集Xc屬于第c類,且該數(shù)據(jù)子集Xc大小為nc。
Xci(i=1,…,nc)為數(shù)據(jù)子集Xc內(nèi)的任意一個(gè)局部數(shù)據(jù)區(qū)域。
當(dāng)給定分類決策平面的法向量ω,則該方法對(duì)應(yīng)的類內(nèi)散度αW和類間散度αB分別如式(7)和式(8)所示:
αW=∑Cc=1∑nci=1∑ncj=1rwcij||LWM(ωTXci)-? LWM(ωTXcj)||2F
式(7)
αB=∑Cc1=1∑Cc2=1∑nc1i=1∑nc2j=1rbc1c2ij||LWM(ωTXc1i)-? ωTLWM(ωTXc2j)||2F
式(8)
其中,rwcij為同一類別下任意兩個(gè)局部數(shù)據(jù)區(qū)域之間的關(guān)聯(lián)系數(shù),當(dāng)且僅當(dāng)Xci與Xcj為同一類別下的最近局部數(shù)據(jù)區(qū)域時(shí),rwcij=1,其他情況下,則為0。
rbc1c2ij為不同類別下任意兩個(gè)局部數(shù)據(jù)區(qū)域之間的關(guān)聯(lián)系數(shù),當(dāng)且僅當(dāng)Xc1i與Xc2j為不同類別下的最近局部數(shù)據(jù)區(qū)域時(shí),rbc1c2ij=1,其他情況下,則為0。
故可以得到該分析方法的目標(biāo)函數(shù),如式(9)所示:
argmaxωTω=1J(ω)=(1-γ)αB-γαW式(9)
在式(7)中,LWM(ωTXci)與LWM(ωTXcj)具體如式(10)和式(11)所示:
LWM(ωTXci)=∑kcm=1β(m)ciωTx(m)ci∑kcp=1β(p)ci
式(10)
LWM(ωTXcj)=∑kcm=1β(m)cjωTx(m)cj∑kcp=1β(p)cj
式(11)
其中,kc為近鄰個(gè)數(shù);
x(m)ci為局部數(shù)據(jù)區(qū)域Xci的第m個(gè)數(shù)據(jù),β(m)ci為該數(shù)據(jù)的對(duì)應(yīng)權(quán)值;x(m)cj為局部數(shù)據(jù)區(qū)域Xcj的第m個(gè)數(shù)據(jù),β(m)cj為該數(shù)據(jù)的對(duì)應(yīng)權(quán)值。
將定義在局部數(shù)據(jù)區(qū)域上的權(quán)值擴(kuò)充到整個(gè)數(shù)據(jù)集X,則上述權(quán)值可以如式(12)和式(13)所示:
βci=(0,…,0n1,…,β(1)ci/∑ncp=1β(p)ci,…,β(nc)ci/∑ncp=1β(p)cinc,…,0,…,0nC)T
式(12)
βcj=(0,…,0n1,…,β(1)cj/∑ncp=1β(p)cj,…,β(nc)cj/∑ncp=1β(p)cjnc,…,0,…,0nC)T
式(13)
根據(jù)式(12)和式(13),則LWM(ωTXci)和LWM(ωTXcj)還可以分別表示為式(14)、式(15),進(jìn)一步得到式(16):
LWM(ωTXci)=βTciXTω
式(14)
LWM(ωTXcj)=βTcjXTω
式(15)
||LWM(ωTXci)-LWM(ωTXcj)||2F=||βTciXTω-βTcjXTω||2F
式(16)
根據(jù)||A||2F=tr(ATA),可以得到式(17):
||LWM(ωTXci)-LWM(ωTXcj)||2F
=||βTciXTω-βTcjXTω||2F
=tr((XTω-XTω)T(βTciXTω-βTcjXTω))
=tr(ωTX(βciβTci+βcjβTcj-2βciβTcj)XTω)
式(17)
其中,Lijc=βciβTci+βcjβTcj-2βciβTcj,Rwcij=diag(rwcij,…,rwcij)n,則式(7)可以改為式(18):
αW=∑Cc=1∑nci=1∑ncj=1rwcij||LWM(ωTXci)-LWM(ωTXcj)||2F????? ??=tr(ωTX(∑Cc=1∑nci=1∑ncj=1RwcijLijc)XTω)
=tr(ωTXLWXTω)
式(18)
其中,LW=∑Cc=1∑nci=1∑ncj=1RwcijLijc。
同理,式(8)可以簡(jiǎn)化為式(19):
αB=tr(ωTXLBXTω)式(19)
其中,LB=∑Cc1=1∑Cc2=1∑nc1i=1∑nc2j=1Rbc1c2ijLijc1c2,Lijc1c2=βc1iβTc1i+βc2jβTc2j-2βc1iβTc2j,Rbc1c2ij=diag(rbc1c2ij,…,rbc1c2ij)n。
在利用該有監(jiān)督的分析方法進(jìn)行特征提取求解時(shí),可以采用QR分解[26]的方法,從而大大降低時(shí)間復(fù)雜度,縮短計(jì)算時(shí)間,尤其在處理高維小樣本數(shù)據(jù)時(shí),其具有顯著的優(yōu)勢(shì)。
3? 實(shí)驗(yàn)
3.1? 數(shù)據(jù)樣本采集
為了驗(yàn)證本文方法的有效性,本文通過(guò)數(shù)據(jù)樣本采集和實(shí)驗(yàn)精度對(duì)比來(lái)進(jìn)行驗(yàn)證。
本文的數(shù)據(jù)樣本來(lái)源為某高校圖書(shū)館內(nèi)的1000本紙質(zhì)藏書(shū)。收集該1000本紙質(zhì)藏書(shū)
借閱前及歸還后的正反側(cè)三面圖像,共6000張。選擇的這些圖像均經(jīng)過(guò)了篩選,模擬自助還書(shū)系統(tǒng)的自動(dòng)拍照篩選功能,去除有反光、模糊、低對(duì)比度等問(wèn)題的圖像,保證圖像識(shí)別的有效性。經(jīng)整理,將這6000張圖像作為測(cè)試數(shù)據(jù)。
同時(shí),在系統(tǒng)內(nèi)保存用于評(píng)定損壞類型(劃傷、開(kāi)裂、破損、污漬、染色、涂寫(xiě))的圖片各100張,每種損壞類型中,嚴(yán)重?fù)p壞圖片、中度損壞圖片和輕度損壞圖片數(shù)量分別為30、40、30張。
值得注意的是,一本書(shū)可以被評(píng)定為多種損壞類型和損壞程度。在測(cè)試前,采用人工識(shí)別的方式識(shí)別出這1000本圖書(shū)的損壞類型和損壞程度。
3.2? 實(shí)驗(yàn)對(duì)比
實(shí)驗(yàn)一:采用傳統(tǒng)的特征提取方法和本文提出的方法進(jìn)行對(duì)比實(shí)驗(yàn)測(cè)試,在實(shí)驗(yàn)過(guò)程中都使用最近鄰分類器。測(cè)試結(jié)果如表1所示。
可以發(fā)現(xiàn),本文提出的方法較傳統(tǒng)的特征提取方法而言,一方面具有較高的識(shí)別精度,能夠較好地解決小樣本問(wèn)題;另一方面具有較短的CPU處理時(shí)間,算法的時(shí)間復(fù)雜度更低,圖書(shū)鑒損的時(shí)間更短。
實(shí)驗(yàn)二:利用本文提出的方法對(duì)1000本圖書(shū)的損壞類型和損壞程度進(jìn)行判定。測(cè)試結(jié)果如下:有22本圖書(shū)的正面損壞嚴(yán)重,14本圖書(shū)的反面損壞嚴(yán)重,9本圖書(shū)的側(cè)面損壞嚴(yán)重,在步驟3超過(guò)了損壞閾值,直接提示需要進(jìn)行修復(fù)工作。具體測(cè)試的損壞類型和程度結(jié)果如表2。
可以發(fā)現(xiàn),本文提出的方法可以有效對(duì)圖書(shū)正反側(cè)三面的損壞類型和程度進(jìn)行自動(dòng)識(shí)別,且識(shí)別精度高,準(zhǔn)確率大部分在85%以上,該方法有效地降低了人工成本。且從表2可以發(fā)現(xiàn),圖書(shū)正面的涂寫(xiě)、圖書(shū)反面的污漬以及圖書(shū)側(cè)面的開(kāi)裂數(shù)量較多,應(yīng)該引起重視,呼吁讀者愛(ài)護(hù)書(shū)籍。4? 總結(jié)與展望
本文設(shè)計(jì)的基于特征提取的快速圖書(shū)損壞鑒評(píng)方法是先得到圖書(shū)損壞初值,判斷該圖書(shū)損壞初值是否超過(guò)損壞閾值,若超過(guò),則顯示圖書(shū)已經(jīng)損壞嚴(yán)重,提示圖書(shū)館工作人員及時(shí)進(jìn)行圖書(shū)修復(fù);若沒(méi)有超過(guò)損壞閾值,則再進(jìn)行進(jìn)一步的判定,判斷損壞類型及程度,圖書(shū)館工作人員可以根據(jù)損壞類型和程度進(jìn)行對(duì)應(yīng)的修復(fù),并對(duì)一些損壞嚴(yán)重的書(shū)籍進(jìn)行優(yōu)先修復(fù)處理。不僅如此,還可以將同一名稱的多本書(shū)籍的損壞程度進(jìn)行排名,優(yōu)先將損壞程度低的書(shū)籍借閱給讀者。本文利用一種新的有監(jiān)督的分析方法進(jìn)行特征提取,保證信息的有效性,且最后通過(guò)實(shí)驗(yàn)來(lái)證明本文所提方法具有良好的應(yīng)用前景。
誠(chéng)然,本文所公開(kāi)的鑒評(píng)方法也存在一定的不足,比如如何識(shí)別圖書(shū)內(nèi)部的損壞情況,如何更有效地提高本文方法的執(zhí)行效率等,這些將是以后研究的方向。
參考文獻(xiàn):
[1]龔自振.大數(shù)據(jù)環(huán)境下高校圖書(shū)館館藏圖書(shū)優(yōu)化配置模型研究[J].圖書(shū)館研究,2018,48(3):44-49.
[2]王軍武.關(guān)于電子資源與紙本資源協(xié)調(diào)發(fā)展的思考和建議[J].圖書(shū)館,2012(5):105-107.
[3]吳漢華,王波.2022年中國(guó)高校圖書(shū)館基本統(tǒng)計(jì)數(shù)據(jù)分析[J].大學(xué)圖書(shū)館學(xué)報(bào),2023,41(6):63-72.
[4]蘇州大學(xué)圖書(shū)館.本館介紹[EB/OL].[2023-03-01].https://library.suda.edu.cn/4168/list.htm.
[5]你認(rèn)真讀書(shū)的樣子最美 2023蘇大校園閱讀報(bào)告來(lái)啦![EB/OL].[2023-03-01].https://mp.weixin.qq.com/s/XValstLQR2UucyK3aPdvYA.
[6]謝花寸,丁秀琴.高校圖書(shū)館開(kāi)架借閱中的圖書(shū)污損狀況及對(duì)策[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2010,20(19):35-37.
[7]王政軍,俞小怡,金玉玲.利用創(chuàng)新智能技術(shù)解決圖書(shū)污損問(wèn)題的探討[J].大學(xué)圖書(shū)情報(bào)學(xué)刊,2016(5):28-32.
[8]彭躍峰.高校圖書(shū)館中文藏書(shū)老化的半衰期分析:以華南農(nóng)業(yè)大學(xué)圖書(shū)館為例[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊,2018,30(7):91-99.
[9]鮑計(jì)國(guó),欒美晨.高校圖書(shū)館剔舊工作創(chuàng)新實(shí)踐:以遼寧對(duì)外經(jīng)貿(mào)學(xué)院圖書(shū)館為例[J].圖書(shū)館雜志,2017,36(2):74-78.
[10]楊海玲.圖書(shū)館藏書(shū)剔舊方法新探[J].圖書(shū)館建設(shè),2015(1):66-69,72.
[11]吳良凱.談圖書(shū)污損問(wèn)題[J].圖書(shū)館工作與研究,2004(4):74-75.
[12]吳慰慈.試論圖書(shū)保護(hù)學(xué)[J].圖書(shū)館工作與研究,1981(3):4-7.
[13]撕壞、涂鴉 溫嶺市圖書(shū)館每年5000冊(cè)圖書(shū)報(bào)損[EB/OL].(2017-05-11)[2023-03-01].http://www.576tv.com/Program/78942.html.
[14]單軫,陳雅.近七年國(guó)內(nèi)外圖書(shū)館智慧服務(wù)研究比較與啟示[J].圖書(shū)館學(xué)刊,2023,45(10):88-93.
[15]李郅琴,杜建強(qiáng),聶斌,等.特征選擇方法綜述[J].計(jì)算機(jī)工程與應(yīng)用,2019,55(24):10-19.
[16]JOLLIFFE I T.Principal component analysis[M].New York:Springer-Verlag,1986:15-20.
[17]袁旭,遲耀丹,吳博琦,等.基于PCA算法的人臉識(shí)別技術(shù)研究[J].信息技術(shù)與信息化,2021(3):34-37,41.
[18]WANG C P,ZHANG J S,SONG X L,et al.Face clustering via learning a sparsity preserving low-rank graph[J].multimedia tools and applications,2020,79:29179-29198.
[19]HEINSOHN D,VILLALOBOS E,PRIETO L,et al.Face recognition in low-quality images using adaptive sparse representations[J].Image and vision computing,2019,85:46-58.
[20]LONG Z G,GAO Y,MENG H,et al.Clustering based on local density peaks and graph cut[J].Information sciences,2022,600:263-286.
[21]劉穎,雷研博,范九倫,等.基于小樣本學(xué)習(xí)的圖像分類技術(shù)綜述[J].自動(dòng)化學(xué)報(bào),2021,47(2):297-315.
[22]VAPNIK V N.Statistical learning theory[M].New York:John Wiley & Sons,1998:38-43.
[23]尹峻松,肖健,周宗潭,等.非線性流形學(xué)習(xí)方法的分析與應(yīng)用[J].自然科學(xué)進(jìn)展,2007(8):1015-1025.
[24]皋軍,黃麗莉,孫長(zhǎng)銀.一種基于局部加權(quán)均值的領(lǐng)域適應(yīng)學(xué)習(xí)框架[J].自動(dòng)化學(xué)報(bào),2013,39(7):1037-1052.
[25]葛月月,曾勇,胡江平,等.改進(jìn)局部均值與類均值權(quán)重的近鄰分類[J].計(jì)算機(jī)工程與應(yīng)用,2017,53(17):137-142.
[26]燕列雅,于育民.用初等變換進(jìn)行矩陣的QR分解[J].數(shù)學(xué)通報(bào),1998(9):43-44,39.
作者簡(jiǎn)介:
王洋(1984— ),男,碩士,館員,任職于蘇州大學(xué)圖書(shū)館。研究方向:圖書(shū)采訪、文獻(xiàn)資源建設(shè)。