999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于遺傳神經網絡的圖書采購推薦模型研究

2022-05-10 07:58:02蔡丹丹
圖書館研究與工作 2022年5期
關鍵詞:圖書館優化模型

蔡丹丹

(上海圖書館 上海 200031)

圖書采購在圖書館工作中有著極其重要的地位,采購策略對于圖書館館藏質量和服務水平有著決定性的作用[1],同時對于讀者滿意度、閱讀推廣效果等方面也都有著很深遠的影響。采購書目的質量和復本量關系著圖書館能否利用投入采購中的有限的成本更好地滿足讀者的需求[2]。對于許多圖書館來說,充分利用有限的經費同時達到購買到的圖書是讀者最需求的效果,是圖書采購中的核心問題[3]。

圖書館更好的生存與發展和先進技術的運用是密不可分的。目前圖書采購中的讀者決策采購(Patron Driven Acquisitions,PDA)模式很受歡迎,但對公共圖書館來說,如果同時收到的讀者需求較多,如何篩選真正有價值、利用率高的圖書,關系著讀者決策采購的相關投入能否得到最優化利用。而對圖書價值和利用效率的預判,目前在許多圖書館中還是基于采訪人員對圖書信息的把握和個人經驗。隨著智慧圖書館概念的發展和人工智能技術的廣泛應用,將圖書采購原則與計算機技術相結合,減少圖書采購時的主觀判斷因素,形成更科學高效的采購策略,是在“互聯網+”時代發展智慧圖書館亟需面對的課題。

本文利用近年流行的神經網絡結合遺傳算法對圖書進行協同分析,將圖書分為有借閱圖書(“熱門書”)和零借閱圖書(“冷門書”)兩類,獲得基于圖書特征的借閱預測模型,在采購前對一本書是否會成為“熱門書”進行預測,從而為是否滿足讀者提出的采購需求提供依據。

1 圖書采購模型研究現狀

目前圖書采購研究熱點是讀者決策采購、圖書招標采購等采購方法,數據挖掘在圖書采購中的應用也是研究熱點之一[4]。許多研究者提出了不同的數據挖掘模型來建立科學的圖書采購決策,但這些模型也都有尚待解決的問題。

1.1 現有數據分析模型的優化

有研究者將回歸分析模型應用于建立圖書借閱率預測模型,并以此作為圖書采購復本量的參考[5]。但回歸分析需要依賴線性相關關系,當訂購數量作為決策對象時,與采購相關的多因子沒有很好的線性相關關系[6]。為了實現圖書建設的良性發展,得到一個有效的、可觀的訂購策略,有研究者建立了基于單隱層神經網絡的圖書訂購動態模型,來實現圖書購買經費的優化配置,該模型可以較好地處理非線性相關關系[6]。

為減少主觀因素,增強圖書采購的科學性,有部分研究者及圖書館嘗試過建立基于層次分析法的圖書采購策略[7]。層次分析法是一種有效的系統分析方法,基于人的決策和判斷,結合部分定量信息,為解決復雜的決策問題提供簡便的決策方法,但仍然較為依賴人的判斷,存在準確性和客觀性不足的缺陷[8]。有的研究者引入了基于BP(Back Propagation)算法的神經網絡,即BP神經網絡,來對層次分析法進行優化,這種優化方法相對于單純的層次分析法,具有不需要進行一致性檢驗、避免出現邏輯錯誤的優點,但同時該模型也有收斂速度受限和可能出現局部最小的情況尚待改善[8]。

由此可以發現,許多研究者提出的圖書采購模型中存在缺乏客觀性、準確性的問題,都可以通過構建基于神經網絡的采購模型來得到解決。但無論是神經網絡模型還是有一定改進的BP神經網絡模型,在構建時都具有一定的局限性,收斂效率和局部最小問題等都有繼續優化的可能。因此,在進行圖書采購模型的研究時,我們可以考慮引入遺傳算法來進一步優化神經網絡模型。遺傳算法具有良好的全局搜索性能,并減少了陷入局部最優解的風險,這些優點恰好可以彌補神經網絡的缺點[9]。

1.2 現有神經網絡模型的應用

目前應用于采購的神經網絡模型有許多不同的類型,有的研究者提出通過LVQ(Learning Vector Quantization)神經網絡,基于圖書的特征對是否采購進行預測[10];也有研究者通過灰色神經網絡構建了基于拒借率和流通率的圖書復本量預測模型[2],等等。但這些基于神經網絡的采購模型,一方面顯示出神經網絡模型相對于傳統回歸模型,預測精度更高[2],但同時都無可避免地受到神經網絡模型本身固有缺陷的限制。

有一部分關于圖書采購模型的研究也探討了神經網絡模型的不同優化方法,比如結合帶有影響因子的遺傳算法,預測某本書是否會被本校圖書館采購[11];以及通過遺傳算法對基于神經網絡和支持向量機的兩種采購模型進行優化,對比優化后對圖書館是否采購的預測準確度[3]。這些優化模型都取得了比原有的標準神經網絡模型更好的預測結果,因此基于遺傳神經網絡原理來構建采購模型是一個可行的方法,而且相較于基于標準神經網絡的模型,能取得更好的效果。由此,本文選擇了基于遺傳算法的神經網絡來構建采購決策模型。

此外,綜合上述案例可以發現,在神經網絡與圖書采購策略結合方面的研究,主要集中在對是否采購的研究,是基于過往采購專員的采購行為而形成的函數,可以達到的效果是減輕采購專員的機械勞動量。本文則希望通過對遺傳神經網絡的應用,形成關于零借閱圖書的非線性映射模型,模型的構建是基于對過往讀者行為的總結,嘗試從讀者行為角度,為采購決策提供科學的依據。

2 神經網絡及遺傳算法概述

本文選擇利用遺傳算法對神經網絡進行優化,構建基于遺傳神經網絡的采購決策模型,而不是采用傳統的標準神經網絡,是考慮到神經網絡和遺傳算法的特點,利用遺傳算法作為神經網絡學習和訓練的基礎,以期能夠獲取一個預測精度更高、訓練效率更好的模型。

2.1 神經網絡概述

神經網絡具有極強的非線性映射能力,因此可以很好地處理非線性映射關系。理論上,對于一個三層和三層以上的網絡,只要隱含層神經元數目足夠多,該網絡就能以任意精度逼近一個非線性函數[3]。但標準神經網絡也存在一定缺陷。我們可以把神經網絡的整個計算過程看作是一個優化學習和訓練函數的過程,我們需要在計算中找到算法的權值和閾值,在此范圍內,根據輸出結果與實際預期結果的比較,可以得到最小誤差值[12]。因而,在尋找權值和閾值的過程中,由于初始值是根據經驗預設,就有陷入局部極小值的風險,同時初始值設定距離最優值較遠,就會存在訓練時間比較長的問題。

此外對于神經網絡的特點有多種優化方法,其中應用比較廣泛、結構比較簡單的是基于BP算法的神經網絡,即BP神經網絡,是標準神經網絡的改進。它是一種雙向預反饋神經網絡,它的反饋機制能夠修正神經網絡的一部分缺點以提高訓練效率,但始終存在陷入局部極小值的風險,并且訓練樣本數的增加仍然會降低模型的收斂速度[13]。

2.2 遺傳算法概述

美國密歇根大學Holland于1975年提出的遺傳算法是一種通過模擬生物進化過程,基于“優勝劣汰”的原理,選擇、進化、迭代計算尋找最優解的算法[14]。其本質是一種全局優化搜索的方法,它能在搜索過程中自動獲取和積累有關搜索空間的知識,并自適應地控制搜索過程以求得最優解[11]。

遺傳算法可以對神經網絡的權值和閾值進行優化,代替隨機根據經驗設置的初始值。因此有研究者通過引入具有良好全局尋優能力的遺傳算法,建立遺傳神經網絡,來優化標準神經網絡,發現遺傳算法有能力較好地降低標準神經網絡存在的容易陷入局部極小的風險[15]。同時也有研究發現,遺傳算法能夠有效地解決神經網絡中的預反饋信息問題,因此通過遺傳算法優化的神經網絡結構可以解決神經網絡收斂速度慢、運行效率低等問題[12]。

遺傳算法和神經網絡的特點決定了將兩者結合使用,是一種優化構建模型的方法,可以使神經網絡具有自進化與自適應能力[14],從而使模型面對圖書館中樣本數據量較大的情況時,能夠發揮效率優勢和精準度優勢。

3 基于遺傳神經網絡的圖書采購推薦原理

上海圖書館目前開展了多種表現形式的讀者決策采購,包括在書目查詢系統中開通了“中文圖書你薦我購”標簽頁[16],以及在上海書展期間的“你選書,我買單”活動等,都能在一定程度上滿足讀者的個性化需求。但面對多樣化需求時也要考慮到,盡管PDA在一定程度上都體現館藏建設“以用戶為主導”的特點,但讀者們的選擇也是充滿個人偏好的選擇[17]。如何科學高效地利用投入采購中的成本,使按需采購的圖書是更多讀者需要的圖書,也是公共圖書館需要決策的重點。

因此,本文利用遺傳算法優化神經網絡模型,現有讀者行為結合書目信息預測圖書是“冷門書”還是 “熱門書”,從而可以為是否滿足讀者需求進行采購提供依據。如果模型預測為“熱門書”則推薦優先采購,如果模型預測為“冷門書”則根據采購成本延后采購。

3.1 數據集選擇

數據集來自上海圖書館普通外借類型圖書,共計627 529冊,選取其中的零借閱圖書數據共82 779冊。通過書目號篩選,發現零借閱圖書為7 729種。提取這7 729種書籍的特征值量化作為零借閱書目數據集,相對應地選取普通外借類型圖書中借閱量排名在前8 000種的書目作為有借閱書目數據集,共提取15 729種書籍的書目信息。篩選其中編目數據比較完整的書目共得到14 834條書目,因此數據集為:零借閱書目7 358種, 有借閱書目7 476種。

3.2 設計步驟

通過遺傳算法優化神經網絡模型的設計步驟為:①數據采集。提取大多數圖書都有的書目信息作為特征值,對特征值進行量化。②創建神經網絡,數據集導入MATLAB(Matrix & Laboratory)中,共14 834條數據,其中訓練數據14 000條,測試數據834條。③通過遺傳算法優化神經網絡的閾值和權值。④將優化后的閾值和權值帶入還未開始訓練的神經網絡。⑤訓練神經網絡。⑥測試神經網絡。⑦分析準確率。

3.3 特征值的選擇和量化

首先,根據特征在數據集中的數量進行排序,優先選擇數量比較多的特征;其次,對特征是否會對讀者借閱行為產生影響進行分析判斷,選取會對借閱產生影響的特征。因此,本文選取分類、著者、主題、出版社、出版日期、開本、頁碼、語種這8個特征進行量化。

著者、主題、出版社都通過統計詞頻后排序實現量化,由于是非線性映射,排序號碼數值的大小與最終判斷結果并無線性邏輯關系,因此直接將排序號作為量化值。

4 遺傳神經網絡構建過程

本文基于MATLAB構建神經網絡并通過遺傳算法優化神經網絡的結構和神經元權重,從而利用遺傳神經網絡判斷某本書目為零借閱圖書還是有借閱圖書。

4.1 數據準備

數據存儲在MATLAB數據文件中,共有14 834條數據,包括圖書館當前普通外借的冷門書籍和熱門書籍。輸入神經元的個數為8,代表書籍的各種特征,輸出神經元個數為1,輸出值通過一定規則判定為0或2,分別代表冷門書籍、熱門書籍。樣例數據如表1所示。

表1 樣例數據

4.2 構建神經網絡

首先創建神經網絡,設置節點個數、訓練集和測試集。主要代碼如下:

load data input output %讀取數據。

inputnum = 8;hiddennum = 12;outputnum = 1; %節點個數。

input_train = input(1:14000,:)'; input_test = input(14001:end,:)'; %訓練數據和預測數據。

output_train = output(1:14000)'; output_test = output(14001:end)'。

4.3 利用遺傳算法優化神經網絡

遺傳算法優化過程包括:初始化參數和種群;記錄平均適應度;通過選擇、交叉、變異計算迭代求解最佳閾值和權值。其中選擇、交叉、變異算法的主要過程如下:

individuals=select(individuals,sizepop);avgfitness=s um(individuals.fitness)/sizepop; %選擇。

individuals.chrom=Cross(pcross,lenchrom,individua ls.chrom,sizepop,bound); %交叉。

individuals.chrom=Mutation(pmutation,lenchrom,in dividuals.chrom,sizepop,i,maxgen,bound); %變異。

4.4 生成神經網絡

通過遺傳算法獲取神經網絡的最佳初始閾值和權值之后,將這些初始值帶入神經網絡,進行神經網絡訓練,并獲取預測結果。神經網絡訓練和獲取預測結果的主要過程如下:

[net,per2]=train(net,input_train,output_train);%訓練神經網絡。

BPoutput=sim(net,input_test); error=BPoutputoutput_test; result_t = [output_test' BPoutput' error'];%輸出神經網絡預測結果。

5 結果分析

多次運行遺傳神經網絡進行訓練測試,表2中為樣本、訓練集、測試集的數據基本信息,表3為其中4次的運行結果。

表2 數據基本信息

表3 運行結果

由表3運行結果統計可見,該模型的運行穩定性較高,對“熱門書”預測的平均準確率達到89.78%,對“冷門書”預測的平均準確率達到84.40%,平均預測準確率可以達到87.23%。模型獲得的誤差值較小,且運行結果比較穩定,能夠達到預測圖書屬于“冷門書”或者“熱門書”的目的。同時遺傳神經網絡模型具有運行效率高的特點,即使導入新的數據,學習效率也很高,因此該模型可以為圖書采購提供一定建議,并經常根據讀者行為進行修正。

6 結語

通過對上海圖書館普通外借數據的整理和統計,可以發現遺傳神經網絡在基于讀者行為的外借預測中有較好的表現,可以通過該模型獲取到推薦優先采購的書目。此外,本文中設想的模型應用場景是處理多樣化的讀者推薦采購書目,但模型通過改進或許也可以應用于圖書批量采購。由于應用于圖書批量采購時,對模型的精準度要求更高,因此未來的研究中,可以通過引入主題詞、標題、摘要等書目信息中語義相關的特征值,來優化模型獲取更加準確的預測結果。

同時,從采購決策上來說,對許多專業圖書館、社區圖書館來說,在預算有限的情況下,提高采購決策的科學性和準確率,可以顯著優化館藏建設。從這一點考慮,遺傳神經網絡模型由于具有提高模型運行效率、優化準確率的特點,通過這一方法來構建新的采購決策模型或者優化原有采購模型,都是有價值的改進嘗試。但同時,對大型公共圖書館和大型專業館來說,“應采盡采”或“飽和采購”是其應盡的義務,這類模型的使用或許收效有限,但依然可以依據預測結果來決定采購順序,提升服務效率。

猜你喜歡
圖書館優化模型
一半模型
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
飛躍圖書館
3D打印中的模型分割與打包
主站蜘蛛池模板: 孕妇高潮太爽了在线观看免费| 成人福利视频网| 囯产av无码片毛片一级| 国产超薄肉色丝袜网站| 成人免费一区二区三区| 999在线免费视频| 亚洲天堂区| 久久精品国产国语对白| 在线无码九区| 日本91在线| 免费国产黄线在线观看| 精品国产一二三区| 亚瑟天堂久久一区二区影院| 波多野结衣AV无码久久一区| 日韩亚洲高清一区二区| 久久国产亚洲偷自| 色屁屁一区二区三区视频国产| 亚洲综合亚洲国产尤物| 99久久精品久久久久久婷婷| 99re在线免费视频| 亚洲色无码专线精品观看| 国产精品xxx| 91在线播放国产| 91精品视频播放| 亚洲人成影院在线观看| 成人福利在线观看| 亚洲成A人V欧美综合天堂| 国产美女在线免费观看| www.99在线观看| 五月婷婷精品| 日韩精品无码不卡无码| 亚洲啪啪网| 国产精品乱偷免费视频| 亚洲AV无码久久精品色欲| 国产国产人在线成免费视频狼人色| 久久久亚洲色| 亚洲成人免费看| 亚洲成人免费在线| 亚洲天堂久久新| 亚洲天堂视频网站| 欧美色亚洲| 91精品日韩人妻无码久久| 色综合中文| 国产午夜一级毛片| 国产亚洲欧美日韩在线一区二区三区| 久久精品只有这里有| 国产毛片久久国产| 亚亚洲乱码一二三四区| 欧美不卡视频在线观看| 无遮挡国产高潮视频免费观看| 欧美精品导航| 色综合天天综合中文网| 国产剧情一区二区| 99免费在线观看视频| 亚洲成人在线免费| 国产免费精彩视频| 狠狠干欧美| 在线免费不卡视频| 亚洲色图另类| 婷婷综合在线观看丁香| 九色在线观看视频| 999福利激情视频| www.精品视频| 久久精品中文无码资源站| 日韩精品一区二区三区免费| 国产在线精彩视频论坛| 极品国产在线| 中文字幕亚洲无线码一区女同| 91年精品国产福利线观看久久| 全部免费特黄特色大片视频| 成人福利在线看| 青青青视频91在线 | 美女免费黄网站| 国产一级毛片在线| 91外围女在线观看| 婷婷色在线视频| 亚洲浓毛av| 国产亚卅精品无码| 国产精品护士| 香蕉视频在线观看www| 精品人妻无码中字系列| 亚洲av成人无码网站在线观看|