999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

結合會員借閱行為的圖書館啟發式借閱流程模型構建

2023-10-12 09:41:44劉晶
微型電腦應用 2023年9期
關鍵詞:特征系統

劉晶

(青島大學附屬醫院,圖書館,山東,青島 266003)

0 引言

近年來,因為會員閱讀習慣逐漸轉向有聲書及電子書,公共圖書館的實體書借閱市場受到沖擊。而公共圖書館屬于非盈利機構,其對社會效益的需求遠大于經濟效益[1]。實體書本身的文化承載力、知識傳播力應得到有效強化。所以,當前各地公共圖書館在全面展開紙質書電子化的技術革新的同時,也在積極構建實體書借閱推薦技術升級工作[2]。

該研究有兩個前提:①所有實體書均經過了全面電子化處理,包括借閱卡信息的電子化和圖書內容的電子化,圖書全部檢索信息和圖書內容均可通過計算機通道完成檢索;②公共圖書館有完善的會員體系,該會員支持會員在線借閱電子書、有聲書的同時,也支持會員的實體書借閱過程,且全部借閱信息形成統一的會員數據畫像系統[3]。

通過會員借閱習慣大數據畫像,構建啟發式借閱流程,向會員推薦適合其閱讀習慣的圖書,并完成借閱預約,是該研究的重點和創新點[4]。

1 全面電子化的公共圖書館大數據體系

公共圖書館的數據來源主要為以下3項:①圖書電子化大數據:通過激光掃描、文字識別、機器翻譯等模塊化數據處理工具,將實體書的文字部分轉化為多種語言的電子文本,部分圖書館可以利用機器朗讀等模塊化處理工具將實體書轉化成的電子書轉化為音頻,構建有聲書數據,這些數據可以實現電子書與實體書的線上線下雙通道借閱;②圖書借閱卡大數據:圖書的書名、作者、出版社、出版時間、印次與印數、開本、頁數、文獻識別碼、中圖分類號、多語言版本摘要、關鍵詞等形成傳統圖書借閱卡的基本內容,這些內容之間可以形成檢索邏輯,實現批量檢索,大數據環境下,圖書電子化后,圖書的詞頻特征碼、文風標識碼等圖書內容挖掘信息也會被計入圖書借閱卡大數據中,實現整體檢索邏輯;③會員大數據:會員的姓名、年齡、性別、民族、工作單位、工作性質、線上借閱記錄、實體書借閱記錄等會形成會員大數據,該研究中重點利用圖書電子化大數據和圖書借閱大數據對會員大數據進行賦值,形成啟發式借閱推薦流程模型。上述3項大數據的邏輯關系如圖1所示。

圖1 啟發式借閱流程模型基本邏輯架構圖

圖1中,系統最終向借閱者提供的圖書推薦分類,按照優先級,主要有以下4類:①與會員多次借閱歷史圖書相同關鍵詞或相近書名、相近內容的圖書,從受眾心理學角度分析,這類圖書屬于純理智條件下會員最容易接受的圖書,但應排除會員希望更換借閱范疇嘗試新型圖書的心理趨向;②與會員多次借閱歷史圖書相同作者或作者存在關聯的圖書,作者存在關聯指2個作者多次發表同類圖書或2個作者存在親緣、同事等關系,如讀者多次借閱賈平凹的圖書,系統可以嘗試向其推薦賈淺淺的圖書;③推薦與讀者工作內容、工作性質相關的圖書,因為當前實體書中比例最大的圖書種類為職業經驗、輔導類圖書,如讀者為公務員或企事業單位管理干部,則向其推薦管理學、心理學相關書籍,如讀者為工程師、技術類工作或工人,則向其推薦技術輔導類圖書;④推薦讀者自選多個關鍵詞相關的圖書,包括書名、關鍵詞、摘要、內容詞頻特征等借閱卡資料中包含該類關鍵詞的圖書[5-6]。

綜合上述推薦需求,結合前文圖1展示的邏輯架構,該大數據體系中核心工作流程節點為圖書的電子化過程、詞頻提取過程、圖書文風標識碼提取過程。下文中將重點針對這三項工作展開論述[7-9]。

2 實體書電子化相關技術及工作流程

當前技術條件下,實體書電子化工作僅能滿足將實體書的文本部分轉化為電子文本并進行后續處理,包括機器翻譯、詞頻提取、機器朗讀等,但實體書電子化過程是實現該技術的重要支持因素。相比較單純使用電子化圖書借閱卡執行圖書推薦操作,將實體書電子化后形成更完善的圖書特征描述體系,更適合大數據云計算體系下的計算機輔助圖書推薦算法需求。該過程基本邏輯架構如圖2所示。

圖2 實體書電子化工作流程邏輯架構圖

圖2中,激光掃描位圖生成過程和識別過程采用漢王激光掃描系統,機器翻譯使用百度翻譯系統,機器朗讀采用科大訊飛機器朗讀系統,均可實現相關軟件技術的全面國產化,而后續的詞頻分析功能、神經網絡分析功能使用MATLAB大數據分析工具軟件。該系統通過文風特征碼和詞頻特征碼實現對圖書內容可供機器學習功能主動識別的數字化信息,文字識別后的原始語言版本和機器翻譯后多語言版本,也用于直接檢索過程[10]。

3 詞頻特征碼與文風特征碼的提取與應用過程

詞頻特征碼與文風特征碼均為64位比特型數據,其實際構成為2個每個4字節(32位)雙精度浮點型變量的前后疊加,其初始生成算法架構如圖3所示。

圖3 特征碼生成算法邏輯架構圖

圖3中,使用2個結構相同、輸入數據相同的卷積神經網絡模塊分別生成2列獨立數據,2個神經網絡模塊在不同訓練需求下向不同方向收斂,進而進入2個卷積神經網絡,分別生成特征碼的高32位(由雙精度浮點型變量強制轉化而來)和低32位(由雙精度浮點型變量強制轉化而來)。其中,生成高32位特征碼的神經網絡在另一路神經網絡輸出端取1路補充數據。最終疊加為一個64位特征碼。詞頻特征碼與文風特征碼的生成邏輯架構基本一致,僅其輸入數據有所差異,生成詞頻特征碼的輸入數據為電子書經過詞頻提取算法后的詞頻序列數據,生成文風特征碼的輸入數據為電子書的原始文本數據[11-12]。

2個特征碼被提取后,與會員閱讀習慣特征碼進行比較和合并,機器學習算法會判斷會員閱讀習慣特征碼與圖書的2個特征碼的相似度,給出推薦序列,且會員執行借閱后,其會員特征碼會根據圖書的2個特征碼進行刷新改寫。該過程的邏輯架構如圖4所示。

圖4 特征碼應用及轉換機制邏輯架構圖

圖4中,使用二值化神經網絡,給出一個[0,1]區間上的判斷結果,經過神經網絡數據訓練,少部分圖書會偏向1.000方向,作為推薦篩選結果書目,其余大部分圖書偏向0.000方向,在推薦系統中被篩選屏蔽。會員借閱時,詞頻特征碼與文風特征碼聯通會員特征碼一起被輸入到一個卷積神經網絡模塊中,生成合并后的新會員特征碼,該特征碼會對會員卡數字化信息進行重新賦值,用于后續判斷過程。在新會員特征碼的生成算法中,實體書借閱時間、電子書和有聲書的瀏覽時間等會作為其他控制變量用于新會員特征碼的生成計算過程。

上述特征碼比較過程獨立在前文所述的傳統圖書推薦流程之外,形成該研究中創新提出的基于機器學習的圖書推薦算法,用于前文4種推薦需求的第1種推薦需求中。該算法將徹底杜絕傳統算法的以下兩點不足:①傳統算法受制于圖書借閱卡基本信息的不完備性,圖書借閱卡中不論是關鍵詞、書名還是摘要信息,均無法全面表達圖書的類型信息,而使用該推薦算法后,當神經網絡的節點數量和隱藏層規模等達到一定兩邊基數后,系統可以更充分判斷會員的后續借閱行為;②傳統算法與該創新算法相結合,將該算法作為優先推薦門類,在其他推薦板塊仍然保留傳統推薦算法的推薦結果,可以使兩者形成有益互補[13]。

4 該算法對啟發式借閱流程的實際支持效果

4.1 仿真條件下的效果測試

首先對該算法的神經網絡進行數據訓練,訓練模式為在MATLAB環境下搭建鏡像仿真平臺,電子化實體圖書原始資料和圖書借閱卡原始資料拷貝自公共圖書館真實資料,訓練數據來自會員借閱記錄,即根據會員之前借閱記錄和下次借閱記錄,推測一個推薦范圍,使推薦范圍內圖書出現在該推薦范圍中。實際訓練過程中,選擇2019年及2020年全年的借閱記錄,使用其中18個月數據作為原始訓練數據,6個月數據作為驗證數據。根據個人閱讀習慣,選取前6位推薦和前20位推薦,最終驗證結果如表1所示。

表1 仿真環境下的驗證結果

表1中,t值與P值來自SPSS大數據分析軟件中的雙變量t校驗分析,用于比較的差異性并提供差異性結果的信度。當t<10.000且P<0.01時,認為2組數據具有顯著的統計學差異,且t值越小證明差異性越大,P值越小證明差異性結果信度越高。表1中,使用該系統后,前6位重點推薦書目中,會員借閱量從0.271冊提升到0.893冊,即借閱率從4.5%提升到14.9%,提升了3.3倍,前20位推薦書目中,會員借閱量從0.639冊提升到1.580冊,即借閱率從3.2%提升到7.9%,提升了2.5倍。該借閱率提升的量變引起了質變,即會員從前20位推薦書目中必然選擇借閱1冊,使推薦效率大幅度提升,會員對推薦書目的依從性大幅度增強。

4.2 啟發式借閱系統試運行結果

在上述仿真分析的基礎上,該研究成果論證階段,推出了與傳統借閱系統平行的借閱系統,會員可以在使用借閱推薦系統時選擇使用新系統或者傳統系統檢索圖書。2021年1月20日至今,使用新系統完成借閱檢索的會員2761人,人均使用5.27次,即該系統先后服務借閱過程14 550人次,比較會員使用該系統后選擇借閱圖書的位置,得到表2。

表2 會員借閱過程推薦位置使用率的比較結果

表2中,推薦位的相關算法有直接差異,具體表現在該系統使用的推薦算法結合了前文所述的機器學習推薦算法,之前系統的推薦算法是根據關鍵詞檢索的傳統推薦算法。使用該系統后,推薦位給出的書目,會員接受度和認可度更高,具體表現在之前系統中75.27%的借閱行為需要通過會員主動搜索才可以確定借閱書目,而使用該系統后,會員主動搜索的借閱行為占比下降到了28.79%,可以推算出,推薦成功率從24.73%提高到71.21%,提升2.9倍。表2中,雙變量t校驗結果,t<10.000,P<0.01,具有顯著的統計學差異。

在驗證過程中,為了評價會員對系統推薦效果的主觀評價,要求使用過該系統的會員做出主觀滿意度評價,滿分10分,最低0分,參加該主觀評價的會員量為851人,占全部使用過該系統會員2761人的30.8%,其評價結果如表3所示。

表3 會員主觀評價結果匯總表

表3中,使用該系統后,會員對該系統的主觀評價明顯高于對之前系統的評價,平均分從7.52提升到8.93,提升幅度為18.75%。該數據經過雙變量t校驗,t<10.000,P<0.01,具有顯著的統計學差異。

5 總結

該研究核心創新點在于引入基于卷積神經網絡、二值化神經網絡等機器學習算法,讓系統的推薦書目更符合會員的借閱預期書目,實現啟發式借閱推薦模式。經過仿真實驗和試運行,會員對推薦位置書目的借閱量顯著增加。因為該研究使用了最初級的神經網絡架構,所以神經網絡設計過程未展開論述,后續研究中,將從軟硬件兩方面全面升級神經網絡,實現更深度地數據挖掘機器學習過程,使啟發式借閱模式的算法效率進一步提升。

猜你喜歡
特征系統
抓住特征巧觀察
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
新型冠狀病毒及其流行病學特征認識
基于PowerPC+FPGA顯示系統
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
半沸制皂系統(下)
抓住特征巧觀察
主站蜘蛛池模板: 亚洲浓毛av| 亚洲AV无码乱码在线观看代蜜桃 | 自拍欧美亚洲| 精品国产美女福到在线直播| 国产一区二区三区精品久久呦| 欧美日韩va| 国产农村妇女精品一二区| 亚洲欧美国产高清va在线播放| 五月综合色婷婷| 亚洲欧美自拍视频| AV不卡无码免费一区二区三区| 亚洲天堂日韩av电影| 国产在线无码av完整版在线观看| 亚洲欧美成人在线视频| 看你懂的巨臀中文字幕一区二区| 国禁国产you女视频网站| 国产成在线观看免费视频| 中文字幕在线播放不卡| 日本免费a视频| 美女无遮挡免费视频网站| 99在线国产| 亚洲综合色婷婷| 亚洲精品无码成人片在线观看| A级毛片高清免费视频就| 无码免费的亚洲视频| 视频二区亚洲精品| 国产亚洲视频中文字幕视频| 国产成人综合亚洲欧洲色就色| 久久青草精品一区二区三区| 免费啪啪网址| 日韩欧美国产精品| 国产在线观看一区精品| 91黄视频在线观看| 亚洲欧美日韩动漫| 免费一看一级毛片| 国产亚洲成AⅤ人片在线观看| 国产99视频精品免费视频7| 99在线视频免费| 亚洲人成人无码www| 国产毛片片精品天天看视频| 国产日产欧美精品| 性欧美久久| 免费AV在线播放观看18禁强制| 国产精品香蕉在线观看不卡| 免费看a级毛片| …亚洲 欧洲 另类 春色| 午夜视频在线观看免费网站| 在线观看的黄网| 成人综合久久综合| 欧亚日韩Av| 五月婷婷亚洲综合| 欧美日韩中文国产va另类| 中文字幕在线欧美| 日韩欧美中文字幕一本 | 亚洲精品无码AⅤ片青青在线观看| av一区二区人妻无码| 国产91视频免费观看| 免费国产高清精品一区在线| 国产网站免费看| 全免费a级毛片免费看不卡| 日韩大片免费观看视频播放| 久久精品女人天堂aaa| 全部毛片免费看| 国产菊爆视频在线观看| 一区二区三区毛片无码| 亚洲AV无码久久精品色欲| 国产在线精彩视频二区| 五月天久久综合| 久久99久久无码毛片一区二区| 91久久偷偷做嫩草影院电| 久久99这里精品8国产| 日韩A∨精品日韩精品无码| 国产噜噜在线视频观看| 久久精品视频亚洲| 色欲综合久久中文字幕网| 欧美不卡在线视频| 黄片一区二区三区| 亚洲男人的天堂久久精品| 亚洲成a人片77777在线播放| 欧美国产另类| 黄色网站不卡无码| 99爱在线|