李雁翎
人天書店在當今國內圖書出版界享有盛名。由于合作機緣,筆者對它作為一個文化企業的文化涵養、行業素質、職業作風等印象,是一步一步地加深。了解了“人天品牌”的精神內涵,看到了“人天品牌”生命的活力,以及它自我糾正、自我完善的前進歷程,感受到了企業以“服務為本”的自我控制能力。人天書店的成長歲月中的艱辛和輝煌在他們積累數年的年終總結報告即“人天檔案”中躍然紙上。
“人天書店是為圖書館提供專業化服務的專業化書店,建立以數據技術、網絡技術為核心,以檢索為引導,以銷售為目標,以加工和物流相配套的業務流程。”這是鄒進董事長為人天書店做的定位。人天書店順應時代發展,利用現代信息技術維系用戶、服務用戶的企業的生命本質。人天書店的信息化和數據加工技術的隊伍也在不斷地成長壯大,從幾個人的技術支持到現在的研究中心,從大專學歷的專業人員到研究生學歷。技術不斷提升,軟件產品不斷出新。
“人天編目數據平臺”是人天書店數字化服務的基礎
2010年,我與人天書店有了合作的機會,從此開啟更多的接觸。以往筆者關注的數據庫應用研究領域擴展到了圖書行業,而隨著大數據的火爆,數據挖掘、機器學習、深度學習的不斷升溫,我與人天書店的關系也越來越密切,鄒進董事長成為筆者的朋友和合作伙伴。
當時,人天書店編目數據處理狀況遇到了“瓶頸”。應該怎樣為企業服務?鄒進董事長滿腦子的想法,可是由于當時企業的人力和技術局限,不能夠完全理解和解決“老總”的問題。于是我們商定建立科學先進的“人天編目數據平臺”的合作方向。
從“編目數據平臺”創建初期調研過程中,筆者了解到鄒進的“服務為先,與時俱進,不斷創新”的理念。當時,人天書店為了更好地服務用戶,其中一項服務是為圖書館提供“圖書編目”數據,由于圖書館使用的“圖書館管理信息系統”不同,圖書的編目數據有常用的兩種,即“CALIS編目規則”和“ 中文圖書編目規則”。在進行館配的業務中“兩碼切換”頻率十分頻繁,費時費力。為滿足用戶的需求,當時人天書店不惜成本,一本書加工兩條編目數據,鄒進看到提升工作效率和節省人力的空間,提出了“二碼合一”理念。在幾次交流過程中,筆者從根本不知道“編目”數據是什么的外行,到如今從編目中看到了無限的可能。
經過雙方的不斷溝通,我們團隊設計開發了 “人天編目數據平臺”,實現“兩碼統一”基本需求,并創建了“人天碼”這一人天書店專用編目數據庫。這個編目數據加工系統更準確地說,它不僅僅是一個編目數據加工的軟件系統,我們更愿意稱之為“人天編目數據平臺”,它的功能可“無限”的延展,可與外界進行更“多元”交互,這個理想的狀態將隨著時間的推移不斷靠近。
在開發和實踐過程中,筆者發現了“編目”數據背后的魅力,看到了“編目”數據記錄的信息,可賦予一本圖書除內容之外的其他內涵。現在人天書店已經有編目數據數百萬條,利用大數據工具進行數據挖掘,將編目數據與銷售、編目數據與作者、編目數據與館藏等多維數據加以加工,他們將會有更多具有競爭力決策行為,直至可將服務延伸到具體的客戶服務終端。
“中國可供書目”是人天書店與用戶的紐帶
什么是“可供書目”?“知道有這本書,還要知道它在哪里。”筆者想借題發揮一下:“可供書目,是出版信息與銷售信息一體的信息源,是圖書流通資訊。”人天書店的可供書目創建,也經歷了時間的磨礪。
人天書店在1999年就有了《人天書目報》,是人天書店為用戶提供的可供書目信息。這比2002年原新聞出版總署信息中心推出的可供書目,中國出版集團提出的可供書目,還要早上一兩年。2003年人天書店正式開創了“可供書目”項目,由于當時沒有迫切的市場需要,加之技術手段落后,2004年此項目停止。同年中國出版集團成立了中版通公司,專門從事中國可供書目研究,但也因種種原因,無疾而終。憑借著敏銳的行業洞見力,在2012年編目數據平臺上馬之時,鄒進又一次提出要在“人天編目數據的平臺”基礎上建設“中國可供書目”網絡平臺的意見。經過他們的努力建設,現今平臺已經面向用戶服務。
中國可供書目是一個現貨數據交換平臺。市場需求越來越迫切,而技術也越來越成熟,不需要把書都存在自己的庫里,通過數據交換格式,把出版社、批銷中心、文化公司都聯系在一起,經銷商如有庫存,通過商務談判,就可以成為供貨商。
“中國可供書目”在理念和設計上都是無可置疑的,如果該平臺實現了“數據量的多少,決定了平臺的用戶的廣泛性,這取決于數據提供商與平臺接口方案和技術實現,如果能夠實現數據的提供者自動時時提供數據,系統再為客戶端提供個性推送的智能服務、增強現貨信息及期貨信息的加工、配送服務功能”。這個平臺將會成為人天書店的拳頭產品,一個連接“已知”與“未知”的平臺會越來越引人注目,這在當今的大數據時代,又走在了全國業界的前頭。
核心書目評價體系
高校合并和擴招,使原來的單一型、專業型學校,組合成多學科的綜合性大學,這又帶來了高校圖書館館藏需求的多樣性,對圖書采訪員的專業要求也大大提高了。大多數的采訪員,對于不過一萬種中文期刊,可依賴《中文核心期刊要目總覽》提供采購方案。而圖書采訪員面對每年出版的超過40萬種的圖書,有時就不知如何“采購”,如果再加上前一兩年的圖書,過百萬的品種,更是要用上一番功夫。
人天書店想用戶所想,他們從上海師范大學圖書館的一項研究成果中獲得了靈感,提出了“圖書的核心書目評價體系”,要用“核心書目”來輔助圖書采訪員,使之更有效、更準確地判斷圖書的質量和價值。試圖通過核心書目,幫助圖書館采購專業圖書,可以通過專業院系師生需求信息,按需篩選可購圖書。這樣便可以實現具有圖書情報專業知識和管理經驗的采訪人員精準地挑選各種專業書籍。這個想法,也促使我們團隊的研究聚焦到了“核心書目”提取方法上。
上海師范大學圖書館提出:“將某個時段的書目集中起來,再把哲社類學術圖書分離出來,對這部圖書用引文分析和二八定律遴選,最后經相關專家審定,形成哲社類學術圖書的核心書目,這個書目可以作為館藏質量測評的工具”。這個基于“專家主觀評價”的成果,以及人天書店業務專家的建議,對我們后來的研究啟發很大。2013年8月,我們從數據挖掘應用出發,提出了“五維圖書評價體系及分析模型的建構”,有了“圖書評價”的初步方法(論文見《情報科學》2013年第3期)。
2013年10月,在東北師范大學計算機科學和信息技術學院,由人天書店共建的“東北師范大學圖書物聯網研究所”成立,開啟核心書目項目的進一步研究。
人天書店提出了依賴書目的來源創建圖書的評價體系,讓圖書館的采訪人員在沒有看到書的情況下,面對采訪數據,就能大致判斷出哪些是好書,哪些圖書符合自己的館藏要求,并在采訪數據中產生核心書目。根據好書因子對圖書進行評價的理念進行設計,給出評價體系。
2015年,東北師范大學圖書物聯網研究所,基于大數據通過數據挖掘和機器學習等數據分析工具,修正了“五維圖書評價模型”,并創建了全國500多家出版社,22大門類圖書出版質量動態評估系數集。在此基礎上,根據人天書店需求給出的基于統計規則的評價指標,我們開發“核心書目系統”軟件。實現了對于已經出版發行的圖書進行“客觀的評價”和“專家糾偏”數據計算,對每一本圖書進行100分評測,為圖書采購人員提供采購參考。
正如自然界的優勝劣汰、適者生存,一個產品或一種服務為萬人所用的時代已經漸進消亡,一萬個產品或一萬種服務為滿足一個人需求的時代正在開啟,大數據時代昭示著智能生產、智能服務、個性化供給和個性化服務,供需對接會越來越精準。這種思路和行為套用當今的一句流行的話說,就是圖書發行行業的“供給側”改革。在大數據時代,在數據“說話”的今天,面對不確定的未來,相信人天書店一定會走在行業的前列,成為“企業數字化”“數字化服務企業”的品牌企業。人天書店的編目數據、可供書目、核心書目,定會創造無限的“數據價值”。人天書店將會為更多的用戶提供更多服務的可能性。
(作者系東北師范大學計算機科學與信息技術學院教授、博士生導師、圖書物聯網研究所所長)