999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

古籍數字出版領域的知識服務模式和場景分析

2022-03-08 22:48:00洪濤?陳必佳
出版廣角 2022年24期
關鍵詞:數據庫用戶服務

洪濤?陳必佳

【摘 要】 知識服務的概念由圖書情報與檔案領域提出并引入,在融合發展和數字化出版蓬勃發展的大背景下引起了出版學界的熱切關注。古籍數字化出版領域的知識服務發展有其專業特點,也隨著大眾對古籍中承載的中華優秀傳統文化內容的需求,逐漸走向大眾領域的服務和發展。古聯(北京)數字傳媒科技有限公司在古籍整理和編輯出版、學術研究、大眾愛好者的應用場景下,利用自身在古籍數字化領域的技術積累,不斷開發高質量產品,為不同層級的用戶提供多層次、立體化的知識服務。

【關? 鍵? 詞】知識服務;數字出版;古籍數字化;用戶場景

【作者單位】洪濤,古聯(北京)數字傳媒科技有限公司;陳必佳,古聯(北京)數字傳媒科技有限公司。

【中圖分類號】G239.2 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2022.24.009

我國擁有豐富的古籍資源,古籍作為傳統文化的載體被賦予傳承和弘揚中華優秀傳統文化的重要使命。近年來,在國家政策的大力支持下,古籍數字化技術高速發展,逐漸形成了成熟的產業鏈,互聯網和人工智能技術賦能,讓更多的人能夠接觸到不同形態的古籍數字化產品。在產業發展過程中,古籍數字出版領域積極探索融合發展的各種可能,逐漸從內容生產者轉變為知識服務產品的開發者和提供者,形成了面向不同用戶群體的知識服務系統。古聯(北京)數字傳媒科技有限公司(中華書局全資子公司,以下簡稱古聯公司)成立至今,經歷7年的摸索,漸次形成了面向古籍出版的編校人員、學術科研領域的師生以及古籍愛好者不同層級用戶的知識服務產品體系,平衡專業性和大眾化的用戶需求,力爭在不同使用場景中為用戶提供定制化服務。

一、知識服務概念的提出及發展

知識服務的概念最初在圖書情報和檔案學領域引起了廣泛關注度和討論,學界多引用張曉林對知識服務的闡釋: “以信息知識的搜尋、組織、分析、重組的知識和能力為基礎,根據用戶的環境和問題,融入用戶解決問題的過程之中,提供能夠有效支持知識應用和知識創新的服務”。[1]知識服務的重要特點之一是以用戶為中心,幫助用戶從海量信息中精準獲取所需知識。

出版界對知識服務一直有所關注,并且很早就認識到知識服務作為信息服務的高級模式,“與數字出版的基本屬性完全吻合”,“對數字出版的發展具有重大的戰略意義”[2]。然而,知識服務在出版數字化領域引起廣泛討論是在2014年之后。2014年4月,國家新聞出版廣電總局、財政部發布《關于推動新聞出版業數字化轉型升級的指導意見》,其中首次提到知識服務,提出支持專業出版轉型升級模式探索,并重點支持基于知識資源數據庫的知識服務平臺建設。由此,在數字化轉型和技術賦能的背景下,知識服務在專業出版、教育出版和大眾出版領域都獲得了長足發展。一些有代表性的知識服務產品和平臺頻頻出現在相關文獻的案例分析中。以技術服務為主體的數字出版可以說是出版企業從內容生產者到知識服務提供商轉變的重要中間環節,但目前大部分涉及傳統出版企業和知識服務產業的研究都集中于產業的路徑探索,忽略了知識服務產品的現狀,更缺乏對用戶場景的描述分析[3]。

二、古籍專業出版領域知識服務的發展特點

傳統出版社在從內容出版商向知識服務商轉型的過程中,應保持自身優勢,將編輯能力轉換為產品思維能力,促使原有生產流程向互聯網思維轉換[4]。專業出版在知識服務領域率先開啟了對產品思維的探索。在古籍數字出版知識服務的初級階段,隨著古籍數字化工作的深入開展,誕生了一大批古籍數據庫,具有檢索功能的數據庫取代了傳統的目錄檢索方式,大大提高了用戶使用古籍文本查找資料的效率。圍繞特定主題開發的古籍專題數據庫、知識庫、知識工具等產品,則更好地發揮了為用戶提供個性化服務的作用,讓用戶能夠利用數字化工具更有針對性地提煉其所需知識,這是專業知識服務逐步發展成熟的體現。

知識服務離不開“互動性”,除了通過技術手段分析用戶行為,教育、出版、科技、媒介四大產業融合產生的新空間也形成了知識服務生態[5]。在自然語言處理技術中,自動標點、命名實體識別、OCR識別等技術已經在古籍數字化領域得到了廣泛且深度的應用,文本生成和AI智能問答等技術則在醫療、教育、自動問答等領域更為普及。目前,古籍數字化產業愈發重視從用戶的使用場景和需求的角度開發產品,不僅服務于對海量古籍內容檢索具有較高要求的專業用戶,還肩負著傳播弘揚中華優秀傳統文化的使命,擴大傳播普及范圍,從不同層次的用戶出發,提高知識服務的針對性和有效性。

三、古聯公司面對不同用戶群體的知識服務場景解析

在知識服務領域,擁有高質量的文本和數字化內容是知識服務機構為用戶提供知識服務的基本要求和前提條件。在此基礎上,古籍出版社需要研究如何以場景需求為導向,探索知識服務向個性化、定制化方向發展,并利用信息技術和各類工具開發應用程序,為用戶提供數字化服務。面向不同用戶群體的知識服務產品,在其使用場景和具體應用形式上各有特點。就古聯公司而言,其面向的用戶主要有三類:一是出版社編輯,需要借由古籍數字化產品提升古籍整理、編輯工作的效率;二是研究者和學生,需要利用古籍數字化產品輔助研究和學習;三是古籍愛好者,需要借此滿足自身的閱讀需求,從而提升個人價值。高質量的古籍內容和便捷的檢索功能是用戶的共同需求,建設高質量文本是古聯公司為用戶提供知識服務的核心。早在2014年,古聯公司的前身——中華書局古籍資源部就投入制作并上線了中華經典古籍庫(一期),將中華書局已經整理出版的古籍數字化,為用戶提供高質量的古籍文本。截至2022年,中華經典古籍庫已上線10期,共計22.5億字,匯聚了包括中華書局在內的共23家出版社的古籍整理出版資源,滿足了讀者對高質量整理本古籍數字化產品的要求。

近年來,古聯公司在產業化發展中陸續開發各類知識服務產品及應用場景,在古籍數字出版業發展方面積累了豐富的經驗。

1.面向編輯出版和古籍整理的知識服務

古聯公司作為中華書局的全資子公司,推進產業數字化是其重要職責,因此在成立之初就致力于探索古籍數字化技術在古籍編輯出版領域的應用,為體量龐大的傳統編校工作提速增效。

古籍是經典文化傳承的載體,在出版工作中尤其注重整理和編輯質量。而古籍整理出版難度較大,引文多、典故多、生字多,即便利用數據庫進行檢索核查仍極為消耗人力。對此,古聯公司結合古籍編輯核心需求,開發了文達編校工具,專門為古籍整理和編輯工作提供標點檢查、序號檢查、字形規范檢查、引文核查、繁簡轉換、紀年檢查、勘誤統計、修訂前后結果對照等功能性服務,并不斷升級優化。在文字規范上,文達編校工具能夠根據文稿對繁簡體的要求進行自動篩查,并檢查常見的異體字。在引文核查上,文達編校工具關聯中華經典古籍庫數據自動核查,大大節省了編輯的編校時間,若遇到語料庫中沒有的引文內容,文達編校工具則會通過文檔內的互查功能顯示核查結果。文達編校工具上線以來,除了為中華書局內部編輯所用,還為商務印書館、三聯書店、鳳凰出版社、巴蜀書社、西泠印社、大象出版社、中國財政經濟出版社等多家出版社提供古籍引文核查服務。相較于編輯人工核查和利用數據庫逐條檢索核查,這種批量核查服務有效提升了編輯的工作效率。

在開展古籍數字化工作方面,古聯公司還擁有一套重要的基礎設施服務,即古籍整理眾包平臺。古籍整理出版項目規模較大,需要出版社投入大量資源開展基礎性工作。古籍數據庫的出版更是如此,僅古聯公司近幾年出版的古籍數字化產品就達到了近40億字的規模。為了在海量繁雜的古籍數據處理和編校工作中充分發動社會力量,古聯公司在2018年上線了國內第一個大規模的古籍整理在線眾包平臺。截至2022年,該眾包平臺上擁有注冊用戶近5000人,用戶中大部分是在校學生,也有各行各業的工作者。圖1為參與古籍整理眾包的人員職業分布。眾包平臺幾年來一共發布編校項目250個,編校任務近5萬項,處理古籍14億余字。為保證眾包平臺的工作質量,古聯公司專業團隊對眾包編校成果進行嚴格審核、檢查、淘汰,眾包隊伍日漸穩定。眾包平臺作為一套基礎設施,對接古聯公司的文達編校工具、OCR識別系統、古籍整理平臺等,開展校對底本、引文核查、編輯校對、圖像處理編排等工作,為圖書和數據庫的出版提供了大量輔助。

古籍整理和編輯工作往往是交織在一起的。古聯公司開發了大量人工智能工具應用于古籍整理過程,在服務作者的同時減輕編輯的負擔。以西泠印社“刻在石頭上的浙江”叢書的整理為例,古聯公司編輯部作為該叢書整理者,整理了包括《東甌金石志》《括蒼金石志附續志補遺》《兩浙金石志附補遺》等在內的9種金石類古籍,共計約147萬字。古聯公司編輯部首先利用OCR工具識別底本文字,然后采用線上眾包模式開展底本校對工作。校對后的稿件通過自動標點工具進行標點,標點后的稿件再交由編輯進行校勘和通讀審稿。在這種工作模式下,編輯部僅用時4個月就完成了全部稿件的整理工作和部分編輯工作。

2.面向學術研究用戶的知識服務

面向學術的知識服務可細分為兩類:一類是就古籍本身進行整理、研究和學習;另一類是結合歷史語境和具體問題,利用古籍中的內容對中國古代歷史文化進行探索、解析。兩類工作相輔相成,需要學者和研究人員的參與以及大量文獻數據的支持。古聯公司2018年上線的籍合網作為綜合性的古籍整理數字化資源平臺,至今已經上傳近40億字的古籍學術資源,從數量和質量上滿足了學者的研究需求。同時,籍合網根據各種古籍數字資源,為用戶提供紀年換算、字符查詢、聯機字典等小工具,方便用戶在使用古籍數據庫的過程中隨時利用(見圖2)。

隨著近年來人工智能特別是深度學習的發展,古籍工作者對數據價值的認識越來越深刻。古籍不僅可以用來閱讀,還可以借由人工智能技術,以機器學習的方式開展大規模數據訓練,在大數據大樣本的基礎上打造數據模型,通過自動化手段幫助用戶解決更多問題。2022年,古聯公司在籍合網上線了古籍智能整理平臺,整合公司成立以來發展的一系列古籍整理AI技術,包括OCR識別率、自動斷句標點、繁簡轉換,以及支持14萬個古籍整理用字的XML編輯器。其中,古聯公司的古籍智能OCR工具高效完成了古籍影像的文本化,對版刻本古籍的識別準確,5分鐘的OCR識別相當于人工錄入20小時的工作量,且錯誤降低75%。而基于深度學習的古籍自動標點標線工具,也是幫助編輯整理古籍語句脈絡、暢曉文意的利器。

隨著古籍數字化的發展,古籍數據庫日益龐大,弊端也逐漸顯現,如在保證查全的同時,冗余信息消耗了用戶檢索資料的時間,資源重復建設的同時很多專業研究領域文獻不足。對此,籍合網在建設中華經典古籍庫的基礎上與古籍專家合作,建立專業數據庫集群,為學界提供在特定研究領域可以快速檢索的準確內容。比如,墓志石刻文獻因資料分散且難以建立關聯,在學術研究中的利用度較低,隨著各類石刻數據庫的建設和功能日漸完善,散見于墓志石刻中的很多細節得到了更多學者的關注、研究和利用。籍合網先后上線了宋代墓志銘數據庫、漢魏六朝碑刻數據庫、三晉石刻大全數據庫、唐代墓志銘數據庫、歷代石刻拓片匯編數據庫系列產品。其中,漢魏六朝碑刻數據庫、唐代墓志銘數據庫、宋代墓志銘數據庫等數據庫聚焦于斷代史,三晉石刻大全數據庫集中于地域,而新近上線的歷代石刻拓片匯編數據庫具有較強的通代性和廣泛性,涵蓋了先秦至民國各種刻有文字內容的石刻資源。為方便使用,古聯公司將數字化內容做了專業性整理,關聯錄文與拓片,對原文進行標點、分段,考證提取時間、標引主題詞等關鍵信息,便于用戶在資料查詢中準確地檢索定位有效材料。

古聯公司打造的專題特色數據庫還有很多(見圖3),如歷代進士登科數據庫包含從隋朝至清朝10萬名登科人物的信息,服務于古代教育、科舉制度的研究;殷墟甲骨文數據庫收錄近6萬片甲骨,卜辭14萬余條,配備甲骨文字典,服務于甲骨文和殷商歷史研究;龍泉司法檔案選編數據庫收錄晚清至民國時期浙江龍泉地方法院司法檔案,包括343個訴訟案例,2.6萬余件文書,服務于晚晴至民國司法和社會風貌的研究;中華木版年畫數據庫收錄歷代各地年畫16000余幅,可供藝術史研究或為美術設計提供資源;中華書法數據庫收錄書法作品共計1萬余種,釋文350萬字,可為書法藝術研究提供參照。這些數據庫為專業領域的研究者提供了豐富而有針對性的內容服務。

3.面向大眾愛好者的知識服務

當前,大眾閱讀古籍的需求日益旺盛,古聯公司針對個人用戶也開發了多種產品。基于移動互聯網,古聯公司開發了中華經典古籍庫微信版,獲得了大量用戶的好評。用戶可以通過微信公眾號“經典古籍庫”直接進入數據庫,在手機上就可以閱讀、檢索數千種整理本古籍內容,利用碎片化時間獲取知識服務。目前,“經典古籍庫”已經成為諸多古籍閱讀用戶的日常必備工具。

在移動端,古聯公司還開發了小程序“句讀Pro”和“i識字”,通過游戲場景滿足用戶在古籍基礎知識學習方面的愛好和學習需求。“句讀Pro”小程序的內容均提取于原古籍,集游戲、教育為一體。用戶可以在小程序里標點古籍,再由系統打分,既可以自娛自樂,也可以和好友聯機對戰。“i識字”小程序中的“漢字連連看”則是利用古聯公司建設的專用字庫及字際關系數據庫開發的連連看小游戲,游戲通過挑戰模式、訓練模式、對戰模式、任務模式等多維度模式的設置,激發用戶探索漢字字形變化及對應關系的興趣,豐富用戶的漢字文化知識,促進漢字文化在大眾中的傳播。

2022年,古聯公司根據中華書局推出的圖書開始錄制古籍音頻資源,包含古籍原文和白話翻譯,預計在2023年將有50種古籍錄制成文白結合的有聲讀物,上線至喜馬拉雅等平臺,滿足用戶聽古籍的需求。

4.古籍整理的培訓服務

除了圍繞編輯、學者、大眾的使用場景提供古籍內容產品和技術工具,在擁有海量古籍數據的同時,古聯公司還致力于為用戶提供具有針對性的服務,滿足用戶的多樣化需求。古聯公司在通過古籍整理眾包平臺和用戶交流的過程中發現用戶對古籍整理培訓的需求。對此,古聯公司從2021年開始搭建籍合學院古籍整理培訓平臺。該平臺依托中華書局在古籍整理出版領域的深厚積淀及人才優勢,以服務行業、促進古籍人才培養為宗旨,與業內專家廣泛合作,打造了一系列專業的線上精品課程。籍合學院在線課程的研發注重案例分析與實踐總結,建立了案例、技能、專題、通識四位一體的課程體系,并編制了海量題庫。目前,籍合學院策劃的課程累計近400課時,課程數量超過70門。

2022年,古聯公司組織了兩期中華書局古籍整理訓練營,采用線上視頻教學及考試的形式開展。課程設置根據古籍整理工作要求安排布局,共分為三個模塊:一是認識古籍與古籍整理的通識背景課程,系統介紹古籍整理工作和古籍的體例結構;二是案例觀摩課,安排老師結合具體案例講解經、史、子、集各部文獻整理工作的全過程;三是技能掌握課,加強版本鑒定、標點、校勘、注釋等工作技能的講解,并配合實踐課程安排古籍整理作業,聽教師直播講評。古籍整理培訓相對小眾、專精,課程難度較大,然而每一次報名人數都超出預期,兩期訓練營原計劃招收學員400人,實際招收學員540人。通過調研和訪談,我們發現約70%的用戶源于相關專業的師生、編輯出版人員、文博和科研院所研究人員。無論內容與工作學習相關與否,用戶都希望通過古籍整理培訓拓展知識面,提升個人能力,或為將來的工作提供幫助與支持。部分用戶通過課程培訓成為古籍整理平臺的一員,參與古籍整理眾包工作,在獲得經濟收入的同時,獲得了精神上的滿足。

四、古籍領域知識服務融合發展展望

古聯公司從用戶角度出發,利用多年來生產的古籍數字化資源,不斷分析用戶需求,打造新的產品,取得了一些成績,得到了用戶們的認可。然而,作為數字化出版企業,古聯公司必須意識到眼下信息技術的發展是快速且具有沖擊力的。日前,ChatGPT的橫空出世,引爆了大家對人工智能的熱切關注,反映出基于大規模語料數據學習后的自然語言處理技術能夠發揮的巨大能量。當前古籍數字化產業中的命名實體識別、自動標引等核心技術,都是自然語言處理技術的重要應用。可以預見,在接下來的技術發展中古籍出版數字化還有更多的想象空間和可能性。隨著人工智能的發展,從文言到白話的機器翻譯注定邁上新臺階,大眾借由計算機就可以大致了解古籍內容,未來也將實現通過語義檢索古籍。以上僅是基于文本的應用,AI繪畫、作曲早已有成果和產品問世,人工智能技術與古籍的結合也注定不遠。人工智能技術離不開數據的支持,隨著圖像識別技術的發展,在目前版刻圖書識別的基礎上,基于手寫文獻的識別也會被突破,隨之產生更大量的文獻數據,這必將讓人工智能技術邁上一個新臺階。

古籍出版社必須認識到,人工智能技術眼下還不能代替以人為主體的學術性古籍整理和研究,但可以為古籍整理與研究工作提供巨大的幫助,更重要的是可以將學術性成果與大眾應用更好地建立連接并形成平滑過渡。信息技術能夠加快內容的傳播,豐富知識服務的形式,但并不能代替富有人性的學習、思考。作為古籍出版社,如何更好地利用人工智能技術,從學術研究、古籍出版和大眾生活的場景出發,繼續探索古籍知識服務之路,任重道遠。

2022年10月,全國古籍整理出版規劃領導小組印發了《2021—2035年國家古籍工作規劃》,在數字化方面對知識服務提出了要求:開展各類型古籍資源的建設;加強數據挖掘,推進古籍智能化利用;推動古籍的大眾傳播,打造具有影響力的音視頻欄目;創新人才隊伍建設機制,加快學科融合。這些規劃內容是對古籍出版工作現有方向的肯定與深化指導,增強了我們持續開展古籍知識服務的信心和動力。在政策的指導下,古聯公司將持續做好數據建設和技術研發,深度結合用戶的需求,為用戶提供更好的知識服務產品。

|參考文獻|

[1]張曉林. 走向知識服務:尋找新世紀圖書情報工作的生長點[J]. 中國圖書館學報,2000(5):30-35.

[2]周一帆. 我國出版業知識服務演進研究[D]. 北京:北京印刷學院,2016.

[3]朱葛嫣然. 我國出版企業知識服務現狀及提升策略研究[D]. 青島:青島科技大學,2021.

[4]王菱,羅渝. 出版社從內容生產商向知識服務商轉型的策略探究[J]. 中國出版,2022(9):69-71.

[5]田頌云. 教育出版的知識服務轉型研究:愿景描摹、內在邏輯與實施路徑[J]. 編輯之友,2022(6):33-38.

猜你喜歡
數據庫用戶服務
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
數據庫
財經(2017年2期)2017-03-10 14:35:35
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
數據庫
財經(2016年15期)2016-06-03 07:38:02
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 欧美啪啪精品| 色妺妺在线视频喷水| 久草国产在线观看| 毛片在线播放a| 19国产精品麻豆免费观看| 一边摸一边做爽的视频17国产| 一级毛片免费不卡在线| 国产理论精品| 国产一级二级在线观看| 在线无码av一区二区三区| 日韩国产另类| 久久综合婷婷| 国产欧美日韩综合一区在线播放| 色老头综合网| 免费可以看的无遮挡av无码 | 毛片免费高清免费| 国产69精品久久久久妇女| 青草视频在线观看国产| 国产成人精品免费av| 欧美日本在线| 啪啪免费视频一区二区| 国产情精品嫩草影院88av| 久久精品欧美一区二区| 九九香蕉视频| 亚洲无码视频图片| 亚洲av中文无码乱人伦在线r| 91在线视频福利| 免费无码AV片在线观看国产| 亚洲国产成人综合精品2020| 91久久国产成人免费观看| 精品人妻一区无码视频| 综合色婷婷| 99久久精品视香蕉蕉| 亚洲成在人线av品善网好看| 亚洲国产天堂久久综合226114| 久久精品亚洲中文字幕乱码| 久久久久国产一级毛片高清板| 国产精品一区二区不卡的视频| 在线视频97| 多人乱p欧美在线观看| 亚洲欧洲自拍拍偷午夜色| 谁有在线观看日韩亚洲最新视频| 久一在线视频| 亚洲性色永久网址| 国产内射一区亚洲| 欧美亚洲国产精品第一页| 亚洲精品无码久久毛片波多野吉| 日韩福利在线观看| 91精品日韩人妻无码久久| 激情五月婷婷综合网| 日本道综合一本久久久88| 57pao国产成视频免费播放| 婷婷六月激情综合一区| 99热这里只有精品免费国产| 色欲综合久久中文字幕网| 成人av专区精品无码国产 | 片在线无码观看| 久久99热这里只有精品免费看| 国产日本欧美亚洲精品视| JIZZ亚洲国产| 青青草国产免费国产| 国产欧美又粗又猛又爽老| 视频国产精品丝袜第一页| 国产69精品久久久久孕妇大杂乱| 成人福利在线免费观看| 毛片免费视频| 国产欧美日韩另类| 成人在线观看一区| 亚洲高清无码久久久| 91亚洲视频下载| 亚洲美女一级毛片| 亚洲天堂.com| 成人午夜精品一级毛片| 国产传媒一区二区三区四区五区| 日韩麻豆小视频| 国产一级裸网站| 亚洲码在线中文在线观看| 国产精品久久久久无码网站| 蜜桃臀无码内射一区二区三区| 91网在线| 久久精品视频亚洲| 人人看人人鲁狠狠高清|