999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于術語主題分析的出版行業知識服務關鍵技術研究

2023-07-23 18:31:25范波賈廣勝張智范林海王力張運良
中國科技術語 2023年3期

范波 賈廣勝 張智 范林海 王力 張運良

摘 要:出版產業相關管理和研究人員在規劃和決策時,離不開行業技術現狀分析。文章基于Web of Science核心合集數據庫和Derwent Innovation Index數據庫中有關出版業知識服務關鍵技術的相關論文和專利,以術語主題分析為手段,從基礎和應用兩個角度梳理和分析了當前出版業知識服務中的熱點技術及其未來發展趨勢。結果表明:出版基礎技術更關注人工智能和數據分析;出版應用技術則更關注數字廣告和區塊鏈技術;出版基礎技術和應用技術均非常關注在線教育服務技術;未來隨著版權保護、元宇宙等領域的發展,人工智能、區塊鏈等關鍵技術必將在出版行業知識服務中獲得更大發展;建議在《編輯與出版學名詞》等相關術語的編纂過程中,適當吸納相關術語主題分析的結果。

關鍵詞:術語分析;主題分析;知識服務;關鍵技術;出版基礎技術;出版應用技術

中圖分類號:G23;G35文獻標識碼:ADOI:10.12339/j.issn.1673-8578.2023.03.006

Abstract:The industry technical status analysis is important during planning and making decisions for the administrators and researchers in publishing industry. Based on the papers from Web of Science and patents from Derwent Innovation Index, we combed and analyzed the current hot technologies and future trends of knowledge service in the publishing industry from the basic and application perspectives. Our results show that (1) the artificial intelligence and data analysis are important in basic publishing technology; (2) digital advertising and blockchain are important in publishing application technology; (3) online education service technology is important in both; (4) with the future development of copyright protection, metaverse etc., artificial intelligence and blockchain will be more important in the knowledge services of publishing industry; and (5) the analysis results should be appropriately incorporated in the future process of compiling Chinese Terms in Editology and Publishing studies.

Keywords:terms analysis; subject analysis; knowledge service; key technology; basic publishing technology; applied publishing technology

收稿日期:2022-09-02修回日期:2022-10-27

基金項目:2021年濟南市科技創新發展資金項目“出版產業大腦建設”(202126001)

近年來,人工智能推動新興產業的智能化發展成效顯著,但在一些傳統產業領域尚待提升。傳統出版業作為文化產業的重要組成部分,在維護國家意識形態安全、推進習近平新時代中國特色社會主義思想的宣傳和闡釋、推動國家文化軟實力建設、提升國民素質和社會文明程度等方面發揮著不可替代的重要作用。2019年國家六部委印發的《關于促進文化和科技深度融合的指導意見》以及山東省政府印發的《山東省文化創意產業發展規劃(2018—2022年)》都明確提出以智能化、融合化、綠色化為導向,全面構建“互聯網+出版傳媒”的內容生產、傳播、消費體系。出版業應抓住新技術帶來的轉型機遇,構建“出版+人工智能”的新模式和新形態,通過關鍵技術研發、數據科學處理與分析,構建出版產業大腦,再造智能化出版流程,從而解決出版融合發展中面臨的現實問題,如技術存在缺陷、出版資源數據化進程緩慢、出版有效供給不足和專業人才缺乏等。山東省數字融合出版創新創業共同體,通過研究關鍵技術、出版大數據建設、人才培養與聚集等問題,客觀分析了出版產業現狀,提出推動傳統出版的轉型升級、打造新興出版生態的構想,以期未來利用人工智能實現智能決策和智能規劃。

1 研究現狀

目前知識服務已成為出版業的主流研究方向,但具體到知識服務技術,特別是系統性體系化的研究還較少。吳浩強等[1]基于個體案例,采用案例分析法基于企業價值鏈重構的目的論述了數字技術對知識服務價值增值的重要意義。雷鳴等[2]采用調查問卷、頻次分析和多重響應分析法對大學出版社數字化轉型中出現的問題進行了分析,指出需通過完善數字出版產業鏈來推動技術革新。余強[3]采用案例分析法梳理了復合出版工程技術體系并提出了數字化系統總體架構,其中包含知識服務。金佳夢等[4]通過文獻綜述,從中外對比的角度系統性闡述了學術出版知識服務的現狀和問題,其研究結果表明,當前知識服務的關鍵技術發展不足,未來需提供有力的技術保障體系。周云倩等[5]基于CSSCI論文數據,從多維角度分析了傳統出版業應向知識服務轉型,提出了技術將賦能出版轉型發展的結論。孫小琪[6]基于統計分析,論述了人工智能技術在出版知識服務中的應用,并指出若要形成全新的出版知識服務生態需從思維轉型和技術轉型兩方面著手。

從現有研究可以發現,當前對出版業知識服務關鍵技術的研究存在以下問題:(1)現有研究普遍停留在橫向層面,缺少縱向的深度解析,且尚未形成技術知識體系;(2)研究方法多為案例分析法、文獻綜述法等定性研究,定量研究普遍僅針對單一數據源。

2 研究方案

基于以上分析,本文按照如下分析方案完成研究(如圖1):基于包含數據、信息、知識、情報和智慧的DIKIW模型,構造初步的數據檢索式,并在領域權威報告和綜述論文基礎上對檢索式加以修正,進而從文獻數據庫中抽取出可以用于分析的基礎數據。基礎關鍵技術分析主要基于Web of Science (WOS)核心合集數據庫中的論文,應用關鍵技術分析主要基于Derwent Innovation Index (DII)數據庫中的專利。由于檢索出的數據存在噪聲,還需要通過人工瀏覽閱讀的方式進行清洗去除。WOS數據庫中存在關鍵詞字段,可以對其直接進行抽取,而DII數據庫中無關鍵詞字段,因此需要利用深度學習模型先進行訓練和抽取,兩個數據庫中抽取出的關鍵詞都需要進一步清洗處理,從而得到分析所需的關鍵詞列表。在清洗后的數據和關鍵詞列表基礎上,可以進行主題分析,以便進一步分析和研究出版行業知識服務關鍵技術。主題分析主要分為兩個獨立的模塊,一是基于復雜網絡社區發現的關鍵技術主題發現,二是基于詞云分析的熱點和前沿技術分析。

3 數據處理

3.1 檢索式構建依據

本文的檢索式構建參考國內外知識服務相關概念追蹤與辨析研究論文[7],確定本文對出版業知識服務的定義是包含信息、數據、智慧等,集內容創作、生產、傳播甚至應用于一體的知識內容的跨領域全新服務模式;基于該定義,參考具有普遍適用性的DIKIW模型,確定“知識服務”的限定檢索式為:

TS=(“data” or “information” or “knowledge” or “intelligence” or “wisdom”)

因本文的研究對象是出版業知識服務關鍵技術,因此構建檢索式的目的在于在海量文獻數據中找到出版業中的知識服務及其包含的技術。首先,“出版物”是一個具有強烈出版屬性的檢索詞。因此,將TI=(“publication” or “publications” or “publicate”)作為檢索字段之一。其次,綜合張立等[7]的觀點,本文認為和傳統出版單一的內容傳播功能相比,出版業知識服務更多地是將整個出版產業鏈各個環節數字化和智能化。因此,數字出版物更具有代表性。本文參考中國新聞出版研究院發布的

《2019—2020年中國數字出版產業年度報告》,對報告中提到的互聯網期刊、電子書、數字報紙(不含手機報)、博客類應用、在線音樂、網絡動漫、移動出版(移動閱讀、移動音樂、移動游戲等)、網絡游戲、在線教育和互聯網廣告這10類出版物及其拓展概念(參考出版類圖書、論文、百科等)作為檢索詞。對由此確定的所有詞分別進行檢索,剔除檢索質量不好或檢索數目為0的詞,剩下的詞作為本文檢索式的一部分。此外,本文認為互聯網廣告、在線教育以及博客類應用的相關概念本身即具有出版業知識服務屬性,因此不再增加“知識服務”作為檢索式約束條件, 然后形成本文的最終檢索式。

3.2 檢索范圍

本研究的檢索條件設置如下:出版時間為近5年(檢索時間2022年7月5日,下同)、發表語言為英語的全部文獻的題錄數據。

3.3 檢索結果

依照上述方式構建的檢索式,以WOS數據庫核心合集為論文數據來源,共檢索出近5年的9580條論文題錄數據。以DII為專利數據來源,共檢索出近5年的6190條專利題錄數據。瀏覽檢索結果后發現,存在一些與出版不相關的論文和專利。因此,手動剔除這些論文和專利,將剩下的文獻整合作為本文實驗數據。

3.4 數據整理

該步主要工作是抽取論文和專利中的關鍵詞,并構建相應的關鍵詞共現矩陣用于后面的實驗分析。

首先抽取了論文數據中存在于關鍵詞字段(DE)的關鍵詞。由于專利數據缺少關鍵詞字段,本文選擇Keybert工具對專利的標題及摘要字段進行關鍵詞抽取。Keybert工具提取關鍵詞的原理為:以嵌入BERT模型和簡單的余弦相似性來查找文檔中與文檔本身最相似的子短語,然后分別統計兩類數據的關鍵詞詞頻數并進行排序。采取人工手段,對關鍵詞的大小寫、單復數、簡稱和全稱、特殊字符、拼寫錯誤以及干擾詞等進行清洗。將清洗后的關鍵詞中詞頻大于5的關鍵詞作為列入關鍵詞表的標準,分別構建論文關鍵詞表和專利關鍵詞表。基于該列表,構建論文關鍵詞共現矩陣和專利關鍵詞共現矩陣。其中,專利關鍵詞共現矩陣是計算專利關鍵詞在標題和摘要兩個字段中共現的次數。所有計算結果均需做歸一化處理。

4 基于論文的基礎關鍵技術研究

4.1 主題發現

關鍵詞詞頻只能在一定程度上表征各主題的熱度,無法揭示關鍵詞之間的相互關系。因此,文章在構建關鍵詞共現矩陣的基礎上,使用Gephi內嵌的社區發現算法對關鍵詞進行分析,共發現了7個主題。主題分布情況如圖2所示,其中一種顏色代表一個主題聚類,與主題對應情況如其左上角圖例所示,圖例按照各主題術語比重排序。對各主題進行歸納,結果見表1。

4.2 熱點技術分析

關鍵詞詞頻分布一定程度上反映了主題的熱度。關鍵詞詞頻越高的主題,越能代表該產業目前的研究熱度。本文借助R語言的bibliometrix包,對論文的關鍵詞詞頻進行統計,并繪制了詞云圖(見圖3)。

由圖3可明顯看出,以“elearning”和“mooc”為代表的“在線教育服務”主題是當前的熱點技術,對應主題1,其所包含的主要技術整理見表2。

以“bibliometric analysis”和“big data”為代表的“數據分析”主題是當前的熱點技術,對應主題5。其所包含的技術整理見表3。

以“artificial intelligence”和“deep learning”為代表的“人工智能”主題是當前的熱點技術,對應主題3,該主題包括的技術整理見表4。

以“online advertising”為代表的“數字廣告”主題是當前的熱點技術,對應主題2。該主題包括的技術整理見表5。

以“knowledge management”為代表的“知識管理”主題、以“cloud computing”為代表的“云與區塊鏈”主題和以“sensor”為代表的“可穿戴設備”主題未在高頻關鍵詞的詞云圖中出現。和前4個主題相比,這3個主題作為出版業知識服務的基礎關鍵技術,研究熱度較低。具體包括的技術整理見表6。

4.3 國內外對比分析

對論文實驗數據進一步處理,抽取“CL”字段包含“China”的論文數據,匯總清洗后共計1877篇。人工對這1877篇論文進行分類,其中在線教育服務技術和人工智能技術占比較大;區塊鏈技術、數字廣告技術、數據分析技術、知識管理也有所涉及。

可以發現我國在該領域的基礎研究還較為薄弱,同時,當前國內普遍將出版業知識服務技術研究的重心放在在線教育服務上,人工智能算法也主要用于解決基于社交媒體的輿情分析、情感分類、意見領袖等問題,研究熱點和重點分布不均衡。

5 基于專利的應用關鍵技術研究

5.1 主題發現

使用Gephi內嵌的社區發現算法對關鍵詞進行分析,共發現了8個主題。主題分布情況如圖4所示。其中一種顏色代表一個主題聚類,與主題對應情況如左上角圖例所示,圖例按照各主題術語比重排序。對各主題進行歸納,結果見表7。

5.2 熱點技術分析

本節依舊采取關鍵詞詞頻與主題結合的方法分析出版業知識服務熱點應用技術。采用R中的wordcloud 2包繪制專利高頻關鍵詞詞云圖(如圖5)。

基于圖5詞云圖,以“banner”和“advertising”為代表的“數字廣告”主題,其所包括的技術整理見表8。

以“online game”和“online education”為代表的“在線教育服務”主題包括的技術整理見表9。

以“block chain”為代表的“區塊鏈”主題,該主題包括的技術整理見表10。

以“cloud”為代表的“云”主題,該主題包含的技術整理見表11。

以“database”為代表的“數據分析”主題,該主題包括的技術整理見表12。

以“knowledge management”為代表的“知識交互”主題、以“artificial intelligence”為代表的“人工智能”主題和以“sensor”為代表的“可穿戴設備”主題未在高頻關鍵詞詞云圖中出現。其所包含的技術整理見表13。

5.3 國內外對比分析

對專利實驗數據進一步處理,通過PN字段提取出屬于中國的專利,匯總后經過清洗共計3554篇。人工對這3554篇論文進行分類,其中數字廣告技術、人工智能技術占比較大,在線教育服務、云技術、區塊鏈技術、數據分析技術、知識管理也有所涉及,且數量相差不大。

由此可知,我國在出版業知識服務應用技術方面占據絕對地位,專利數量占據總體的一半左右。應用熱點和重點分布也較平均,具有較好的發展格局。

6 基礎技術與應用技術對比

借助文獻計量學及深度學習技術,將論文和專利數據進行分析,梳理出當前出版業知識服務基礎關鍵技術和應用關鍵技術,并結合關鍵詞詞頻對技術熱度進行了排序,結果如表14所示(其中黑體字代表高熱度技術,斜體字代表中熱度技術,宋體字則代表低熱度技術)。

通過對比可以發現,在線教育服務在基礎技術和應用技術中都得到很多關注,兩者除了均關注師生之間的交互技術外,基礎技術更關注出版內容本身的表現方式,應用技術則更注重出版過程中的知識傳播。

人工智能在基礎技術中屬于高熱度技術。在應用技術中則屬于低熱度技術,且其子技術較少,原因在于人工智能中的一些子技術當前還停留在概念或小規模實驗階段,落地性和推廣性還有待考究,距離大規模應用還有距離。云計算和區塊鏈在基礎技術中熱度較低,研究也較為空泛,但在應用

技術中卻得到較高的關注,出現了很多子技術。值得指出的是,隨著版權保護、元宇宙等領域的發展,未來區塊鏈將成為出版業技術發展的重點。

當前知識管理和可穿戴設備的研究熱度一般,前者在于行業推廣度不夠,后者則是有很多其他學科的技術壁壘尚待攻克。未來隨著知識服務在出版業的逐步發展,兩者還有很大的增長潛力。

7 結語

本研究結合出版業發展需要,梳理了當前出版業知識服務中的關鍵技術。本文基于多源數據,從基礎和應用兩個角度進行了定量分析,在提取專利關鍵詞的過程中使用了深度學習算法,并通過人工聚類的方法梳理出領域的細分技術,方便后面技術譜系的描述。本文旨在幫助出版產業相關“政產學研金服用”的相關用戶了解當前的研究和應用熱點,輔助政府有關部門制定決策方案,同時有利于出版產業鏈中不同類型的企業做戰略規劃,推動產業鏈轉型和升級。本文選定的時間段是5年,加之出版產業知識服務的界定也有不斷深化的過程,未來還可以借助建成的出版產業大腦對技術趨勢和各細分技術在出版業的應用做更深入的研究。2022年正式出版的《編輯與出版學名詞》收錄了數字廣告、多媒體、人工智能等體現出版知識服務關鍵技術的術語[8],建議今后結合出版產業的實際發展,酌情收錄區塊鏈、全息投影、html5等術語。

參考文獻

[1] 吳浩強,劉慧嶺.數字技術賦能出版企業價值鏈重構研究:基于中信出版集團與中華書局的雙案例分析[J].科技與出版, 2021,322(10): 61-70.

[2] 雷鳴, 湛冠瓊, 馮英. 我國大學出版社數字化轉型的現狀及優化策略[J]. 出版廣角, 2021(18): 39-42, 53.

[3] 余強. 基于國家數字復合出版系統工程的圖書出版數字化流程創新: 以華中科技大學出版社為例[J]. 出版科學, 2021, 29(5): 92-100.

[4] 金佳夢, 王嘉昀. 中外對比視角下我國學術出版知識服務發展策略研究[J].科技與出版, 2021(9): 56-64.

[5] 周云倩, 趙赟. 基于關鍵詞共現的出版轉型研究熱點分析[J]. 科技與出版, 2021,321(9):134-139.

[6] 孫小琪. 人工智能在出版業知識服務中的應用研究[J]. 出版與印刷, 2019(1): 12-17.

[7] 張立, 吳素平, 周丹. 國內外知識服務相關概念追蹤與辨析[J]. 科技與出版, 2020, 302(2): 5-12.

[8] 全國科學技術名詞審定委員會. 編輯與出版學名詞[M]. 北京: 科學出版社, 2022.

作者簡介:范波(1981—),男,博士,山東出版傳媒股份有限公司副總經理,山東文化創意設計行業協會副會長,山東省文化產業發展協會副會長,山東財經大學兼職碩士導師。主要研究方向為新一代信息技術、數字經濟等。長期從事信息化建設、數字化轉型、在線教育及新業務開拓等方面的工作,主持完成省級重點項目10余項。通信方式:18866816789@139.com。

賈廣勝(1968—),男,碩士,編審,山東出版數字融合產業研究院院長。主要從事圖書、期刊、音像電子、數字出版以及新媒體、業態融合等方面的應用研究。發表論文10余篇,主持策劃的《鄉村記憶》《中國漢畫像石粹編》(中英文)、《老家的滋味》等出版物獲中國政府出版獎提名獎、中華優秀出版物獎提名獎。通信方式:1809843448@qq.com。

張智(1980—),男,碩士,濟南市科學技術情報研究院副研究員,山東省專業標準化技術委員會委員。長期從事電子政務系統建設、數據庫開發、大數據應用以及相關技術在科技計劃項目管理、科技成果轉化、科技項目評價等方面的應用研究。通信方式:zhangzhi@jn.shandong.cn。

通訊作者:范林海(1970—),男,本科,山東出版數字融合產業研究院副院長,山東省文化創意設計行業協會理事,山東省會經濟圈文創發展工作委員會副主任。主要研究方向為企業數字化、智能化建設等。通信方式:1071215380@qq.com。

王力(1993—),女,碩士,中國科學技術信息研究所助理研究員,富媒體數字出版內容組織與知識服務重點實驗室辦公室副主任。研究方向為知識組織與知識服務、數字出版等。通信方式:wl@istic.ac.cn。

主站蜘蛛池模板: 97精品国产高清久久久久蜜芽| 久综合日韩| 99久久精品久久久久久婷婷| 色九九视频| A级毛片高清免费视频就| 日韩精品无码免费一区二区三区 | 99精品福利视频| 欧美午夜在线视频| 国产乱论视频| 中文字幕永久视频| 国产精品一区二区国产主播| 超薄丝袜足j国产在线视频| 国产99免费视频| 精品国产黑色丝袜高跟鞋| 日本成人不卡视频| 国产微拍精品| 日本中文字幕久久网站| 天天干伊人| 免费国产黄线在线观看| 免费在线视频a| 四虎国产在线观看| 欧美日本激情| 自拍偷拍一区| 国产无码性爱一区二区三区| 国产成人久久777777| 亚洲中文字幕97久久精品少妇| 亚洲天堂首页| 国产亚洲欧美日韩在线一区二区三区| 国产成人禁片在线观看| 国产电话自拍伊人| 亚洲精品无码高潮喷水A| 日本人妻丰满熟妇区| 四虎成人在线视频| 97国产精品视频自在拍| 亚洲综合激情另类专区| 国产黄网站在线观看| 日韩精品欧美国产在线| 久久久国产精品免费视频| 亚洲高清在线播放| 在线免费观看AV| 亚洲一区二区三区中文字幕5566| 成年A级毛片| 波多野结衣亚洲一区| 亚洲激情区| 亚洲国产精品国自产拍A| Aⅴ无码专区在线观看| 无码综合天天久久综合网| 亚洲福利一区二区三区| 毛片一级在线| 精品丝袜美腿国产一区| 福利小视频在线播放| 欧美成人精品一级在线观看| 亚洲V日韩V无码一区二区 | 国产视频久久久久| 男女男精品视频| 亚洲人在线| 国产91在线免费视频| 国产中文在线亚洲精品官网| 黑人巨大精品欧美一区二区区| 69国产精品视频免费| 久久精品欧美一区二区| 亚洲日韩久久综合中文字幕| 日本伊人色综合网| 国产精品xxx| 二级特黄绝大片免费视频大片| 精品久久高清| a级毛片毛片免费观看久潮| 中文字幕乱码二三区免费| 国产成人做受免费视频| 91色在线观看| 亚洲国模精品一区| 久久久久久国产精品mv| 国产精品一区在线观看你懂的| 在线免费无码视频| 中文字幕无码中文字幕有码在线| 992Tv视频国产精品| 精品综合久久久久久97超人该| 国产欧美日韩综合一区在线播放| 97人人做人人爽香蕉精品 | 欧美亚洲国产视频| 亚洲首页国产精品丝袜| 丰满人妻一区二区三区视频|