蔣學東 涂鵬 陽麗霞


[摘 要] 針對科技期刊傳統選題策劃面臨的數據有限、信息精準度不高及以編輯經驗為主的問題,探究大數據和人工智能背景下的選題策劃優化方法。通過分析大數據和人工智能背景下科技期刊選題策劃面臨的挑戰,結合大數據和人工智能為選題策劃優化在數據、算力和算法三個層面提供的理論、方法和技術,探究科技期刊選題策劃各關鍵環節的優化方法。以期運用大數據的智能自動化人機協作功能,科學配置大數據資源,使科技期刊的選題策劃決策建立在大數據科學描述、預測和診斷的基礎之上,達到科技期刊選題策劃的科學化、自動化和精準化。
[關鍵詞] 大數據 人工智能 科技期刊 選題策劃優化
[中圖分類號] G232[文獻標識碼] A[文章編號] 1009-5853 (2020) 01-0036-06
Topic Selection Planning of Scientific Journals from the Perspective of Data Mining and Intelligent Screening
Jiang Xuedong Tu Peng Yang Lixia
(Editorial Department of Journal of Railway Science and Engineering, Central South University, Changsha, 410075)
[Abstract] Aiming at the problems of limited data, low accuracy of information and too much dependence on editors experience in the traditional topic selection and planning of sci-tech periodicals, this paper probes into the optimization methods of topic selection and planning under the background of big data and artificial intelligence. This paper first analyzes the challenges faced by the topic selection and planning of sci-tech periodicals under the background of big data and the artificial intelligence. Then, it explores the optimization methods for the key parts of topic selection and planning of sci-tech periodicals combining the theoretical methods and technologies provided by big data and artificial intelligence at the level of data, calculation power and algorithm. The goal of optimization of topic selection and planning is expected to be achieved by using the intelligent automatic man-machine collaboration function of big data and scientifically configuring the resources of big data. Based on the scientific description, prediction and diagnosis of big data, the selection and planning decisions of sci-tech periodicals would be more scientific, automatic and precise.
[Key words] Big data Artificial intelligence Sci-tech periodical Optimization of topic selection
科技論文的質量是科技期刊強大生命力的保證,選題策劃是科技期刊吸引高質量科技論文、擴大自身影響力的前提。選題策劃作為科技期刊出版流程的源頭,其創新程度直接決定后續所有流程的效果。科技期刊選題的精準程度不僅影響科技期刊自身的創新發展和品牌質量,更在一定程度上影響整個行業乃至國家科技界的創新速度與進程。隨著信息技術的高速發展和數據信息交互、共享與開放程度的持續加快,大數據已成為數據化時代與貨幣、黃金等同等重要的新經濟資產。在科研領域,大數據正引領第四科學范式——數據密集型科學(Data-Intensive Science)的到來,并逐步推動傳統科學的假設驅動模式向基于大數據探索的數據密集型方法轉變[1]。在世界各國均已逐步將大數據和人工智能作為國家基礎性戰略資源的背景下,我國相繼出臺了《促進大數據發展行動綱要》和《新一代人工智能發展規劃》,大數據和人工智能被正式列入國家級戰略層面,成為我國未來提升國際競爭力的主要手段[2]。作為科學技術信息傳播主力軍的科技期刊,在大數據和人工智能雙驅動不斷加速的今天,更應盡快在科技信息傳播的各個環節高效應用大數據和人工智能,不斷優化資源配置,加強人機協作,凸顯大數據基礎上描述、預測、診斷和決策的智能自動化,以大數據和人工智能技術帶來的科學化、自動化和精準化推進科技期刊選題策劃的高質量發展,為我國第一生產力的創新、迭代和引領增加強勁動力。
1 科技期刊選題策劃現狀
科技期刊的選題策劃是編輯人員依據一定的方針和主客觀條件,開發科技研究出版資源、設計選題的創造性活動,是編輯工作與出版工作之“本”。選題策劃決策的優劣直接影響科技期刊的質量和行業影響力,在科技期刊所有工作中有著舉足輕重的地位。大數據時代科技期刊需求側的在線化、數字化、多元化、碎片化的需求日益加速, 在一定程度上反向倒逼了作為供給側的科技期刊在前向供應鏈上的在線化、數字化和多元化調整。
現有傳播環境下的科技期刊選題策劃,數據化和智能自動化程度不高,經驗為主的傳統選題策劃模式依舊占有較大比重。傳統的選題策劃方式常以編輯征求專家或期刊編委意見、參加學術會議、關注基金項目、統計作者和讀者問卷調查結果、向一線研究人員了解行業發展動態等為主。這些選題策劃方式往往因速度較慢、獲取數據有限、信息精準度不高、編輯勞動重復繁瑣等原因導致選題策劃在時效性、前沿性、延續性、集聚效應、精準度匹配等方面無法實現預期目標,其大成本投入與生產服務效率嚴重不匹配,最終對科技期刊信息傳播的內容、過程、效果和傳播主體的積極性、創造性等各方面都造成了嚴重影響。
2 大數據和人工智能背景下,科技期刊傳統選題策劃方式面臨的挑戰
2.1 傳統選題策劃面臨如何發現交叉學科和新興領域的挑戰
隨著互聯網的普及、科學技術創新加速和交叉學科的不斷涌現以及新興領域的興起,傳統的期刊編輯因語言不通、專業隔閡等使得其對研究領域前沿問題和熱點問題的把握容易出現偏差,難以繼續憑有限的個人經驗實現選題策劃科學決策。與此同時,約稿對象和審稿專家的精準定位與溝通方式也已發生了巨大變化。“內容為王”是科技期刊發展的永恒主題,如何利用大數據和人工智能的技術和已有研究成果揭開交叉學科和新興領域等內容“皇帝”的隱形新裝,打破專業領域的隔閡、突破時空的界限,通過將領域專家知識地圖、研究機構成果地圖、領域術語關聯地圖等有效結合并運用于科技期刊選題策劃,抓住交叉學科和新興領域這顆王冠上的明珠,實現決策計劃與執行人的精準統一便成為數據時代科技期刊選題策劃急需解決的一個重要問題。
2.2 傳統選題策劃面臨策劃內容與受眾需求適應性的挑戰
科技期刊的選題策劃須在現有領域研究現狀基礎上圍繞受眾需求最大限度地發揮創造力和能動性。在互聯網迅速發展的今天,受眾需求呈現出明顯的個體差異且快速變化的特點。科技期刊的受眾既有讀者,也有作者,而受眾對于科技期刊選題策劃的認可度對期刊的品牌建設和質量提升有著決定性作用。作為信息供給側源頭的科技期刊選題策劃如果不能及時響應受眾需求,實現與受眾高強度的關聯互動,為受眾及時提供增值、創新和深層次的個性化體驗,則可能面臨信息傳播無效乃至被受眾背棄的嚴重后果。近年來我國部分領域研究成果外流、科技期刊沖擊世界一流期刊屢屢受挫、部分期刊甚至出現稿源不足等情況都在一定程度上說明了選題策劃面臨的這一問題。在人人都是傳播者的今天,選題策劃“受眾中心”的執行力度和效度對科技期刊的信息傳播力影響尤為明顯,優秀的選題策劃能使科技期刊發展進入良性循環并逐步跨入強者恒強的加速軌道,不好的選題策劃則可能讓弱者卷入惡性循環最終走向不復存在的深淵。因此,大數據時代的科技期刊需格外重視基于“受眾思維”的選題策劃,從源頭上杜絕惡性循環。
2.3 傳統選題策劃面臨數據挖掘清洗及人工智能篩選的挑戰
全媒體時代數據的關聯性增強、不確定性增大、數據載體多樣化和數據增量指數化等對于期刊編輯憑個人原有的經驗和有限的知識來策劃選題構成了前所未有的挑戰。不借助數據清洗挖掘技術和人工智能技術,編輯部有限的人力無法應對數據的極速增長,科學降噪和歸類利用大數據更無可能。如何充分挖掘大數據這一寶藏并利用人工智能完成多源數據的自主流動、合理配置,實現選題策劃的科學性、前沿性、時效性和創造性是大數據智能時代科技期刊信息傳播亟需解決的急迫問題[3]。
3 大數據和人工智能背景下科技期刊選題策劃的優化目標
大數據和人工智能背景下的科技期刊選題策劃工作,要在時效性、科學性、前沿性、可操作性和集聚效應等方面樹立品牌搶占先機,就必須在數據、算力和算法等方面充分利用人工智能技術挖掘相關數據價值[4],解決大數據的不良影響因素,逐步提升算力、優化算法,努力實現決策階段的高度自動化與智能化。
隨著大數據和人工智能的迅猛發展,其理論、方法和技術為科技期刊選題策劃提供了三個層面的優化目標。第一層面為數據層面的優化目標,即針對全媒體傳播開發數據收集渠道和偽數據甄別系統,利用大數據技術和人工智能技術實現科技期刊選題策劃相關研究領域科學真實的數據資源泛化收集。第二層面為算力層面的優化目標,即對第一層面收集來的數據資源進行精確分析。隨著大數據和人工智能的蓬勃發展,針對大數據體量龐大且日增量巨大,不確定性高,關聯度和可信度低等影響因素,研究者們提出了模糊集、粗糙集和三支決策理論等方法,為科技期刊選題策劃有效進行大數據的精確分析提供了強有力的技術和理論支撐。第三層面的優化目標為數據分析結果的可視化展現,即算法層面的優化目標。這一層面應圍繞選題策劃優化模型的構建,在研究前沿探測、專家知識地圖繪制、研究成果可視化呈現及新興領域識別遴選等方面下足工夫,充分挖掘大數據價值,通過智能自動與人機協作結合,努力實現選題策劃的高度自動化、智能化和精準化。大數據和人工智能在數據、算力和算法層面賦能科技期刊選題策劃優化的關鍵環節,能使已有研究成果大數據資源和受眾情況得到泛化收集和精確分析,并在此基礎上通過及時發現交叉學科、精準探測研究前沿,預測科技期刊發展方向,繪制研究成果地圖,優化專家知識地圖構建,最終推動選題策劃的高質量發展。基于已有的大數據和人工智能技術,優化科技期刊選題策劃關鍵環節的簡要框圖如圖1所示。
4 基于大數據和人工智能技術的科技期刊選題策劃優化方法
基于大數據和人工智能技術的科技期刊選題策劃,從數據收集、分析、預測、診斷到決策,都建立在大數據基礎之上,以數據、算力和算法為支點,以智能自動化+人機協同為主要工作模式,圍繞選題策劃優化目標,以數據科學、人工智能引領優化互相關聯的各要素,準確探測研究前沿、識別新興領域、構建專家知識地圖、可視化呈現已有研究成果和受眾數據分析結果。基于大數據和人工智能技術的選題策劃優化模型如圖2所示。
4.1 選題策劃之研究前沿探測優化
科技期刊選題策劃中,泛化收集多源大數據并運用云計算、邊緣計算和其他相關算法,以更全面關注研究機構成果、探測專業和交叉領域研究前沿、識別其演變路徑非常關鍵。以某專業領域最新文獻簇作為前沿探測基礎,通過分析高頻詞、共現聚類的關鍵詞和數據流等在特定學科熱點和前沿主題研究中的應用,采用專家咨詢法評估研究結果的相關性,可初步探測特定學科的研究熱點和前沿主題[5]。通過追蹤、收集、分析高產研究機構的研究方向、整體實力、所處地位、合作對象及其差異等方面的數據,了解不同機構在研究領域、研究成果、前沿識別、認可度等方面的基本狀況,并根據不同高產機構的研究前沿成果調整選題策略,結合自身的定位和受眾情況有的放矢規劃選題。也可根據主要國家(地區)研究前沿及側重從內容到時間分布上的特點及其與全球整體研究前沿的對比結果,判別出其在引領、同步與追趕全球趨勢過程中所處的不同位置及其發展走向,從而探測到研究前沿的成果分布狀況和基本走向[6]。只有利用大數據和人工智能技術實現研究領域的點面兼顧,才能保證科技期刊研究前沿探測的精準性和科學性。
4.2 選題策劃之新興研究領域發現優化
隨著學科交叉的不斷深入和互聯網的不斷發展,新興領域、新型研究主題的出現頻率和傳播速率都在急劇提升。對新興研究領域的準確和及時把握是新一輪科技革命中贏得主動的關鍵之舉。通過對相關領域專家發表的科技論文、專著等大數據進行清洗、挖掘和篩選,利用科學計量學和統計學方法,探究相關學科領域的內在聯系,探索學科交叉和新興領域發展趨勢的規律和特點,有助于我們理解新興領域形成與演進的機理,準確把握其發展趨勢,進而探測到領域內新興的主題和研究方向[7]。利用主題統計模型、新興技術跨領域擴散機理模型、文獻耦合、共詞方法、自然語言處理技術和基于引文的主路徑分析等方法,從自由文本數據中識別有重要意義的研究主題(詞語),可高效精準探測交叉學科和新興領域,對科學進行科技期刊選題策劃起到“仰望星空”的效果,為國家交叉學科發展的戰略部署提供重要的決策支撐。
4.3 選題策劃之專家知識地圖構建優化
選題策劃既要找準研究前沿方向、考慮領域核心知識,還需結合作者和審稿專家來源考慮專家識別和評價等問題。構建融合領域專家的識別和評價、快速掌握領域核心知識及其研究者的專家知識地圖,對于科技期刊選題策劃優化具有很強的現實應用價值[8]。隨著數據源的增多和數據量的暴漲,通過傳統模式了解和利用專家個人知識信息、領域專家關聯信息等顯性知識和隱性知識的全面數據已經非常困難。在選題策劃和約稿環節如何利用大數據和人工智能技術有效挖掘與研究前沿相關的作者和審稿專家信息,構建專家知識地圖,也是這一時代背景下科技期刊選題策劃優化得以順利實行的必要條件。為便于實現現有數據的合理挖掘,先將專家知識地圖構建分為專家合作關聯層和領域術語關聯層,再將專家與領域知識連接起來,通過構建專家與專家、領域術語與領域術語、專家與領域術語這三種關聯,建立領域專家知識地圖的基礎模型[9]。準確的專家知識地圖構建能使選題策劃成為有源之水,有本之木。只有實現科技期刊選題與約稿對象、審稿專家的快速精準匹配,才能保證科技期刊選題策劃在描述、預測、決策、實施各個環節的科學、精準、有序。
4.4 選題策劃之研究成果可視化呈現優化
研究成果可視化呈現可以將紛繁蕪雜的多源科學數據轉換成圖形或圖像顯示出來,有利于選題策劃的數據分析和方向決策在更直觀、明了的條件下科學高效完成[7]。將可視化分析方法應用于選題策劃數據管理,主要是依據科研數據自身的數據特征,基于元數據模型的多維數據分析方法,通過數據收集、預處理,分析計算進一步挖掘數據潛在的關聯信息,并利用科研數據、基于關鍵詞和共詞分析的研究熱點可視化方法和技術,結合基于推薦算法的可視化歷史瀏覽方法,設計實現基于信息可視化的選題策劃數據分析平臺,以實現科研數據獲取、基礎數據錄入和科研成果統計分析等多項功能的可視化管理和維護,為選題策劃的最終決策提供可視化分析結果。目前,通過網絡引文分析軟件(Citespace)進行文獻計量學研究是當前科技研究成果數據分析可視化的主要方式。該方式在研究搜索引擎技術的基本原理、核心爬蟲技術和網頁爬取處理流程的基礎上,設計并實現科研成果搜索引擎的信息采集模塊、爬蟲爬行模塊、信息索引模塊、查詢結果檢索模塊和用戶交互模塊的歸一化,能讓人機協作的科技期刊選題策劃智能決策更便捷、直觀、高效。
4.5 選題策劃之受眾數據收集與分析優化
選題策劃的“受眾思維”,是指在科技期刊策劃環節以受眾的需求為中心,圍繞受眾需求打造出能滿足受眾個性化體驗并為受眾提供增值、創新化、深層次的服務和產品。相較于受眾只能被動接受信息的傳統媒體時代,在大數據全媒體時代能否準確把握“受眾思維”,是科技期刊信息傳播能否順利進行需解決的一個重要課題。科技期刊的受眾既包含讀者也包含作者。全媒體時代的到來為受眾提供了非常靈活寬泛的多樣化選擇,受眾之間以各種不同的網絡合作方式傳播思想、共同創造、協作共享、產銷合一的情況也越來越明顯。在科技期刊選題策劃各環節(選題、約稿、組稿、調研反饋等),傳統的選題策劃更多以編輯自身的經驗和知識來決定選題和稿件的取舍,受眾信息及其需求在這個環節難以體現。但在大數據全媒體時代,受眾的數字化、在線化、碎片化、個性化需求不斷提高,智能化的“以受眾為中心”的組織架構和服務流程便應放在科技期刊選題策劃最重要的位置。若不能及時樹立以“受眾”為中心的辦刊理念,選題策劃流產的可能性就會很大。結合全媒體時代的受眾特征,科技期刊應根據自身定位和現實狀況,結合大數據受眾分析結果,將受眾科學合理地分組并針對不同特征的受眾群組成立靈活多樣的受眾體驗聯盟,利用大數據和人工智能進行受眾體驗預期、在線交互習慣、研究興趣、創造能力等不同方面的數據收集與分析,從而及時精準地感知受眾需求、診斷受眾的難點與痛點,然后在選題策劃的各個環節以滿足受眾需求為引領、以解決受眾難點與痛點為目標,挖掘大數據中與受眾密切相關的信息,打造接口透明、智能驅動、網絡協同、客戶體驗、在線交互、群體創造的智能化組織[10],通過大數據和人工智能雙驅動下的網絡協同、人機協作和在線交互加強科技期刊與受眾的交流,收集受眾反饋的信息并根據其建議和意見不斷改進選題策劃及其后續各項工作的質量,通過人與人、人與組織、組織之間各個維度的數字化和智能化,充分激發選題策劃及后續工作各方的積極性與創造力,真正為受眾提供內容質量高、表現形式豐富、參與體驗好、附加價值高的數字化科技信息服務和產品。
5 結 語
在人工智能快速發展的大背景下,大數據的應用前景已受到世界各國的高度關注。如何利用人工智能新技術挖掘、清洗和篩選大數據背后的巨大價值是數據科學時代各國綜合國力比拼的一個重大課題。一系列針對多源異構大數據智能化處理的新方法、新模型、新趨勢的出現,對于科技期刊利用大數據實現選題策劃優化乃至智能決策有著非同一般的歷史意義和現實意義。科技期刊作為國家科學技術信息傳播的主要媒介,其在大數據和人工智能時代能否利用新技術完成數據收集、分析、診斷預測的智能自動化和人機協作化,科技期刊的選題策劃是否科學、前沿、高效,對期刊能否打造自有品牌乃至占領科技信息傳播的制高點有著關鍵的作用。
注 釋
[1][美]托尼·亨,斯圖爾特·坦斯利,克里斯汀·特勒著;潘教峰,張曉林譯.第四范式:數據密集型科學發現[M].北京:科學出版社,2012:126-157
[2]國務院.國務院關于印發新一代人工智能發展規劃的通知 [EB/OL].[2019-05-20].http://www.gov.cn/zhengce/content/2017-07/20/ content_5211996.html
[3]向颯.人工智能對學術出版流程的再造及知識服務提升[J].中國科技期刊研究,2018,29(11):1091-1096
[4]丁偉.新媒體內容生態演進的8個方向[J].新聞與寫作,2018(11):78-79
[5]周群,化柏林.基于多源數據融合的科技決策需求主題識別研究[J].情報理論與實踐,2019,43(3):107-113
[6]梁麗,謝鳳杰,池麗旭,等.特定學科熱點和前沿主題研究方法實證分析[J].圖書館雜志,2018,37(1):19-26,32
[7]王曰芬,曹嘉君,余厚強,等.人工智能研究前沿識別與分析:基于領域全局演化研究視角[J/OL].[2019-05-17].http://kns.cnki.net/kcms/detail/11.1762.G3.20190517.1135.002.html
[8]潘有能,賀煥振.基于合著與引用加權的專家知識地圖構建研究[J].情報雜志,2018,37(8):128-132
[9]宋小康,何勁,王曰芬.大數據驅動下情報研究知識庫構建的關鍵技術及實現[J].情報理論與實踐,2019,42(1):34-40
[10]畢馬威-阿里研究院:打造智能化組織[EB/OL].[2019-05-12].https://www.vzkoo.com/news/412.html