謝文亮 鄭添尹



摘? 要:研究大數據時代學術期刊如何通過數據挖掘構建五類學術期刊信息數據庫,通過采取數據挖掘方法對作者信息相關數據進行收集,分析和探討學術期刊五類數據庫建設條件和數據庫的信息資料來源搜集方法。結果表明,學術期刊信息數據庫建設方法簡單可行,適合一般學術期刊的信息數據庫建設,為學術期刊的信息數據庫建設和維護管理提供借鑒。
關鍵詞:大數據;學術期刊;數據庫;信息搜集;數據挖掘
Abstract:This paper studies how academic journals construct five types of academic journal information database through data mining in the era of big data,collects data related to the authors information by adopting data mining methods,analyzes and discusses the construction conditions of five types of academic journals database and the source collection methods of database information. The results show that the construction method of academic journal information database is simple and feasible,which is suitable for the construction of general academic journal information database,and provides reference for the construction and maintenance of academic journal information database.
Keywords:big data;academic periodicals;database;information searching and collection;data mining
0? 引? 言
學術期刊的發展依賴各類人員,如期刊的稿源來自作者、讀者和潛在的作者源,期刊的質量把握依賴外審專家,期刊發展后勁除了作者、讀者、專家外,還依賴于潛在作者來源,期刊的宣傳有賴于自媒體群,如QQ群、微信群等。可以說,辦刊以人為本,事關刊物成敗的人員分為兩種,一種是編輯部內部人員,其重要性不言而喻;另一種是編輯部外部人員,其中,比較重要的是以上列出的五種人員,即專家、作者、讀者、潛在作者以及自媒體群人員。五類人員與期刊休戚相關,對其建立數據庫是期刊管理的一個重要組成部分。期刊的信息數據庫的建立,既為期刊編輯服務,也為期刊的可持續發展服務。計算機技術的信息化和網絡化為信息數據庫的建設提供了良好的條件,數據挖掘和語義技術為數據庫人員信息的完善和擴充提供支持,因此,要善于利用當前的計算機技術來建立和完善信息數據庫。然而,目前學術期刊普遍不關注信息數據庫的建設與維護,導致學術期刊信息數據庫建設嚴重滯后,發展后勁遇到了瓶頸,探討期刊信息數據庫的建設可為期刊提供借鑒。
1? 學術期刊信息數據庫的作用
對于期刊來說,最關緊要的是幾類人群是:專家、作者、讀者、潛在作者、自媒體群人員等。如果建立起這幾類人群的數據庫,對期刊的發展有不可估量的作用。因此,期刊要將建設專家數據庫、作者數據庫、潛在稿源數據庫、期刊自媒體群數據庫、讀者數據庫五類信息數據庫[1]作為重要的期刊管理事務。建立數據庫的目的是便于聯系和交流,因此,有了讀者,期刊才能生存下去。建立這五類數據庫,可定期給這五類人員發Email、寄樣刊、發送最新選題和特色欄目、發約稿函,每到節日發賀卡問候祝福;一回生,二回熟,三回有印象。這樣期刊不愁沒有來稿,不愁沒好稿件,對期刊的影響力、評刊指標、長遠發展等都有極大的幫助。建立讀者數據庫,可定期為庫中讀者提供期刊信息,提供期刊目錄精準推送服務,能加強與讀者的交流,并通過已有讀者發展讀者,擴大讀者群。建立起作者數據庫,便于組稿和約稿;學術期刊并非永遠有優質的來稿,需要編輯進行策劃和組稿,稿件的來源便有賴于作者數據庫。通過潛在稿件數據庫容易挖掘出有利于期刊的潛在讀者和潛在的優質稿源。通過在期刊自媒體群數據庫中自媒體群的宣傳,可擴大期刊知名度。
2? 五類數據庫的建設
2.1? 專家數據庫的建設
專家是期刊質量的保障。專家在期刊的辦刊中起到多方面的作用,一是專家為期刊發展的“軍師”,可為期刊的戰略發展提供咨詢、策劃期刊的發展方向等,如期刊的專家顧問團、顧問委員會、期刊智庫等;二是專家稿件效應,一個期刊想要與眾不同或想要有知名度,必須能約到一定數量的專家級的稿件,專家稿件在質量保證、轉載、轉引、關注度上有明顯優勢;三是專家審稿,學術論文由于其專業性強,編輯無法熟悉每一個領域的內容,因此論文的內容科學性、選題新穎性、思想性等問題交由專業領域的外審專家來審定。專家數據庫對期刊的長遠發展有著決定性的意義。建設專家數據庫時,專家的信息可從不同的途徑獲取,如官方主頁、高端會議、國家基金項目、國家級成果文庫等[3],如圖1所示。
在官方主頁上,每個高等院校或科研單位都會將本單位的專家資料放在“院士風采”“名家風采”“教授風采”“長江學者”“學科帶頭人”等欄目供人瀏覽;一些博士生導師或碩士生導師等在某一學科有影響力的人物,一般會放在各個二級部門主頁的“師資力量”上,具體的信息還可以從當年的碩士或博士招生目錄中找到;從各種會議、論壇上獲得專家信息,如中國可信計算與信息安全學術會議、IEEE無線通信,網絡技術與信息安全國際會議、圖像與信號處理、生物醫學工程與信息學國際學術會議、中國經濟學年會等,會議舉辦方會將參會人員通訊錄發放到每個人的電子郵箱里,通訊錄人員信息包括單位、部門、姓名、性別、職務、職稱、手機、電子郵箱、研究領域、研究專長等,通過篩選,將符合條件的人員數據直接導入到數據庫中。還有其他渠道,如從國家、省、市等公布的自然基金項目獲得者中得到專家的信息。將專家的資料提取出來,建立專家數據庫。專家數據庫必須定期進行更新和完善,每年都會在學科領域出現新的面孔,要特別重視并將這些新專家加入數據庫。建立起專家數據庫后,要重視與數據庫中專家的聯系,編輯可通過發郵件、寄樣刊等方式,與專家建立起良好的關系,再根據專家的研究領域、研究專業、研究方向等,試著向專家約稿,邀請專家審稿,或就期刊的選題或發展方向等向專家咨詢。利用學科年會等與專家接觸,建立起良好的合作關系。
2.2? 作者數據庫的建設
作者是期刊的生命線,期刊必須尊重作者、善待作者。作者是期刊忠誠的讀者,他們對期刊投稿,意味著他們對期刊質量的認可。對于無論是采用或是不采用的來稿作者,都要給予重視。如果一個作者的稿件沒被采用,期刊就對該作者不問不睬,久而久之,作者對期刊的忠誠度也會減弱,優質稿件再也不會投到期刊來。因此,對作者要重視,建立起作者數據庫是為了持之以恒地與作者保持聯系。
傳統的紙質投稿由于速度慢、不便于管理等原因逐漸被信息化投稿方式淘汰。目前,期刊投稿方式基本有兩種,一是電子郵件投稿,一是在線投稿。郵件投稿的作者在來稿中一般會附上自己的相關的信息,如姓名、單位、部門、職稱、研究領域、電子郵箱、手機,這些信息就是作者數據庫現成的可用來源。對于在線投稿來說,作者信息更齊全、更詳細,并且系統提供Excel導出功能,可以直接將需要的數據導到數據庫中。對來稿作者的信息,不是來者必錄,而是要進行嚴格的篩選,標準是研究方向必須符合本刊的選題定位。根據這個標準,對初審中不符合本刊學科研究方向的作者作不入庫處理。對于符合入庫條件的,無論稿件采用與否,都要將作者資料信息錄入數據庫。在網絡化、信息化時代,人性化的交流尤其重要。學術期刊要定期給作者發郵件,真誠地問候作者,關心作者研究近況、最新研究成果以及最新創作等情況。定期、周期性的交流工作,讓作者意識到期刊一直關注著他的研究工作注,加深了作者對期刊的良好印象;作者一有新稿件問世,在考慮投稿時,會將稿件投往他印象最深刻的期刊。因此,對作者的重視,是對期刊生命線的維持。
2.3? 潛在稿源數據庫的建設
拓展稿源是落實學術強刊的關鍵[4]。期刊不僅要保持現有的核心作者源,還要尋找、發現和挖掘有潛力的作者,獲取途徑如圖2所示。
學術期刊往往忽略了對作者的團隊成員的挖掘,學術研究團隊能提供更寬闊、更廣泛的、有相同研究方向的潛在作者,這是學術期刊必須長期重視并且努力爭取的稿源。學術研究團隊的挖掘有現成的工具可利用:對本刊發表文章的作者,中國知網上提供了作者的知識網絡,包括作者關注領域、作者的導師、合作作者(包括同機構作者、其他機構作者,并給出了合作者之間的關系圖)、指導的學生等。由于學術研究團隊具有統一性、連貫性和繼承性,因此學術研究團隊的研究學科、方向基本都適合本刊的要求。由作者形成的知識網絡出發,可以完成作者的學術研究團隊數據的收集。另一種潛在作者是通過各種期刊,如在本專業核心期刊以及一般期刊等發現人才,其搜索需要花一定的精力以及有一定的判斷力。不過互聯網本身就是一個無邊際、信息量巨大的數據庫,現在的交互性媒介,如微信公眾號、博客(包括微博)、論壇等為學者提供了表達觀點、發表文章的機會。一些人喜歡在自己的微信公眾號、博客發表文章,有些作者現在缺乏知名度,但文章有見解、有前瞻性,具有一定的含金量,這些作者具有發展潛力,是學術期刊爭取的潛在稿件對象。如果學術期刊在他們尚未成名之前就將其作為潛在稿源,經常交流,建立起良好的關系,樹立起期刊品牌形象,這些潛在作者一旦成名,會飲水思源,將是優質的稿件的來源渠道。當然,還有其他發現潛在稿源的途徑,如參加學術會議并對會議論文集進行研究閱讀,也可以發現其中有潛力的作者;平時閱讀學術期刊時,對那些有深入見解的作者也要給予高度重視,將他們的信息收集到潛在稿源數據庫中,主動跟他們聯系。總之,潛在的作者源數據的建設,是學術期刊可持續發展的保障,要勤于挖掘和發現。
2.4? 期刊自媒體群數據庫
互聯網時代,特別是移動互聯網時代,自媒體宣傳成為學術期刊自我宣傳的一個窗口。目前QQ和微信是當今我國最流行的即時通訊工具,幾乎每個上網的中國人都人手一個QQ號碼和一個微信號碼,QQ群、微信群也是信息發布和信息交流的地點之一。讀者都比較喜歡和編輯打好關系,只要編輯主動地在網上提供QQ號碼和微信號碼,讀者會自動地加編輯為好友,這樣就可以組成一個編輯群,可以為讀者答疑、發布征稿消息和選題信息等。自媒體群的方式主要有兩種,一種是QQ群,另一種是微信群。一些學術期刊建立起了多個自媒體群,如編輯部內部群、期刊同行交流群、期刊與作者群等。從某種角度來說,自媒體群也是一種數據庫[5]。雖然基于推廣期刊、促進交流的目的建立了QQ群、微信群等,但容易忽略自媒體群數據庫的建立。自媒體群處于變動狀態,一旦群解散了,經過千辛萬苦建立起來的關系就立刻解除。因此,要防患于未然,建立期刊自媒體群數據庫,將群人員的信息,包括QQ號、微信號、工作單位、所在自媒體群等用數據庫方式保留起來并定期更新,掌握自媒體群信息主動權;一旦群解散,由于人員信息還在,容易再次組建。
2.5? 讀者數據庫的建設
讀者的來源很廣,包括專家、作者、潛在稿源作者、自媒體群人員、高校科研人員以及期刊同行等。讀者數據可以是以上建立的四個數據庫的數據庫的合總,再加上其他人員的信息合并而成,如圖3所示。
得到讀者數據的最簡單的方法是通過在期刊主頁上建立調查問卷,調查問卷中要求參與者輸入正確的個人信息,對參加調查問卷的讀者贈送一點小禮物;在紙質期刊上附紙質的調查問卷,讓讀者填完后回寄,也是建立讀者數據庫的途徑之一。通過在線系統接收投稿的學術期刊社,其在線系統有提供讀者注冊服務,讀者信息可從系統中直接導出。對于其他類型的讀者,要根據期刊社的發展需要以及一些讀者的合理要求,建立起讀者數據庫。
3? 學術期刊數據庫建設實踐
廣東財經大學學報通過數據挖掘技術對各類期刊人員信息聚類和分析,建立起了五類人員數據庫。每一類數據庫都必須仔細記錄了人員信息,包括姓名、單位、部門、性別、職稱、研究領域、手機、電子郵箱,如圖4所示。
使用Microsoft Excel建立數據庫。每一張Excel表就是一個數據庫,表中的每一個方格就是一個數據項。由于Excel具有強大的求和、篩選、排序等功能,可以進行統計分析、分類匯總、查詢檢索等[2],因此在建設的過程中,使用Excel進行重復篩選、去偽存真、分類聚類等,使得數據庫簡潔明了,人員分類有條理,能高效地查詢到所需的人員信息。在建立學術期刊信息數據庫的過程中,考慮到信息的來源不同,對不同數據庫的內容采取不同搜集方法,利用大數據技術和信息化手段來搜集各個數據庫的數據項,并時常進行內容的更新。
4? 結? 論
在信息數據庫的建設和應用過程中,要注意以下方面的事項:首先,對數據庫數字信息的搜集,要從合法的、公開的途徑,要遵守相關的法律法規,才能做到合法合理;其次,對數據庫要做好保密措施,謹慎使用其中數據,不能隨便將數據庫信息透露給其他人,因為很多信息涉及個人隱私,一旦不小心泄露了出去,會給人員造成很多工作和生活上的不便;再次,通過數據庫與專家、讀者、作者等聯系時,要注意時間、節奏等細節,過于頻繁會讓人誤解為騷擾;第四,數據庫要勤于維護和完善,增加新的、刪除過時的、補充原來未全的、去掉被證明為錯誤的,才能使數據庫的數據趨于完善、精確;最后,建設數據庫的過程中,要加強信息甄別能力,學會辨別真假信息,要增強信息辨別素養和學術鑒賞素養,才能日益擴充數據庫中的數據。
參考文獻:
[1] 李明志,鎖志海,趙大良.學術期刊審稿專家數據庫的開發及其使用 [J].編輯學報,2004(4):274-275.
[2] 王寧寧.圖書館QQ群咨詢服務研究 [J].現代情報,2009,29(1):174-177.
[3] 龐富祥,李彥民.學術論文評審專家數據庫的建設 [J].科技與出版,2000(3):42-43.
[4] 楊勇.拓展稿源是高校學報學術強刊的關鍵 [J].編輯學報,2009,21(3):245-246.
[6] 梁愛香,梁永忠.Excel報紙數據庫的創建及應用 [J].大學圖書情報學刊,2004(4):36-37+62.
作者簡介:謝文亮(1979.10—),男,漢族,廣東潮州人,編輯,副編審,碩士研究生,主要研究方向:數字出版;鄭添尹(1982.08—),女,漢族,廣東湛江人,學士學位,碩士研究生,研究方向:網絡與新媒體傳播。