尹 楠
(南京曉莊學(xué)院 商學(xué)院,江蘇 南京 211171)
學(xué)術(shù)期刊投稿網(wǎng)站網(wǎng)頁標記語言正確性之探討
——以圖書情報類期刊為例
尹 楠
(南京曉莊學(xué)院 商學(xué)院,江蘇 南京 211171)
本研究利用國際萬維網(wǎng)聯(lián)盟的網(wǎng)頁標記檢測工具檢測學(xué)術(shù)期刊論文投稿網(wǎng)站的首頁標記語言正確性和規(guī)范性。研究方法通過網(wǎng)頁格式定義種類、網(wǎng)頁錯誤數(shù)及網(wǎng)頁錯誤類型三項指標。被檢測的 19個學(xué)術(shù)期刊論文投稿網(wǎng)站的網(wǎng)頁格式定義有兩種:HTML 4.01 Transitional和XHTML 1.0 Transitional。學(xué)術(shù)期刊論文投稿網(wǎng)站首頁標記語言的正確性檢測通過率為0,部分期刊投稿網(wǎng)站的錯誤數(shù)較多,錯誤類型統(tǒng)計共有121種。研究結(jié)論認為期刊論文投稿網(wǎng)站整體的正確性檢測就如同對期刊編輯出版工作的審視,學(xué)術(shù)期刊應(yīng)將期刊論文投稿網(wǎng)站正確性的檢測視為期刊管理業(yè)務(wù)之一。
學(xué)術(shù)期刊;投稿網(wǎng)站;網(wǎng)頁標記語言
當(dāng)前,我國大多數(shù)的學(xué)術(shù)期刊都建立了論文投稿網(wǎng)站系統(tǒng)以方便作者投稿和專家審稿,期刊的編輯也可以應(yīng)用網(wǎng)站系統(tǒng)對投稿作者的文章進行管理和審核,因此論文投稿網(wǎng)站系統(tǒng)的設(shè)計與維護非常重要。據(jù)Net Market Share 的數(shù)據(jù),截止2015年7月,占據(jù)全球瀏覽器排行榜首位的仍然是 IE瀏覽器,總市場份額為 53.47%,Chrome瀏覽器位居第二位,最新市場份額27.66%,F(xiàn)irefox火狐瀏覽器以12%的市場份額位居第三位。由于各個網(wǎng)頁瀏覽器對網(wǎng)頁標記語言的解釋與執(zhí)行有一些差異,加上網(wǎng)頁設(shè)計語言的多樣化,可能會造成論文投稿作者使用的瀏覽器打不開網(wǎng)站的情況,即會出現(xiàn)網(wǎng)頁設(shè)計語言與瀏覽器相互不兼容的情況出現(xiàn)。
設(shè)計的網(wǎng)頁如果能遵守規(guī)范,就能確保網(wǎng)頁架構(gòu)與語法的正確性,也可以滿足用戶廣泛瀏覽的需求。對論文投稿作者而言,遵守規(guī)范的網(wǎng)頁能夠減少投稿的困難度,讓網(wǎng)頁適用于更多的載體(移動端屏幕、電腦瀏覽器等),并減少錯誤信息的傳遞;對論文投稿網(wǎng)站的管理者而言,符合規(guī)范的網(wǎng)頁較容易維護,因編輯團隊可能隨著時間的推移不斷替換,對于新進人員而言容易了解及修改。另外,符合規(guī)范的網(wǎng)頁也能夠增進網(wǎng)頁在網(wǎng)絡(luò)上的可見度,提高搜尋引擎排名[2],使論文投稿作者更容易在網(wǎng)絡(luò)上搜索到該投稿網(wǎng)站。
查閱中國知網(wǎng)、萬方數(shù)據(jù)庫等國內(nèi)文獻檢索系統(tǒng),發(fā)現(xiàn)目前國內(nèi)并未有學(xué)者進行過相關(guān)的研究,查閱Web of Science、EBSCO等外文文獻系統(tǒng),發(fā)現(xiàn)國外學(xué)者對網(wǎng)頁標記語言正確性檢測方面的研究也較少,主要的研究有Chen等人[3](2005)利用網(wǎng)頁檢測工具了解網(wǎng)絡(luò)上網(wǎng)頁正確性的比例,并期望找出最常出現(xiàn)的錯誤類型。Chen等人的研究結(jié)果顯示,有高達95%的網(wǎng)頁不符合網(wǎng)頁標準,并且不論使用何種網(wǎng)頁樣本搜集方式,前十大錯誤種類幾乎完全一致。Breeding[4](2006)使用W3C的Markup Validation Service檢測美國研究圖書館協(xié)會的 123個會員圖書館首頁,進行網(wǎng)頁正確性調(diào)查。研究結(jié)論顯示,除了21所圖書館完全符合W3C的規(guī)范,其余均出現(xiàn)了錯誤,甚至有7所圖書館錯誤數(shù)達100個以上,錯誤率高達82%。
網(wǎng)頁設(shè)計語言作為一種在網(wǎng)絡(luò)上被廣泛接受的計算機語言,是由國際萬維網(wǎng)聯(lián)盟(World Wide Web Consortium)所制定并規(guī)范化。關(guān)于網(wǎng)頁設(shè)計語言方面的研究,目前眾多學(xué)者進行了多角度的研究探討[5-11]。網(wǎng)頁設(shè)計語言不是一般的程序設(shè)計語言,而是一種網(wǎng)頁標記語言(Markup Language),最為經(jīng)典的網(wǎng)頁標記語言 HTML 被稱為超文本標記語言(Hyper Text Markup Language),其主要使用標記標簽(markup tag)來描述網(wǎng)頁。論文投稿網(wǎng)站的管理者可通過不同的檢測工具(validator或checker)檢測網(wǎng)頁是否符合規(guī)范,如網(wǎng)頁架構(gòu)與語法的正確性可通過W3C(World Wide Web Consortium)的網(wǎng)頁標記語言檢測器(markup validator)進行相關(guān)檢測。論文投稿網(wǎng)站網(wǎng)頁架構(gòu)與語法正確性與否會直接影響論文投稿服務(wù)的可訪問性與正確性。因此,本研究期望通過 W3C網(wǎng)頁標記語言檢測工具的應(yīng)用,檢測我國論文投稿網(wǎng)站網(wǎng)頁標記語言正確性(web markup language validation)程度及問題,并試圖提出解決方法,以供論文投稿網(wǎng)站經(jīng)營管理或建設(shè)發(fā)展作為參考。
1.1 研究工具
目前,網(wǎng)頁檢測工具較多,提供的檢測功能也有所不同,能夠進行各種瀏覽器的兼容性測試、負載測試,以及網(wǎng)頁標記語言檢測等。比較知名的網(wǎng)頁檢測工具有 Google web page tester、Browser Shots、IETester、Feed validator等。網(wǎng)頁正確性檢測是W3C Web Quality Tools中的功能,主要包括:(1)標記檢測(MarkUp Validator),可用于檢測網(wǎng)頁上的各種常用的標記語言的規(guī)范性和正確性,如 HTML、CSS、XHTML、XML、WML 等;(2)Web內(nèi)容的數(shù)據(jù)交換規(guī)范(Feed Validator),用于檢測Atom或RSS feed語法的規(guī)范性和正確性;(3)層疊樣式表檢測(CSS Validator),用于檢測內(nèi)嵌在HTML、XHTML中的CSS樣式的規(guī)范性和正確性;(4)超鏈接檢測(Link Checker),用于檢測網(wǎng)頁中超鏈接(Link)和錨點(anchor)的規(guī)范性和正確性。
本研究主要使用 W3C提供的網(wǎng)頁標記語言檢測工具(MarkUp Validator),檢測論文投稿網(wǎng)站上網(wǎng)頁的各種常用的標記語言的規(guī)范性和正確性。通過該工具可以檢測出受測網(wǎng)頁的錯誤數(shù)(W3C網(wǎng)頁標記規(guī)范性)、服務(wù)器種類、網(wǎng)頁大小、網(wǎng)頁格式、網(wǎng)頁編碼(GB-2312或其他)、文件類型等,并會列出錯誤之處及建議改進的方式。檢測的方式除了可以直接輸入網(wǎng)址外,也可以上傳該網(wǎng)頁的源代碼進行檢測。圖1為網(wǎng)頁標記語言檢測的主界面,本研究主要采用輸入統(tǒng)一資源定位符(URL)的方式進行網(wǎng)頁檢測。檢測結(jié)果分成兩部分;一部分是結(jié)果摘要,敘述錯誤數(shù)、警告數(shù)、編碼(Encoding)及網(wǎng)頁格式(Doctype)是什么版本等,如圖2所示。另一部分則為檢測出的錯誤或警告詳細結(jié)果,并列出改正建議如圖3所示。
1.2 研究樣本
由于我國學(xué)術(shù)期刊的投稿網(wǎng)站較多,難以對所有的論文投稿網(wǎng)站的所有網(wǎng)頁標記語言的正確性進行檢測,因此本研究需要選擇一定數(shù)量的樣本進行檢測工作。參考北京大學(xué)圖書館公布的2014版《中文核心期刊要目總覽》,本研究選擇其中列出的出版事業(yè)類12種期刊,以及圖書館事業(yè)、信息事業(yè)類的18種期刊進行研究(總計30種期刊),選擇這些期刊作為研究樣本的原因一方面是這些期刊均屬于中文核心期刊,在網(wǎng)絡(luò)上得到的關(guān)注度比普通的期刊高[12],一方面是出版類、圖書情報類的期刊屬于專門研究期刊編輯出版等問題的專業(yè)期刊,研究這些學(xué)術(shù)期刊建立的論文投稿網(wǎng)站網(wǎng)頁標記語言的正確性和規(guī)范性具有一定的示范作用。
由于選取的 30種期刊中有部分期刊沒有建立論文投稿網(wǎng)站系統(tǒng),部分僅有 Email投稿方式,因此在研究中需要將這些期刊忽略,最終所選取的期刊如表1所示,有效樣本為21個,取樣日期為2016年4月5日。由于考慮首頁為論文投稿作者首先打開的界面,其網(wǎng)頁標記語法的正確性將首先影響到用戶的操作,因此本研究將檢測目標鎖定在論文投稿系統(tǒng)網(wǎng)站的首頁(Main Page),在網(wǎng)頁標記語言檢測的主界面中輸入首頁的統(tǒng)一資源定位符(URL)進行檢測,并記錄其檢測結(jié)果。
本研究主要基于 W3C的網(wǎng)頁標記語言檢測工具,從網(wǎng)頁格式定義種類(Doctype)、網(wǎng)頁錯誤數(shù)及網(wǎng)頁錯誤類型進行分析,從中了解學(xué)術(shù)期刊論文投稿網(wǎng)站在網(wǎng)頁標記語言上的問題,以及提出建設(shè)參考意見。
在對有效選取的 21個期刊論文投稿網(wǎng)站首頁進行檢測的過程中,19個期刊的論文投稿網(wǎng)站能夠正常進行檢測,但有兩個期刊論文投稿網(wǎng)站(大學(xué)圖書館學(xué)報、現(xiàn)代情報)的首頁無法檢測,其中大學(xué)圖書館學(xué)報的網(wǎng)站對檢測進行了禁止設(shè)置(Forbidden),現(xiàn)代情報網(wǎng)站在檢測中無法找到(Not Found)。

圖1 網(wǎng)頁標記語言檢測的主界面Fig.1 The main interface for web markup language testing

圖2 網(wǎng)頁檢測結(jié)果概要Fig. 2 Summary of web page testing results

圖3 網(wǎng)頁檢測結(jié)果及錯誤警告說明Fig.3 Web page test results and error warning instructions

表1 有效選取的期刊列表及其論文投稿網(wǎng)站首頁Tab.1 List of selected journals and homepage of paper submission websites
2.1 網(wǎng)頁格式定義種類及網(wǎng)頁錯誤數(shù)
網(wǎng)頁格式如果沒有定義,除了在內(nèi)容呈現(xiàn)上可能出現(xiàn)錯誤,在數(shù)據(jù)交換及傳輸時可能也會出現(xiàn)問題,除了會造成數(shù)據(jù)的流失,有時還會導(dǎo)致錯誤信息的傳遞。對于論文投稿網(wǎng)站的網(wǎng)頁格式定義類型,除了兩個無法檢測的期刊網(wǎng)站之外,其余19個期刊的論文投稿網(wǎng)站均對網(wǎng)頁的格式進行了定義,包括兩種 W3C定義標準,HTML 4.01 Transitional和XHTML 1.0 Transitional,具體的定義類型可見表2。
由表2可以看出,有6個學(xué)術(shù)期刊的論文投稿網(wǎng)站采用的是XHTML 1.0 Transitional的格式。相對于HTML 4.01 Transitional而言,XHTML標記語言,通過結(jié)合 XML和HTML的功能,使得網(wǎng)頁內(nèi)容更容易被手持移動設(shè)備以及電視媒體等訪問。
對于網(wǎng)頁錯誤數(shù),被檢測的19個期刊論文投稿網(wǎng)站首頁的網(wǎng)頁標記語言都出現(xiàn)了錯誤,出現(xiàn)錯誤數(shù)最少的是中國科技期刊研究和中國圖書館學(xué)報,部分期刊的網(wǎng)頁標記語言錯誤數(shù)較多,如出版科學(xué)、情報科學(xué)、圖書館理論與實踐。
2.2 網(wǎng)頁錯誤類型
國際萬維網(wǎng)聯(lián)盟網(wǎng)頁標記檢測服務(wù)(W3C Markup Validation Service)給出定義的錯誤類型總共有447種(詳見http://validator.w3.org/docs/errors.html#noverbose),本研究檢測的19個期刊論文投稿網(wǎng)站的網(wǎng)頁錯誤類型經(jīng)過統(tǒng)計有121種錯誤類型,主要的錯誤原因在于標記屬性使用錯誤或者未加定義。期刊論文投稿網(wǎng)站首頁的前幾項錯誤項目分別是 There is no attribute “……”(136 次)、Document type does not allow element “……” here(104 次)、Required attribute “……” not specified(91 次)及Element “……” undefined(85 次)。屬性定義有誤在信息的顯示上可能不會出現(xiàn)問題,網(wǎng)頁內(nèi)容能夠正常呈現(xiàn),但對于數(shù)據(jù)的交換及傳遞會有一定程度地影響。在統(tǒng)計的 121種錯誤類型中,屬于標簽(Html-Tag)的錯誤數(shù)最多,說明期刊論文投稿網(wǎng)站的網(wǎng)頁大多數(shù)為Html標簽的定義或使用錯誤,因此在撰寫Html語法時應(yīng)注意標簽的使用正確性。另外,由于網(wǎng)頁制作軟件的可視化和方便性,使得網(wǎng)頁設(shè)計人員更容易的設(shè)計制作動態(tài)化的腳本語言,導(dǎo)致腳本(Script/Script-Tag)出錯的數(shù)量也偏高。由于 19個期刊論文投稿網(wǎng)站網(wǎng)頁的錯誤類型和數(shù)量較多,無法用表格的形式一一列出,圖4為中國圖書館學(xué)報的檢測結(jié)果,可以看出中國圖書館學(xué)報的論文投稿網(wǎng)站的網(wǎng)頁沒有出現(xiàn)標記使用屬性方面的錯誤,僅有兩條格式定義類型的錯誤。
本研究利用國際萬維網(wǎng)聯(lián)盟的網(wǎng)頁標記檢測工具檢測學(xué)術(shù)期刊論文投稿網(wǎng)站的首頁標記語言正確性和規(guī)范性,通過網(wǎng)頁格式定義(Doctype)種類、網(wǎng)頁錯誤數(shù)及網(wǎng)頁錯誤類型三項指標,期望了解學(xué)術(shù)期刊論文投稿網(wǎng)站網(wǎng)頁標記語言的正確性程度及問題,并提出網(wǎng)頁錯誤的修正建議,以供論文投稿網(wǎng)站經(jīng)營管理或建設(shè)發(fā)展作為參考。

表2 網(wǎng)頁格式定義類型及網(wǎng)頁錯誤數(shù)Tab.2 Web page format definition type and page error numbers

圖4 中國圖書館學(xué)報網(wǎng)頁檢測輸出結(jié)果Fig.4 Web page test output results of Journal of Library Science in China
在網(wǎng)頁格式定義方面,由于不同的網(wǎng)頁格式定義有可能導(dǎo)致信息呈現(xiàn)上的差異,甚至造成信息差錯或遺失。本研究中被檢測的19個學(xué)術(shù)期刊論文投稿網(wǎng)站的網(wǎng)頁格式定義有兩種:HTML 4.01 Transitional和 XHTML 1.0 Transitional,XHTML 1.0 Transitional格式結(jié)合了XML和HTML的功能,使得網(wǎng)頁的包容性更強,因此采用XHTML 1.0 Transitional格式的網(wǎng)頁更好一些,研究中發(fā)現(xiàn)采用XHTML 1.0 Transitional格式的期刊為編輯學(xué)報、中國科技期刊研究、情報學(xué)報、圖書館、圖書館理論與實踐、情報雜志。在網(wǎng)頁錯誤數(shù)量及類型方面,學(xué)術(shù)期刊論文投稿網(wǎng)站首頁標記語言的正確性檢測通過率為 0,部分期刊投稿網(wǎng)站的錯誤數(shù)較多。網(wǎng)頁標記錯誤最少的期刊是中國科技期刊研究和中國圖書館學(xué)報。在網(wǎng)頁錯誤類型方面,最常出現(xiàn)的錯誤類型為標記使用錯誤或未定義的屬性(attribute),說明在建設(shè)期刊論文投稿網(wǎng)站的網(wǎng)頁時,需要注意屬性的使用。另外,在統(tǒng)計的121種錯誤類型中,屬于標簽(Html-Tag)的錯誤數(shù)最多,說明期刊論文投稿網(wǎng)站的網(wǎng)頁大多數(shù)為Html標簽的定義或使用錯誤,因此在撰寫Html語法時應(yīng)注意標簽的使用正確性。
在研究中也發(fā)現(xiàn)網(wǎng)頁標記的錯誤大多為網(wǎng)頁語法與標簽結(jié)構(gòu)上的錯誤。在語法方面,開始結(jié)束的標簽沒有詳細注明,例如有序列表標簽始于
由于網(wǎng)頁格式定義未統(tǒng)一,及偏高的錯誤率,學(xué)術(shù)期刊論文投稿網(wǎng)站的網(wǎng)頁標記語言正確性有相當(dāng)大的改善空間。造成網(wǎng)頁標記語言正確性低的原因,除了可能是網(wǎng)頁制作人員不熟悉網(wǎng)頁語法,網(wǎng)頁制作軟件無嚴格規(guī)范用戶使用各對象及功能也是導(dǎo)致網(wǎng)頁語法錯誤的因素之一。論文投稿網(wǎng)站是學(xué)術(shù)期刊面向論文作者提供服務(wù)的重要平臺,網(wǎng)站內(nèi)所有的網(wǎng)頁均代表學(xué)術(shù)期刊服務(wù)的目標,因此期刊論文投稿網(wǎng)站整體的正確性檢測就如同對期刊編輯出版工作的審視,學(xué)術(shù)期刊應(yīng)將期刊論文投稿網(wǎng)站正確性的檢測視為期刊管理業(yè)務(wù)之一,而網(wǎng)站正確性與投稿作者對期刊論文投稿網(wǎng)站服務(wù)滿意度是否存在關(guān)聯(lián)性,亦有必要進一步深入探討,以作為學(xué)術(shù)期刊經(jīng)營管理決策的參考。
[1] Market Share[EB/OL]. 2015, http://marketshare.hitslink.com/browser-market-share.aspx.
[2] [3]Chen, S., Hong, D., & Shen, V. Y. S. An experimental study on validation problems with existing HTML webpages[C].Proceedings of international conference on Internet computing,2005, 373-379.
[4] Breeding, M. Web 2.0 ? Let's get to Web 1.0 first. Computers in Libraries[J]. 2006, 26(5), 30-34.
[5] 潘小進, 林子禹, 張月強等. 語義Web的標記語言和體系結(jié)構(gòu)[J]. 計算機工程, 2003, 29(5): 99-101.
[6] 李超. HTML 5 中視頻和音頻核心事件的相關(guān)研究[J]. 軟件, 2013, 34(7): 35-36.
[7] 李強. 基于HTML5 的網(wǎng)頁圍棋游戲的開發(fā)[J]. 軟件,2013, 34(9): 39-40.
[8] 歐陽平凡. 三種動態(tài)網(wǎng)頁語言ASP、JSP、PHP之比較[J]. 電腦知識與技術(shù):學(xué)術(shù)交流, 2006(2): 124-125.
[9] 周翔. 網(wǎng)頁語言的自動選擇[J]. 中國科技信息, 2005(20A):33-33.
[10] 韓先培, 劉康, 趙軍. 基于布局特征與語言特征的網(wǎng)頁主要內(nèi)容塊發(fā)現(xiàn)[J]. 中文信息學(xué)報, 2008, 22(1): 15-21.
[11] 李效東. 一種基于XML的Web頁面定義語言[J]. 軟件學(xué)報,2002, 13(1): 142-149.
[12] 王術(shù). 基于百度指數(shù)核心期刊影響后效應(yīng)的分析[J]. 中國科技期刊研究, 2015, 26(1): 82-85.
A Study on Markup Language Validations of Academic Journals Submission Websites
YIN Nan
(Business School, NanJing XiaoZhuang University, NanJing, China, 211171)
This research Used W3C Markup Validation Service to validate the correctness and normative of the home page markup language of the academic journals submission websites. Through the three indicators: webpage formats (Doctype), the number of inaccurate webpage, and the error types of the websites. The webpage formats of validated 19 academic journals submission websites have two types: HTML 4.01 Transitional and XHTML 1.0 Transitional. All of the pages failed the test, some academic journals submission websites have high rate of inaccuracy, the statistical error types have a total of 121 kinds of types. Academic journals submission websites’ overall validations are like editing and publication of periodicals scrutiny, academic journals should regard the correctness validation of the websites as one of the tasks of the journal management..
Academic journals; Submission websites; Markup language
TP393
A
10.3969/j.issn.1003-6970.2017.11.034
本文著錄格式:尹楠. 學(xué)術(shù)期刊投稿網(wǎng)站網(wǎng)頁標記語言正確性之探討——以圖書情報類期刊為例[J]. 軟件,2017,38(11):181-186
尹楠(1982-),男,漢族,江蘇鎮(zhèn)江人,管理學(xué)博士,南京曉莊學(xué)院商學(xué)院講師,主要研究方向:管理信息系統(tǒng)、企業(yè)信息化。