撰文:靳帆,鄧三鴻,江瑩
從1995年電子工業出版社憑借自己的信息技術優勢率先建立起網站開始,我國出版社的網站建設已經走過了二十多年的發展歷程。截至2014年4月,全國580家出版社中,已經有438家建立了屬于自己的官網。[1]出版社網站是出版社數字化轉型的關鍵,它的主要功能包括溝通和服務讀者、作者、分銷商、求職者,以及發布一般性的信息。此外,出版社網站還有一個重要功能就是宣傳推廣書籍和出版社的品牌形象,這項功能的實現需要建立在提高網站訪問量的基礎之上。出版社網站51%的訪問量是來自搜索引擎[2],另有一項調查顯示,有75%的網民會點擊進入搜索引擎提供的檢索結果的第一頁,檢索結果排名越靠后,被點擊的幾率就越小。因此,網站的建設者需要根據搜索引擎的排名規則來設計網站,這項工作便是搜索引擎優化(SEO,Search Engine Optimization)。
搜索引擎優化是和搜索引擎同步發展起來的。國外對于SEO的研究最早可追溯到20世紀90年代中期[3]8,其目的是通過了解各類搜索引擎如何抓取互聯網頁面、如何進行索引以及如何確定其對某一特定關鍵詞的搜索結果排名等技術,來對網站內容進行相關優化,使其在不損害用戶體驗的情況下提高網站的搜索結果排名,提高網站的訪問量。筆者試從影響搜索引擎排名因素的角度切入,結合實證研究,探討提高出版社網站訪問量的設計方案。
搜索引擎的工作過程可分為網頁抓取、信息提取、關鍵字搜索、建立關鍵字索引和網頁排序五個部分[4]。目前主流的搜索引擎大多采用爬蟲程序來完成網頁的抓取。這些程序像蟲子一樣以極快的速度從一個鏈接爬到另一個鏈接,不間斷地發現并下載新的網頁,然后對網頁中的鏈接、title、keywords和description以及文字等內容進行分析,再對網頁進行編目、索引、排序。當用戶在搜索引擎中輸入關鍵字時,搜索引擎便將匹配上的網頁按排序的先后呈現給用戶。影響搜索引擎對網站排序的因素主要包括網站內容、title 和meta標簽(keywords、description)、網站結構、圖片alt屬性、flash、內外鏈接等。

圖1 《鳥與獸的通俗生活》在百度中的一條檢索結果
內容是網站建設最重要的方面,也是實施SEO策略的基礎。這個觀點自SEO出現以來,被業內反復地強調。網站要保證提供豐富的原創性內容,同時保持固定的更新頻率。在更新內容時,要注意內容與網站(網頁)的主題和關鍵詞相關。每個頁面的內容應該主題一致,在格式上保持統一的設計,突然變化的網頁會影響搜索引擎對內容的吸收,降低搜索引擎對網站的評價。
搜索引擎非常重視title標簽和meta標簽中的description、keywords屬性,合理利用這三個關鍵內容可以極大地提高搜索引擎友好性。
title應簡短,包含網頁關鍵詞。譬如國內常用的搜索引擎——百度對標題最多顯示30個中文字符,過長的標題不利于突出目標關鍵詞,降低相關性。一個網頁中的keywords不宜超過20個,密度最好為2%~8%,每頁重點使用的關鍵字詞不要超過3~4個。關鍵詞的選取上,編輯可圍繞主關鍵詞制定一些“長尾關鍵詞”。長尾關鍵詞派生于長尾理論,指的是與頁面內容相關,但較為冷門的詞匯。在搜索引擎中檢索時,包含該關鍵詞的網頁數量較少。一個經過長尾關鍵詞優化的網站,長尾關鍵詞帶來的流量匯聚起來將會達到甚至超過網站主關鍵詞帶來的流量。[5]description幫助搜索引擎和用戶快速了解網頁的大致內容。百度description最多可顯示70個左右漢字,其中一定要包含關鍵詞,如圖1所示。
網站設計應盡量避免使用框架結構,因為搜索引擎不能迅速、完整地帶走全部網頁信息,通過iframe顯示的內容可能被搜索引擎拋棄。如果網頁已經使用了框架,則最好在代碼中使用noframes標簽進行優化,noframes中包含指向frame頁的鏈接以及帶有關鍵詞的描述文本,這樣搜索引擎才能夠正確索引到框架內的信息。控制好url層級也很重要。探測器在遍歷頁面的時候是按照url層級進行的,當層級超過三層的時候就很難被探測器搜索。層級主要是為了區分頁面的重要性,因此重要性區別不大的項目盡量放在一個目錄里。
大部分搜索引擎不能識別圖片主題內容,為了不損失圖片搜索帶來的流量,網站設計者應為圖片設置包含關鍵詞的alt屬性,讓搜索引擎了解圖片的主要信息。alt屬性是在圖像無法顯示時的替代文本,即使圖片不能正常顯示也能夠幫助用戶了解圖片內容。flash的搜索引擎友好性較差,網頁關鍵詞不能放在flash中,如果必須使用flash,則應該同時制作一個文字版供搜索引擎收錄,并在首頁使用文本鏈接指向文字版。
爬蟲程序收集頁面的軌跡是順著一個鏈接到另一個鏈接,如果網站內部存在死鏈、斷鏈,網站信息就不能被完整地收集。長尾關鍵詞的鏈接資源幾乎全部來自內鏈。為幫助搜索引擎全面了解網站的結構,可以建立網站地圖,引導爬蟲程序按照地圖上的鏈接到達每個網頁。同時,網站地圖也可以方便用戶使用,提升用戶體驗。
建立優質的外部鏈接同樣重要。外部鏈接包括導入鏈接和導出鏈接。導入鏈接也稱為反鏈,假設有兩個頁面A和B,B頁面通過一個鏈接指向A頁面,那么,B→A這個鏈接就是A的一個反鏈。Google評價網站質量的一個重要指標是PageRank(簡稱PR值,分為10個等級),指的就是一個網站有多少反鏈,以及這些反鏈網站的質量如何。導出鏈接即友情鏈接,就是頁面中指向別的網站的鏈接。某網站的PR值=(1-0.85)+0.85×(友情鏈接網站的PR 值/友情鏈接網站的外鏈數)[6],當友情鏈接的網站的PR值一定時,其外鏈數越少越好。nofollow標簽(即“反垃圾鏈接”標簽)的作用是指示搜索引擎不要抓取網頁上的帶有nofollow屬性的任何出站鏈接,以避免垃圾鏈接分散網站權重。
出版社每年都會出版發行一定數量的圖書,可提供給網站更新的內容非常多。圖書內容涵蓋的范圍廣,可以產生大量的關鍵詞和長尾關鍵詞。因此圖書網站在搜索引擎優化方面有天然的優勢。
根據上文總結的影響搜索引擎排名的因素,本文制定了表1所示的SEO狀況評價指標。衡量SEO效果的指標,國內外學者主要是從網站流量數據方面提出的。[3]13在樣本的選取上,全出版業綜合實力排名前10位的出版單位網站,其流量數據差別較小,不利于SEO效果研究。本文選取的樣本為新聞出版廣電總局《2015年新聞出版產業分析報告》中總體經濟規模排名前10位的少兒類圖書出版單位網站。少兒出版是21世紀以來中國出版業增長最快、連續增長時間最長的一個細分市場,既可以避免網站流量低迷,失去SEO效果研究的意義,樣本之間的差距也更為合理。SEO綜合查詢工具可以檢測出一個網站的搜索引擎流量、權重、友情鏈接情況等數據,TOOL站長工具和愛站網站長工具是公認較好的SEO綜合查詢工具,筆者利用它們檢測了網站鏈接、權重、百度日均IP數和百度收錄、谷歌收錄幾項數據,然后將數據結果依據表1的評價指標分析出結果。
數據收集時間為2018年1月5日,主要選取各網站最重要的首頁進行分析。從表2的數據可以看出,對最重要的原創性內容給予重視的出版社有4家。以中國少年兒童新聞出版總社為例,在圖書介紹頁面中,列出的項目有:書籍基本信息(包括作者、出版社、出版時間、版次、開本等)——這一項內容幾乎所有參與調查的出版社都具備;3至5分鐘的書籍內容介紹視頻;500字左右的內容簡介;作者簡介;媒體評論。后四項內容其余6家出版社都沒有涉及。湖南少年兒童出版社的每本圖書都只給出了書名,配有一張圖片,作者信息還需要將鼠標放在圖片上才能顯示。中國少年兒童新聞出版總社列出的上述五項內容可以幫助讀者快速了解一本書的方方面面,且內容均為原創。如百度詞條“盤中餐(于虹呈的繪本)”的內容就來自該頁面,該詞條下面列出的參考資料鏈接指向該頁面,這就是一條高質量的反鏈。
網站首頁源代碼中設置了title、keywords和description的只有5家出版社。其中,安徽少年兒童出版社的keywords和description都是“安徽少年兒童出版社”一個詞,海燕出版社的僅僅是“首頁”兩個字。新疆少年兒童出版社雖然也有keywords和description,但其keywords的內容是“精品童書包括阿凡提故事系列、貝貝熊系列、亞瑟小子雙語閱讀全18冊系列……”,關鍵詞過長,并且詞之間沒有用英文逗號隔開,因此也起不到應有的作用。接力出版社和長江少年兒童出版社設置的keywords和description符合SEO策略,后者就其社名設置了“長江少年兒童出版社有限公司”“湖北少年兒童出版社”等5個同義詞,保證讀者即使不知道準確的社名,也能搜索到該網站。
雖然表2的數據顯示,中國少年兒童新聞出版總社的圖書介紹內容很豐富,但其宣傳某一本書的內頁源代碼中并未設置keywords和description,如在百度搜索引擎中輸入“盤中餐圖書”,內容不如該頁面豐富的東莞圖書館網站排在了它前面,東莞圖書館介紹《盤中餐》這本書的頁面設置了titile、keywords和description,且三項內容都符合SEO策略,均經過精心編寫。
在圖片alt屬性和flash設置上表現最好的是明天出版社,10家出版社都沒有編制網站地圖。

表1 SEO狀況評價指標

表2 10家少兒類圖書出版單位網站內容、title和meta標簽等狀況
表3中數據來自TOOL站長工具[7]和愛站網站長工具[8]。從表3可以看出,有的出版社對導出鏈接不重視,如海燕出版社沒有設置導出鏈接;有的出版社對導出鏈接沒有進行適當選擇,二十一世紀出版社、長江少年兒童出版社和湖南少年兒童出版社的導出鏈接的平均權重較低。中國少年兒童出版社、明天出版社和接力出版社在鏈接方面的優化工作做的較好。
綜上,我們可以看出,上述10家少兒類圖書出版單位網站中,SEO工作做的較好的是中國少年兒童新聞出版總社、明天出版社和接力出版社。表4是使用站長工具對上述10家少兒類圖書出版單位網站進行測評后獲得的數據,與表1的評價指標分析出的結果有部分出入,但基本一致。
從上文的分析中可以看出,作為本文研究對象的10家少兒類圖書出版單位網站每天來自搜索引擎的訪問量都很低,大部分出版社網站的SEO工作都很不到位。出版社需要增強SEO意識,依靠自身在內容方面的資源優勢,在網站設計上實施全面的SEO策略,使出版社網站發揮更大的作用。據此,對出版社網站設計提出以下幾點建議:
新書宣傳頁面是出版社網站最常見也是最重要的頁面。圍繞一本新書,網站設計者應盡可能詳細地編制內容介紹、作者介紹、媒體評論等欄目,提高讀者的閱讀體驗。豐富的原創內容才是搜索引擎歡迎的。這一點要改進很容易,因為每本書本身都有充足的信息,只要編輯在發布網站內容時選取合適的信息即可。
新書宣傳頁不應該只選取書名作為關鍵詞,為了方便不知道該書全名的人進行查找,還應該圍繞該詞選取一些長尾關鍵詞。選取長尾關鍵詞的方法,一是從搜索者的需求出發,用盡可能多的詞匯和主關鍵詞組合;二是留意百度搜索頁面底部“相關搜索”列出的詞匯,然后將關鍵詞自然地融入到網頁描述中。
可以將書籍分類欄目設置在首頁,層級越少就越方便用戶查找和記憶。有些網站盡管可以從首頁看出網站大體布局,但編制一個清晰的網站地圖不僅方便爬蟲程序抓取網站頁面,而且可以極大地提高用戶體驗。網站地圖入口可以放置在網站首頁頂部或底部。
出版社網站需要使用大量圖片,如果圖片不能被檢索、加載速度慢,將會影響網站的搜索引擎排名。網站設計者應為有價值的圖片增加alt屬性,并在不影響顯示效果的前提下盡量壓縮圖片大小。flash等對搜索引擎不友好的代碼也要盡量避免使用。

表3 10家少兒類圖書出版單位網站鏈接狀況

表4 站長工具數據結果
導出鏈接的選擇要慎重。上述10家少兒類圖書出版單位網站中,中國少年兒童新聞出版總社、浙江少年兒童出版社等幾家出版社網站的導出鏈接都是自己所屬集團的兄弟網站。抱團推廣的初衷可以理解,但如果兄弟網站質量很差,反而會稀釋自己網站的權重。表現最好的接力出版社網站導出鏈接就選取的是相對優質的網站。
隨著信息技術的快速發展,我國出版行業正在從傳統出版向數字出版轉型。出版社網站作為數字出版的窗口,在出版社的日常運作和經營管理中大有可為。出版社應重視網站建設,充分發揮自身的資源優勢,做好網站SEO工作,提高網站訪問量,為出版社的未來發展提供更廣闊的平臺,為用戶提供更便捷的服務,為國家書香工程的建設和全民閱讀助力。
[1]苗倩楠.我國出版社官網用戶體驗研究[D].南京:南京大學,2014.
[2]扈欣悅.我國圖書出版社網站建設研究[D].北京:北京印刷學院,2013.
[3]周鑫.基于谷歌搜索引擎的企業SEO方法及其效果的實證研究[D].寧波:寧波大學,2014.
[4]徐煒.淺析搜索引擎優化技術及其應用[J].科技風,2017(4):53-54.
[5]鄧孜.長尾關鍵詞理論在提高出版網站訪問量中的應用[J].中國出版,2009(Z3):89-91.
[6]PR值[EB/OL].[2018-01-05].https://baike.baidu.com/item/ PR值.
[7]站長工具[EB/OL].[2018-01-05].http://tool.chinaz.com.
[8]愛站網[EB/OL].[2018-01-05].https://www.aizhan.com.