999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于開放存取組織分析的隱形網絡資源顯性化

2011-07-24 08:32:42邱春艷
圖書館學刊 2011年11期
關鍵詞:搜索引擎網絡資源資源

邱春艷

(武漢大學信息管理學院,湖北 武漢 430072)

邱春艷 女,1987年生。碩士在讀,研究方向:信息檢索與咨詢。

自20世紀90年代以來,開放存取(Open Access,縮寫為OA)作為學術界、出版界以及圖書館界等為打破商業出版者的壟斷而采取的免費自由存取和利用的一項重大舉措,為科研成果的廣泛無障礙傳播提供了有效的途徑和方式。OA資源與隱形網絡資源有諸多相似之處,OA資源是學術隱形網絡資源的重要組成部分,因此,OA資源的組織和揭示是隱形網絡資源顯性化發展的實例,隱形網絡資源的顯性化發展可以借鑒其成功經驗。

1 開放存取與隱形網絡的概念及研究

1.1 開放存取和隱形網絡的定義

目前比較權威的3個國際性相關文件《布達佩斯開放存取動議》(Budapest Open Access Initiative,縮寫為BOAI)、《貝塞斯達原則》(Bethesda Principles)和《關于自然科學與人文科學資源的開放存取柏林宣言》(Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities)分別對OA作了定義。筆者比較認同BOAI的定義,認為“對文獻的開放存取即意味著它在公共網絡可以被免費獲取,允許任何用戶閱讀、下載、復制、分發、打印、檢索、超鏈接該文獻的全文信息”。[1]

隱形網絡(Invisible Web),又名隱蔽網絡、深網(Deep Web)、看不見的網絡或者黑洞、黑色資源(Dark Net)等。自2001年美國圖書館員和信息學者Chris Sherman和Gray Price合著的《The invisible web:uncovering information sources search engines can’t see》出版之后,隱形網絡逐漸受到計算機界、圖書館界等各方的廣泛關注。Sherman和Price將隱形網絡定義為:在網絡上可以獲得的資源,但由于技術限制或者由于特定選擇而不能或未被納入通用搜索引擎中的文本網頁、文件或其他高質量的權威性信息資源。[2]

1.2 開放存取與隱形網絡相關研究文獻統計分析

筆者于2011年以關鍵詞、主題、題名等途徑檢索,對CNKI中2001~2010年OA和隱形網絡相關文獻數量進行統計(見表1)。統計結果顯示:國內對OA的研究文獻從2002年開始出現并逐年遞增,對隱形網絡的研究則相對較晚,從2003年開始出現關于“隱性信息”的文章。2004年對隱形網絡的研究文獻開始逐漸增多,2008、2009、2010每年關于隱形網絡的研究文獻保持在80篇以上。

表1 2001~2010 CNKI中OA和隱形網絡相關文獻數量統計(單位:篇)

對OA的研究主題集中在國外經驗介紹、對知識交流的影響、OA模式、知識產權問題、OA實現途徑、運行技術、質量控制、對策等方面。對隱形網絡的研究主題初期多集中于隱形網絡的概念特征、成因、類型等介紹性內容,之后開始探討隱形網絡的宏觀控制、檢索策略、隱形網絡資源的采集與整合、數據挖掘、檢索工具的改進以及圖書館對于隱形網絡資源的開發利用等。

從研究文獻數量和時間看,對OA的研究文獻數量是隱形網絡的近4倍,同時對隱形網絡的研究要晚于對OA的研究,可看出在國內OA較之隱形網絡更受關注。從研究主題來看,多數研究文獻著重對OA和隱形網絡兩者之一進行單獨研究,對兩者的綜合研究則以免費網絡資源的獲取為主要內容,數量較為稀少,有待深入和拓展。

2 開放存取與隱形網絡的關系

2.1 開放存取與隱形網絡的區別

2.1.1 內容范圍

OA資源主要是科研數據、學術研究論文、科研報告、專著、教學課件等學術類資源。而隱形網絡資源除學術類資源,還包含了政府信息、新聞資訊、娛樂資訊等,相比OA資源內容更為豐富,因此也相對復雜。通常特定的隱形網絡資源集中于特定的主題領域,如政府部門和學術機構所提供的特定專題或學科領域的數據庫資源。

2.1.2 資源格式

OA資源多數為靜態的文件格式,OA期刊多以PDF和HTML格式文件的形式存在,OA倉儲多數收錄PDF格式和Word格式的文件。而隱形網絡資源格式則更為多樣,除了PDF和Word等靜態文件外,還有大量的FLASH文件、網頁等動態格式文件。

2.1.3 受關注程度

從相關會議分析,國內參與或召開的以OA為主題的會議(如柏林會議等)較多,而與隱形網絡相關的會議較少。由此可見,國內對隱形網絡的關注遠不及對開放存取的關注。受關注程度的不同導致開發和利用程度的不同。

2.2 OA資源與隱形網絡資源的聯系

OA資源與隱形網絡資源具有諸多相同點,主要表現在:①隱蔽性。兩者都難以通過通用搜索引擎獲取,因而對于習慣使用通用搜索引擎的用戶具有隱蔽性。②資源數量大。根據Bright Planet于2001年發表的白皮書所述,隱形內容大約有5000億個文檔,至少是有形內容的50倍。[3]OpenDOAR收錄1800多個OA倉儲,Open Science Directory收錄約13000種OA期刊,可見OA資源數量之大。③內容豐富。隱形網絡資源的內容包含了多種文件格式的文件內容,涉及政治、社會、科研等多個領域。開放存取資源則包含了所有學科的學術資源。④價值大。隱形網絡資源具有特定的內容、專業的檢索界面、更高的檢全率和檢準率以及最高水平的權威性,[4]因而對于用戶具有比較大的利用價值。OA資源的學術性和免費性使其對科研用戶具有較高的參考價值。⑤主要傳播載體相同。兩者都通過互聯網提供獲取和使用。

由于OA資源具有隱形網絡資源的主要特點,可以將OA資源歸為隱形網絡資源。學術隱形網絡是隱形網絡資源中具有重要學術價值的組成部分,是包含所有數據庫和相關學術收藏但不被普通搜索引擎所檢索的信息資源。[5]OA資源多數為學術隱形網絡資源。

3 開放存取資源的組織與揭示

隨著開放存取理念的廣泛傳播,開放存取受到各界人士、特別是科學研究領域的認同和推崇,對OA資源的組織、揭示、傳播以及開發、利用也逐漸成熟。

3.1 開放存取資源的主體

許多參與到OA運動中的組織機構,將自己的研究成果或出版物以開放存取的形式向外界傳播,此類機構對自身OA資源以特定方式進行組織和揭示。①在學術界,科研機構將本機構開展或給予資金支持的科研項目的進展、成果、結論數據和內容信息以機構庫或學科庫的形式存儲,通過網絡向全世界或部分地區提供存取。②在出版界,許多出版機構出版OA形式的原生出版物,部分傳統出版機構將固有出版物轉為OA形式的出版物。

3.2 開放存取資源的組織

3.2.1 組織方法

對OA資源的組織主要利用分類法和主題法。OA資源的組織吸收了傳統文獻組織的主要方法即分類法和主題法的精髓,并根據資源狀況和用戶需求作了改進。如多數開放存取期刊目錄(如DOAJ等)按照學科和主題來組織收錄的期刊,但其分類目錄和主題劃分并未嚴格采用某種特定分類法和主題法。

3.2.2 組織技術

①元數據互操作。OA資源內容龐雜,格式多樣,對其組織必須解決其元數據的互操作問題。OA資源采用開放文檔協議(Open Archives Initiative,縮寫為 OAI),需提供DC元數據和其他格式元數據。開放文檔元數據采集協議OAI-PMH的制定和實施,促進了不同系統、國別、語種的OA資源元數據的互操作。

②資源定位。作為網絡資源的OA資源具有較大的不穩定性,通過賦予OA資源以唯一的永久的標識符,即數字對象唯一標識符(Digital Object Unique Identifier,縮寫為DOI),從而加強OA資源的定位,使用戶可以定位確定的OA資源。

③永久保存。長期保存是網絡資源面臨的重要問題。通過采用基于開放檔案信息系統(Open Archival Information System,縮寫為OAIS)的永久保存機制,從而實現對OA資源的永久保存。以OAIS為基礎的項目較多,如加利福尼亞大學數字保存倉儲(Digital Preservation Repository,縮寫為DPR)等。

3.2.3 相關軟件的開發和應用

目前已開發了較多用于建立、組織和管理OA倉儲和OA期刊的軟件系統。較為成熟的OA倉儲軟件系統有Dspace、Eprints、Fedora、Escholarship、CDSWare、ARNO等,其中應用最為廣泛的是Dspace和Eprints。公共知識計劃(Public Knowledge Project,縮寫為PKP)包含了開放期刊系統(Open Journal System,縮寫為OJS)、開放會議系統(Open Conference System,縮寫為OCS)、開放收割系統(Open Harvester Systems,縮寫為OHS)、開放專著系統(Open Monograph Press,縮寫為OHS)等,其中OJS被超過5000種學術期刊使用。[6]此類軟件系統的開發和應用為開放存取的實施和資源組織提供了便利。

3.2.4 組織工作

對OA資源的組織工作主要體現在對OA資源的編目。根據Anna K.Hood于2007年對ARL成員利用OA資源情況的調查,86%的成員館從OCLC下載OA資源的目錄信息,69%的成員館自行編制,56%的成員館從其他組織下載編目信息。[7]可見,圖書館較早就開始重視對OA資源的編目。圖書館通過對傳統編目著錄格式的特定字段進行修改、補充,以實現對網絡信息資源的編目。其中比較典型的為OCLC運用USMARC對網絡資源進行編目,用256字段標識計算機文件特征,856字段標識網絡資源的URL信息。[8]

3.3 開放存取資源的揭示

3.3.1 開放存取資源目錄

對OA資源最直接的揭示方式即以目錄形式提供OA資源的內容信息和鏈接入口。如OA期刊目錄將其收錄的大量期刊信息,如刊名、ISSN號、學科主題信息等進行揭示,同時提供該期刊的鏈接入口。

3.3.2 第三方機構對開放存取資源的揭示

除上述機構,還有自身資源不提供開放存取的圖書館、科研機構以及OA資源站點等第三方機構進行開放存取資源組織、揭示和傳播。①圖書館。眾多圖書館在其網站上開辟專欄對OA資源進行介紹和導航,許多圖書館還對OA資源進行整合提供。對OA資源和相關理論的研究在圖書館界也備受關注。②科研機構。許多科研機構對其他機構提供的OA資源進行組織,多以資源導航的形式提供。③OA資源站點。OA資源數量巨大,內容龐雜,許多站點致力于以目錄形式對其進行組織和揭示。

3.3.3 開放存取資源搜索引擎

OA資源分布在不同的國家和研究機構,通過針對OA資源的專門搜索引擎將不同地區和不同語種的OA資源進行標引。通常包括綜合性、專類和專科OA資源搜索引擎,通過用戶的檢索來揭示。

3.4 人文關注

近幾年,國內許多領域召開以OA為主題的會議,2010年10月26日,“第八屆開放獲取柏林國際會議”在中國科學院國家科學圖書館成功舉行。隨著各項會議的召開以及越來越多致力于OA的機構參與,OA資源相關的活動和項目不斷開展,對OA的關注不斷深入。第三方機構在提供OA資源鏈接或導航時,通常提供相關介紹等,對各領域用戶了解和關注OA資源起到了推廣和宣傳的作用。

4 隱形網絡資源的顯性化發展

隱形網絡資源通常具有特定的內容、較高檢全率和檢準率、較高權威性等特點,因而具有較大的價值。只有當相對于大多數用戶而言,隱形網絡資源處于顯性化狀態時,隱形網絡資源的巨大價值才能得到充分的發掘和利用。隱形網絡資源與OA資源有諸多相同點,因而對隱形網絡資源的組織和揭示可以借鑒OA資源已有的組織和揭示方法,同時應針對區別于OA資源的特點采取有針對性的措施。

4.1 隱形網絡資源所有者促進自身資源顯性化

隱形網絡資源要得到顯性化的揭示和利用,需要資源自身的轉變。OA資源之所以得到重視并不斷被深入開發利用,很大程度上取決于其“開放”地面向用戶,從而增強了用戶對OA資源的認識和利用率。因此隱形網絡資源所有者需通過向搜索引擎提交網址,使該資源能夠被通用搜索引擎檢索,提高用戶的點擊率與資源的利用率。

4.2 第三方對隱形網絡資源的揭示

第三方對資源的揭示是用戶獲取OA資源的重要中轉途徑,也是了解和獲取隱形網絡資源的重要途徑。隱形網絡資源是圖書館、研究機構等信息服務機構拓展自身資源的重要來源之一。通過搜索引擎、資源目錄等方式,對隱形網絡資源進行更為廣泛精確的搜集和整合,提供一站式檢索,是今后第三方機構對隱形網絡資源揭示的重要方式。

4.3 理論和技術研究的支持

任何行動都需要強有力的理論和技術支撐。對開放存取相關理論和技術的研究與應用,推動了OA資源的開發和利用。對隱形網絡資源的開發利用亦需有理論和技術研究為先導。當前對于隱形網絡的研究還僅局限于定義、類型、簡單獲取策略等淺層次的內容。此外,技術是導致隱形網絡資源隱蔽性的重要原因,隱形網絡的特性需要包括信息挖掘技術、搜索引擎以及元數據等信息描述技術在內的各種網絡資源的深入發展。隨著本體技術、網絡爬蟲技術、數據采集和整合技術、元數據等相關技術的發展,對隱形網絡的揭示與發掘將更加深入。[9-10]

4.4 法律和政策的保證

除了技術的限制,隱形網絡資源的隱蔽性在很大程度上取決于資源所有者對于侵權等方面的顧慮,解決相關網絡資源的知識產權、隱私權保護等問題,對于隱形網絡資源的顯性化揭示有重要的作用。

4.5 增強對隱形網絡資源的人文關注

用戶的需求是資源利用的重要動力。相比隱形網絡資源的巨大價值,用戶的需求力不足,其推動力未能充分顯現。這需要用戶自身對于隱形網絡資源相關知識的了解和學習,提高自身的信息意識和信息獲取能力。同時在獲取和使用隱形網絡資源時,用戶應加強對所獲取資源的整理和保存。此外,OA資源的相關會議、文件、活動,在很大程度上對開放存取起到了宣傳推廣作用,相比之下,對于隱形網絡資源的宣傳推廣力度還遠遠不足,應加強對隱形網絡資源和工具等基本內容的推廣宣傳,帶動對整個隱形網絡資源的認識和研究。

[1]Budapest Open Access Initiative[OL].[2011-03-02].http://www.soros.org/Openaccess/read.shtml.

[2]馬費成等.看不見的網站——Internet專業信息檢索指南[M].沈陽:遼寧科學技術出版社,2003:48.

[3]Bright Planet.The Deep Web:Surfacing Hidden Value[OL].[2011-05-12].http://www.brightplanet.com/images/uploads/12550176481-deepwebwhitepaper.pdf.

[4]馬費成等.看不見的網站—Internet專業信息檢索指南[M].沈陽:遼寧科學技術出版社,2003:79-80.

[5]陳紅勤.學術隱蔽網絡和學術搜索引擎[J].現代情報,2008(7):118.

[6]Kilgour Award recipient named[OL].[2011-05-12].http://www.ala.org/ala/mgrps/divs/lita/newandnoteworthy/kilgourwinner2010.cfm.

[7]Anna K.Hood.Open Access Resources[OL].[2011-03-07].www.arl.org/bm~doc/spec300web.pdf.

[8]邱燕燕.開放存取資源的組織和揭示[J].圖書館雜志,2006(6):20-22.

[9]張芳,肖國強.基于專業搜索引擎的元搜索引擎的設計[J].鄭州大學學報,2007(2):38-41.

[10]黃聰會,張水平,胡洋.主題Deep Web爬蟲框架研究[J].計算機工程與設計,2010(5):929-935.

[11]高明,王繼成,李江峰.基于語義支持的Deep Web數據抽取[J].計算機科學,2010(3):156-158.

猜你喜歡
搜索引擎網絡資源資源
基礎教育資源展示
一樣的資源,不一樣的收獲
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
網絡資源在高中班級管理中的運用
談網絡資源在大學計算機教學中的應用
網絡搜索引擎亟待規范
中國衛生(2015年12期)2015-11-10 05:13:38
基于Nutch的醫療搜索引擎的研究與開發
廣告主與搜索引擎的雙向博弈分析
對等網絡資源搜索模型研究
主站蜘蛛池模板: 亚洲第一视频区| 欧美国产在线一区| 手机在线看片不卡中文字幕| 色婷婷在线影院| 色妞永久免费视频| 亚洲AV免费一区二区三区| 欧美成人手机在线视频| 97成人在线视频| 欧美不卡视频在线| 亚洲人成影院在线观看| 色哟哟国产精品一区二区| 高清欧美性猛交XXXX黑人猛交| 欧美激情福利| 日韩欧美中文在线| 国产91丝袜在线播放动漫 | 欧美日韩一区二区三| 无码不卡的中文字幕视频| 国产理论精品| 日本成人不卡视频| 亚洲欧洲日本在线| a亚洲视频| 欧美成人午夜影院| 午夜精品区| 九色视频最新网址| 亚洲视频免费在线看| 午夜激情福利视频| 国产噜噜在线视频观看| 99久久精品国产麻豆婷婷| 中文字幕乱码中文乱码51精品| 国产三级视频网站| 久综合日韩| 丰满人妻中出白浆| 色妞www精品视频一级下载| 成年免费在线观看| 欧美色视频日本| 呦视频在线一区二区三区| 久久人妻系列无码一区| 婷婷开心中文字幕| 国产精品va免费视频| 亚洲综合极品香蕉久久网| 久久青青草原亚洲av无码| 婷婷午夜天| 99久久国产综合精品2023| 99在线视频免费观看| 国产鲁鲁视频在线观看| 久久精品免费看一| 无码福利视频| 亚洲一区二区在线无码| 亚洲黄色片免费看| 国禁国产you女视频网站| 日本免费a视频| 国产成人亚洲综合a∨婷婷| 亚洲欧美日韩色图| 国产精品久久国产精麻豆99网站| 色综合婷婷| 91在线中文| 操国产美女| 无码aaa视频| 一级毛片免费的| 在线播放国产99re| 国产成人亚洲毛片| 欧美a√在线| 麻豆精品视频在线原创| 72种姿势欧美久久久久大黄蕉| 又粗又硬又大又爽免费视频播放| 成人精品在线观看| 亚洲精品无码高潮喷水A| 91麻豆精品国产91久久久久| 国产国产人成免费视频77777 | 日韩成人在线网站| 国产国语一级毛片在线视频| 国产精品3p视频| 亚洲综合精品香蕉久久网| 40岁成熟女人牲交片免费| 啪啪啪亚洲无码| 91午夜福利在线观看| 国产在线97| 精品国产成人国产在线| 国产微拍一区| 日韩一区二区在线电影| 久久毛片基地| 日韩美女福利视频|