999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能應用圖書編目前景展望

2021-04-09 01:31:10林遠紅
內蒙古科技與經濟 2021年5期
關鍵詞:智能化深度人工智能

林遠紅

(重慶圖書館,重慶 400037)

在過去的50年中,圖書編目已由手工編目完全過度到了以機讀目錄為格式的文獻編目自動化和網絡化階段。書目數據共建共享極大提高了圖書館的編目效率,但是一條書目數據的創建仍然是一項耗時、耗力、低產出的工作,鑒于此,越來越多的圖書館選擇書目數據外包。但是館配商向圖書館提供的書目數據質量不高,除了編目描述錯誤外,主要的問題是主題分析不準確,分類標引錯誤等,完全達不到行業要求。最終,編目人員仍然要對書目數據進行逐項審校。編目員反復翻閱分類法、查閱主題詞,繁重、機械、低效率的工作與高速的網絡化時代似乎顯得格格不入。于是筆者寄希望于人工智能技術,通過萬方數據庫查看相關論文和書籍,梳理人工智能的起源、編目專家系統的研究、智能標引技術、智能分類技術等這些與智能編目相關的信息,同時對人工智能的技術與應用前景也進行了解,希望能從中找到二者的融合點,真正把圖書編目帶進智能時代。

1 AI技術在編目領域發展現狀

1.1 AI技術的定義

人工智能(Artificial Intelligence)技術,從1956年首次被提出,已經有六十多年發展歷程。它先后經歷了3次“熱潮”與“寒冬”交替的發展階段。第一階段:20世紀50年代到60年代時期。1956年美國達特茅斯會議首次提出“人工智能”術語,并將像人類那樣思考的機器稱為“人工智能”。隨后人們以“推理”和“搜索”為規則,模仿人類思維方式總結思維規則,開展了數學證明系統、知識推理系統技術與應用的研究計劃。對于規則性強的領域,由于受限于計算機的運算能力,對于解決現實生活中的復雜問題,比如翻譯、醫療很難如意。因此到了20世紀70年代初人工智能變得蕭條冷寂。第二階段:20世紀80年代到90年代,以LIPS語言為基礎,以日本CYC項目為代表的知識庫。它依靠“有規則的知識”的支撐,導入各領域“知識”使計算機變得更聰明,并稱之為“專家系統”。例如,斯坦福大學開發的MYCIN系統,它能對血液病患者進行診斷,并開出抗生素處方。在這一時期,知識表示,本體研究、機器翻譯都得到相應的發展。知識導入型專家系統確實具有一定的產業實用性,但是,知識描述之復雜與機器理解的困難讓人工智能又一次望而卻步。最終,專家系統被淘汰。第三階段: 20世紀90年代后半期,搜索引擎的誕生與普及,產生了大量的可用數據,以大數據為導向的機器學習為人工智能的發展帶來了新的契機。在技術領域,以DeepMind公司為首的深度學習也進入了更深層次的研究階段,深度學習+大規模計算+大數據把人工智能推向一個新的時代。人工智能在語音識別、機器視覺、數據挖掘、智慧醫療等多個領域得到實現。同往常以理論學術研究為主導不一樣,這次是以資本為推手,著力解決實際問題為目的的人工智能。技術的進步為智能編目提供了可能性。

1.2 AI技術應用圖書編目現狀

回顧歷史,從20世紀70年代以來,AI就逐漸應用到圖書館管理和服務的各個環節,出現了各類專家系統,例如圖書館咨詢專家系統、圖書分類專家系統、信息檢索專家系統、編目專家系統。文獻的編目包括描述文獻的物理形態,選取檢索點;分類、主題標引;規范控制3個方面。筆者以編目的3個方面為檢索內容,時間區間為1980年~2020年,分別用編目and(專家系統or自動化);分類and(專家系統or自動化);標引and(專家系統or自動化)等詞在萬方數據庫中進行組配檢索,通過認真篩選,詳細閱讀,得出了近年來編目領域專家系統的研究概況。編目專家系統領域的研究范圍涉及以下5個主題,研究文獻主題及年代分布見表1。

表1 40年以來發表論文的主題及年代分布

圖書編目經過了幾十年的發展,在自動標引、自動分類、自動編目等領域,在理論上都取得了長足的發展。其中,在編目描述領域,編目的智能主要體現在編目專家系統的研究。早期的編目專家系統功能相對比較簡單,能進行一些簡單的規則使用和著錄項目識別,例如:倫敦工業學院的Black W. J.等人設計的HEADS系統,它能完成簡單的編目過程,但是對一些特殊的規則和字符串無法處理;同在倫敦工業學院的Eyre 用Prolog語言設計了專門用于責任者名稱的系統。這兩個系統優勢各不相同,但都無法獨立完成編目工作。同時期的還有Ercegovac設計了一個包含編目規則和專家知識庫的編目專家系統;匹茲堡大學的Katz等人設計了Maccat等原型編目專家系統 。前期的研究成果雖然沒有真正實現編目自動化,但是為圖書編目各個模塊實現智能識別和編目提供了思路。

隨著計算機、光學識別和軟件技術的不斷發展,編目專家系統的研究進入一個新的活躍期。20世紀70年代,OCLC研制了Automated litlepage cataloguing系統,該系統主要應用OCR光學識別技術對題名頁進行識別,再通過編目規則和其他要素來進行編目。最終正確識別率可達到89%。同時用于對責任者進行識別的UCLA的Motto與Svenomius的系統研制出來了,它主要應用OCR技術,以OCLC的規范文檔和出版商名錄、姓氏人名大字典等工具對題名頁的人名、團體名稱進行識別,團體名稱正確率可達85.8%,個人名稱成功率可達84.5%。

1984年英國Exeter大學的Davies和James采用Prolog語言研制出第一個編目專家系統。隨后,Hjerppe在瑞典Linkkoping大學研制了以選取款目檢索點核心的Esscape系統。1986年,威斯康星大學開發了MITI/MARC編目專家系統,并實現了現實編目工作中的應用。國內編目專家系統方面的研究除了理論上的一些介紹和想法外,基于實踐的編目專家系統幾乎為零。成績最為突出的以國家圖書館編制的《中國圖書館分類法》(第五版)Web版和《中國分類主題詞表》Web版,雖然它僅僅是一種工具,但是同樣是編目自動化的一部分。幾十年的發展研究,編目專家系統在理論和實證方面都得到了很大的進步,雖然最終沒有哪一個系統正式投入使用,但是對于編目的智能化進行了探索。

在自動標引理論方面,分別開創了基于本體、決策樹、小世界網絡、條件隨機場、粗集理論、遺傳算法等理論,例如:以南京農業大學侯漢清為中心設計構建的以創新知識庫開始的文獻主題詞自動標引和自動分類方法體系。在文獻分類理論方面,提出了使用TF-IDF算法和樸素貝葉斯算法、KNN、決策樹法、中心向量法、支持向量機,以及基于卷積神經網絡的文獻自動分類法。

綜上所述,人工智能從1956年被提出,到最終應用于各大圖書館,已有六十多年的歷程。現階段雖然還沒有實現編目智能化,但是在編目描述、分類、主題標引方面的智能化研究已取得了進步。相信先進的算法、理論和人工智能技術相結合,編目智能化實現也是指日可待。

2 人工智能應用圖書編目的前景展望

2.1 人工智能新技術與編目理論的深度融合

人工智能技術在經歷了幾十年潮起潮落的漫長發展歷程之后,在知識表示、自動推理和搜索方法、機器學習和知識獲取、知識處理系統、自然語言理解、計算機視覺、智能機器人、自動程序設計等領域有了新的進展。技術上的突破為圖書編目智能化實現增加了可能性。同時,圖書編目理論從AACR2發展到了RDA,編目理論的發展也非常成熟和完備。實現編目的智能化,必需聚集技術前沿的融合:人工智能技術+大數據+圖書編目理論框架。圖書編目理論是其中主導部分,結合自然語言理解、深度學習等技術,借用大數據使得編目規則更容易被機器理解。人工智能新技術、規范數據和算法是人工智能與圖書編目應用發展的3個關鍵要素。新的技術為智能編目提供技術基礎,大規模規范的數據為計算機深度學習提供內容基礎,合適的算法模型為智能編目的實現提供有效的途徑。

圖書編目發展到今天,已經形成了相當完整的可操作的規則庫。以中文圖書為例在編目描述階段,有《中文書目數據標準》《中文書目數據制作》等以規則和實例為一體的操作手冊。在圖書分類標引方面,有Web版的《中國圖書館分類法》;在主題標引方面有Web版的《中國分類主題詞表》,在對著者、題名進行規范方面,有國家圖書館的規范庫。這些基礎數據經過長時期的發展都形成了比較完整的、穩定的系統。

2.2 以大數據為基礎的機器深度學習模型

從根本上來說,深度學習就是一種用數學模型對真實世界中的特定問題進行建模,以解決領域內相似問題的過程。它把計算機要學習的東西看成一大堆數據,把這些數據丟進一個復雜的、包含多個層級的數據處理網絡,然后檢查經過這個網絡處理得到的結果數據。深度學習不僅僅是“全盤記憶”來解決問題,它已經轉向特征記憶的學習。深度學習的算法使用了大量來自特定領域的數據,讓系統使用這些輸入的數據,訓練自己識別數據和期望結果之間的關聯性。大量的相關數據、強大的算法、足夠細化的領域以及明確的目標,使得人工智能得以實現。就編目而言,要實現機器像人一樣,自動著錄一條完整、準確的數據,是不可想象的。但是,可以通過多路徑協作的模式來實現智能編目。從編目的流程來看,一本圖書要完成編目,需要經過圖書物理特征的描述、圖書主題內容揭示、規范控制3個模塊。讓這3個模塊單獨進行深度學習訓練,等到各個深度學習的模塊調整到最優狀態,再讓他們相互作用,相互影響。通過將無數個不同目標的深度學習相互連接協調,使其真正實現編目智能化。智能編目所需的大數據來源于:系統已有的規范書目數據、讀者檢索用關鍵詞、網絡書目數據、網絡書評、出版社數據等。除了初始的數據外,國家圖書館開發的Web版《中國分類主題詞表》、Web版《中國圖書館分類法》、規范數據庫等,這些規范的數據,都為深度學習提供了數據支撐。

2.3 書目數據上、下游在技術與理念的合作共建共享

回想起人工智能兩次熱潮的來、去均遭遇了相同的命運。研究人員紛紛轉行、經濟支撐不足的一幕還歷歷在目。面對第三次人工智能熱潮,雖然理論和技術都有了很大的提升,但還是處于探索階段。人工智能應用圖書編目前景目標遙遠,仍需極力去探尋實現的途徑。人工智能與圖書編目融合發展也面臨著技術上的突破、經濟支撐不足、專業人才缺乏的現實困境。未來人工智能與圖書編目應用的前景,需要在技術、數據、算法和人才4個層面協同推進,即要加強人工智能與出版界融合發展的技術研究,也要深入與互聯網圖書網站的數據共建共享。聯合人工智能與出版界、互聯網圖書行業的數據內容生產,創新人工智能與各方發展的有效合作模式,搭建和完善整個人才培養體系,最終讓編目智能化走向工作實踐。

3 結束語

隨著人工智能、大數據等信息技術的發展,探索人工智能應用于圖書編目已經可行。應用人工智能技術將圖書數據進行智能化處理,可以最大限度發揮人機結合優勢。因此,以新的編目條例為核心、以機讀目錄為支持,借助人工智能技術,通過智能化新算法的研究,最終建立具有智能編目的高效運行系統,從而進一步提升編目的效率。

猜你喜歡
智能化深度人工智能
智能化戰爭多維透視
軍事文摘(2022年19期)2022-10-18 02:41:14
深度理解一元一次方程
印刷智能化,下一站……
印刷工業(2020年4期)2020-10-27 02:45:52
深度觀察
深度觀察
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
深度觀察
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于“物聯網+”的智能化站所初探
主站蜘蛛池模板: 午夜无码一区二区三区| 国产特级毛片aaaaaaa高清| 人妖无码第一页| 无码区日韩专区免费系列| 亚洲成人网在线播放| 亚洲人成色在线观看| 香蕉综合在线视频91| 欧美色综合网站| 日韩国产 在线| 国产欧美视频一区二区三区| 欧美在线三级| 为你提供最新久久精品久久综合| 四虎国产精品永久在线网址| 国产美女无遮挡免费视频| 欧美精品二区| 久久国产免费观看| av尤物免费在线观看| 91精品国产一区自在线拍| 国产成人精品免费视频大全五级| 午夜福利免费视频| 99色亚洲国产精品11p| 成人一级黄色毛片| 亚洲人成网站在线播放2019| 日本一本正道综合久久dvd| 国产丝袜啪啪| 亚洲人成网站日本片| 试看120秒男女啪啪免费| 精品国产一区二区三区在线观看| 欧美成人免费一区在线播放| 影音先锋丝袜制服| 午夜福利在线观看入口| 久久人人妻人人爽人人卡片av| 国产一区自拍视频| 久久久久国产精品免费免费不卡| 丁香婷婷激情网| 国产91视频免费观看| 国产免费网址| 伊伊人成亚洲综合人网7777| 香蕉久久国产精品免| 国产综合另类小说色区色噜噜| 噜噜噜久久| 欧美成一级| 国产欧美在线观看精品一区污| 欧美激情网址| 中文字幕久久波多野结衣| 国产欧美在线视频免费| 国产成人av一区二区三区| 麻豆精选在线| 福利小视频在线播放| 久久9966精品国产免费| 亚洲人成影视在线观看| 亚洲三级网站| 国产亚洲欧美日韩在线观看一区二区| 亚洲色图欧美| 女人一级毛片| 尤物成AV人片在线观看| 久草网视频在线| 亚洲第一黄色网址| 就去色综合| 巨熟乳波霸若妻中文观看免费| 欧美一区二区三区不卡免费| 久久亚洲国产一区二区| 曰韩人妻一区二区三区| 日韩欧美视频第一区在线观看| 青青草久久伊人| 青青草国产免费国产| 亚洲高清免费在线观看| 亚洲国产天堂久久综合| 精品国产自| 亚洲欧洲日韩国产综合在线二区| 高清欧美性猛交XXXX黑人猛交 | 色哟哟色院91精品网站| 国产精品女熟高潮视频| 亚洲乱码在线视频| 久久大香香蕉国产免费网站| 欧美第一页在线| 在线观看网站国产| 91人人妻人人做人人爽男同| 热久久这里是精品6免费观看| 亚洲欧洲日产国产无码AV| 久久久久久久久亚洲精品| 国产v欧美v日韩v综合精品|