6月19日至23日,為期5天的第三十屆北京國(guó)際圖書(shū)博覽會(huì)在國(guó)家會(huì)議中心舉行。作為全球第二、亞洲第一的圖書(shū)博覽會(huì),大會(huì)備受矚目。
人工智能(簡(jiǎn)稱(chēng)“AI”)的發(fā)展趨勢(shì)目前聚焦在生成式人工智能,也就是大模型方面。大模型出現(xiàn)后帶來(lái)效率躍升,有人擔(dān)心人類(lèi)會(huì)不會(huì)因此失業(yè),也有人擔(dān)心會(huì)不會(huì)誕生硅基生命,最后把碳基生命打敗。
“從現(xiàn)在來(lái)看,我們可見(jiàn)的將來(lái),人工智能的定位就是人類(lèi)的助手,是幫助人類(lèi)的。”在6月19日舉行的2024出版與技術(shù)創(chuàng)新大會(huì)上,演講嘉賓、北京大學(xué)王選計(jì)算機(jī)研究所研究員趙東巖否定了上述猜想。
那么,在未來(lái),AI這個(gè)助手將在出版業(yè)扮演怎樣的角色呢?以“AI賦能下的出版未來(lái)”為主題,2024出版與技術(shù)創(chuàng)新大會(huì)吸引了眾多海內(nèi)外出版界精英、學(xué)術(shù)領(lǐng)袖及AI技術(shù)專(zhuān)家,共同探索AI技術(shù)如何為出版業(yè)賦能,塑造全新的出版業(yè)態(tài)。
1956年,人工智能的概念被提出。上世紀(jì)90年代以來(lái),人工智能領(lǐng)域出現(xiàn)了三次標(biāo)志性事件。
1997年,“深藍(lán)”打敗國(guó)際象棋世界冠軍,標(biāo)志著在計(jì)算智能領(lǐng)域計(jì)算機(jī)已經(jīng)超過(guò)人類(lèi);2016年,AlphaGo打敗圍棋世界冠軍李世石,標(biāo)志著在感知智能方面計(jì)算機(jī)超過(guò)了人類(lèi);2022年底,Chat-GPT推出,兩個(gè)月之內(nèi)就達(dá)到月活上億,生成式人工智能時(shí)代隨之來(lái)臨。
“伴隨著數(shù)智時(shí)代的來(lái)臨,人工智能作為一種顛覆性的科技創(chuàng)新范式,為學(xué)術(shù)研究和出版行業(yè)帶來(lái)了前所未有的變革和機(jī)遇。”中國(guó)科學(xué)院院士、開(kāi)放科學(xué)促進(jìn)聯(lián)合體理事長(zhǎng)何滿潮表示。
何滿潮詳細(xì)講述了AI在他熟知的工程巖體力學(xué)研究中發(fā)揮的作用,指出人工智能技術(shù)在出版業(yè)的應(yīng)用也在不斷深入,并且這一趨勢(shì)正在重塑傳統(tǒng)的出版流程和內(nèi)容創(chuàng)作方式。
在如今知識(shí)爆炸的時(shí)代,短時(shí)間內(nèi)想要了解海量的信息和最新研究成果幾乎不可能,而要在此基礎(chǔ)上對(duì)信息加以分析并寫(xiě)出比較全面的書(shū)籍更是難上加難,所以何滿潮認(rèn)為,用AI技術(shù)幫助寫(xiě)書(shū)將是出版領(lǐng)域一個(gè)重大的應(yīng)用場(chǎng)景。
在何滿潮看來(lái),AI技術(shù)是一個(gè)非常好的幫手,可以幫助科學(xué)家節(jié)省更多的時(shí)間進(jìn)行更高效的工作,把精力集中在更重要的研究工作中。目前,何滿潮所在的團(tuán)隊(duì)正在推進(jìn)與中國(guó)圖書(shū)進(jìn)出口(集團(tuán))有限公司、中圖科信數(shù)智技術(shù)(北京)有限公司以及施普林格·自然集團(tuán)的合作,預(yù)期通過(guò)AI技術(shù)合作出版巖石力學(xué)相關(guān)圖書(shū)。
知識(shí)產(chǎn)權(quán)出版社目前擁有數(shù)據(jù)種類(lèi)539種,涉及專(zhuān)利、商標(biāo)、版權(quán)、標(biāo)準(zhǔn)、知識(shí)產(chǎn)權(quán)相關(guān)圖書(shū)、相關(guān)案例裁判等,容量多達(dá)420TB,優(yōu)質(zhì)且堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)為該社跨越式發(fā)展提供了得天獨(dú)厚的條件。
據(jù)知識(shí)產(chǎn)權(quán)出版社副總編輯劉新民介紹,他們結(jié)合本社知識(shí)產(chǎn)權(quán)大數(shù)據(jù),采用智能算法模型,構(gòu)建了知識(shí)產(chǎn)權(quán)評(píng)估體系,為知識(shí)產(chǎn)權(quán)價(jià)值進(jìn)行科學(xué)評(píng)估。“這個(gè)系統(tǒng)不僅可以評(píng)估一項(xiàng)技術(shù),而且可以延伸評(píng)估一個(gè)企業(yè)或者一個(gè)團(tuán)隊(duì)的創(chuàng)新能力和創(chuàng)新水平,從而為科學(xué)決策提供依據(jù)。”
通過(guò)該系統(tǒng),知識(shí)產(chǎn)權(quán)出版社為2023中國(guó)·海淀高價(jià)值專(zhuān)利培育大賽篩選了70余個(gè)項(xiàng)目,對(duì)接資本上億元,促進(jìn)了先進(jìn)技術(shù)產(chǎn)業(yè)落地。而這只是應(yīng)用場(chǎng)景之一。目前,在國(guó)內(nèi)知識(shí)產(chǎn)權(quán)金融及創(chuàng)新創(chuàng)業(yè)大賽中,該系統(tǒng)得到了廣泛應(yīng)用。
今年4月,知識(shí)產(chǎn)權(quán)出版社發(fā)布旗艦產(chǎn)品——中知慧海知識(shí)產(chǎn)權(quán)大數(shù)據(jù)與智慧服務(wù)系統(tǒng)。據(jù)介紹,該系統(tǒng)是利用AI技術(shù)的集大成者,能夠精準(zhǔn)理解用戶(hù)的查詢(xún)意圖,為用戶(hù)打造一個(gè)全方位的創(chuàng)新工作平臺(tái)。
愛(ài)思唯爾是一家有著400多年歷史的老牌出版商,擁有近3000種期刊,每年出版3萬(wàn)多種圖書(shū),2萬(wàn)多家客戶(hù)遍布全球。依托生成式人工智能技術(shù),今年以來(lái),愛(ài)思唯爾向市場(chǎng)推出了Scopus AI和ClinicalKey AI兩款產(chǎn)品,還有一款正在測(cè)試中。
愛(ài)思唯爾大中華區(qū)總裁李琳著重介紹了Scopus AI。“這是全球第一款生成式科研發(fā)現(xiàn)平臺(tái),它能夠幫助學(xué)生和科研人員提高在文獻(xiàn)精準(zhǔn)度方面的發(fā)現(xiàn)能力和概括能力。”
AI技術(shù)為出版賦能,給傳統(tǒng)出版業(yè)帶來(lái)巨變,也給讀者帶來(lái)數(shù)字閱讀新體驗(yàn)。在2024出版與技術(shù)創(chuàng)新大會(huì)上,華為終端云閱讀業(yè)務(wù)部部長(zhǎng)作為受邀嘉賓發(fā)聲,為人們了解數(shù)字閱讀的新動(dòng)向打開(kāi)了一扇窗。
AI技術(shù)代表著文化和科技前沿,而閱讀則相對(duì)傳統(tǒng)和經(jīng)典,當(dāng)AI遇上閱讀,兩者碰撞會(huì)產(chǎn)生怎樣的火花?
根據(jù)華為閱讀的實(shí)踐,“AI+閱讀”至少可以帶來(lái)三個(gè)維度的提升。第一,AI可以讓閱讀變得更加舒服。當(dāng)讀者閱讀時(shí),屏幕的色溫、字體、行間距、排版等,都會(huì)影響閱讀體驗(yàn),AI可以幫助提升舒適感。第二,AI可以讓讀書(shū)變得更加便捷。從紙質(zhì)書(shū)到電子書(shū),便捷性無(wú)疑有了大的提升,攜帶、檢索和閱讀都變得更加方便。在不久的將來(lái),甚至連翻書(shū)都可以省掉,在AI技術(shù)的加持下,直接用眼球就可以實(shí)現(xiàn)翻頁(yè)。第三,AI可以讓閱讀更有效率。如果原來(lái)看一本書(shū)需要1個(gè)月或者10天,通過(guò)AI的輔助,也許5天甚至5個(gè)小時(shí)就足夠了。

科技點(diǎn)亮生活。在華為閱讀App下載專(zhuān)區(qū)的評(píng)論里,有讀者對(duì)它贊賞有加。據(jù)稱(chēng),華為閱讀的字體和背景設(shè)置比另一款主流閱讀產(chǎn)品更加美觀,導(dǎo)入本地書(shū)籍時(shí),對(duì)文檔的章節(jié)劃分也更加準(zhǔn)確。顯然,這少不了AI的功勞。“目前,我們選了15種主題和12款字體。”通過(guò)大模型計(jì)算,AI幫助華為閱讀從近億用戶(hù)中找到讀者最喜歡的排版格式。在華為閱讀官網(wǎng)首頁(yè),有著這樣的描述:“多種詩(shī)意的國(guó)風(fēng)色調(diào)、多款自然主題背景可以隨意搭配,讓閱讀更有氛圍感……”
將手解放出來(lái),用眼球就可以實(shí)現(xiàn)翻頁(yè),這是華為閱讀的一項(xiàng)“黑科技”。據(jù)介紹,這項(xiàng)技術(shù)目前還未正式面市,但已經(jīng)在實(shí)驗(yàn)室里取得良好效果。如果讀者覺(jué)得翻頁(yè)過(guò)于麻煩,沒(méi)有關(guān)系,當(dāng)他們面對(duì)屏幕進(jìn)行閱讀時(shí),系統(tǒng)可以根據(jù)監(jiān)測(cè)到的眼球移動(dòng),判斷是否看完頁(yè)面,再幫助讀者翻頁(yè),“準(zhǔn)確度非常高”。
大大壓縮閱讀時(shí)間,這又是如何做到的?據(jù)介紹,AI摘要和關(guān)系圖譜是華為閱讀新開(kāi)發(fā)的功能,前者是AI基于語(yǔ)義判斷,把文章內(nèi)容做簡(jiǎn)短的提煉,后者是AI基于對(duì)一本書(shū)架構(gòu)的認(rèn)知,提煉出關(guān)系圖譜輔助讀者閱讀。使用AI摘要的典型場(chǎng)景有兩個(gè):一是讀者查閱學(xué)術(shù)類(lèi)書(shū)籍時(shí),AI摘要可以快速把學(xué)術(shù)類(lèi)書(shū)籍的概要提煉出來(lái),幫助讀者提升工作效率;二是當(dāng)讀者閱讀特別長(zhǎng)的網(wǎng)文時(shí),如果中間有些部分不想細(xì)看,為了保持內(nèi)容的連貫性,AI摘要可以把不想細(xì)看的那部分內(nèi)容濃縮成短文,節(jié)約讀者的閱讀時(shí)間。關(guān)系圖譜也是提升閱讀效率的有力抓手。比如《紅樓夢(mèng)》里的人物關(guān)系圖譜非常復(fù)雜,有了AI的幫助,讀者閱讀起來(lái)就可以更輕松。從目前實(shí)踐結(jié)果看,華為閱讀的關(guān)系圖譜準(zhǔn)確率已經(jīng)達(dá)到90%。
書(shū)籍架起溝通的橋梁,讓國(guó)與國(guó)之間的距離更加緊密。華為閱讀優(yōu)選全球超過(guò)220萬(wàn)冊(cè)圖書(shū)和精品有聲內(nèi)容,供讀者閱讀成長(zhǎng)。為了幫助讀者打破閱讀屏障,華為閱讀傾心推出一鍵翻譯功能,支持多達(dá)57種語(yǔ)言實(shí)時(shí)翻譯,目前在國(guó)內(nèi)所有閱讀App中位列第一。
盡管在世界范圍內(nèi)“AI+出版”取得了一定的創(chuàng)新成果,但二者的融合發(fā)展并非坦途。
挑戰(zhàn)無(wú)處不在。比如,建設(shè)高質(zhì)量學(xué)術(shù)數(shù)據(jù)語(yǔ)料庫(kù)是打造生成式人工智能的“壓艙石”,可高質(zhì)量學(xué)術(shù)數(shù)據(jù)語(yǔ)料庫(kù)從何而來(lái)?從數(shù)據(jù)到大模型訓(xùn)練,語(yǔ)料是重要的過(guò)渡。上海數(shù)據(jù)交易所總經(jīng)理湯奇峰表示,語(yǔ)料庫(kù)供應(yīng)方面存在重要挑戰(zhàn)。一些組織愿意公開(kāi)語(yǔ)料,但也有一些組織不愿意公開(kāi)。即使在愿意公開(kāi)的里面,也不是所有的質(zhì)量都達(dá)標(biāo),有的甚至沒(méi)有組織成語(yǔ)料。
“作為科研知識(shí)服務(wù)提供商,我們秉承的是可信賴(lài)的AI應(yīng)用原則,這是一個(gè)基石。我們要確保數(shù)據(jù)質(zhì)量是高質(zhì)量的。”
李琳說(shuō),整個(gè)生成式人工智能正在給出版界、知識(shí)服務(wù)界和科技界帶來(lái)很多驚喜,當(dāng)然也可能會(huì)帶來(lái)一些潛在的挑戰(zhàn)。作為從業(yè)者,對(duì)于新的技術(shù)和工具,她認(rèn)為應(yīng)該開(kāi)放地?fù)肀В粩鄧L試,這樣才能把產(chǎn)品和服務(wù)做得更好。
李琳強(qiáng)調(diào),愛(ài)思唯爾只是科研共同體的一部分,整個(gè)學(xué)術(shù)知識(shí)的產(chǎn)生和出版其實(shí)是一個(gè)共創(chuàng)的過(guò)程,不管期刊的編輯、主編還是評(píng)審人,都只是整個(gè)生態(tài)當(dāng)中的一環(huán)。所以,面對(duì)這個(gè)創(chuàng)新的時(shí)代,需要繼續(xù)秉承合作共創(chuàng)的模式。愛(ài)思唯爾致力于成為一個(gè)更加開(kāi)放的平臺(tái),將引入更多第三方出版社的內(nèi)容,更好地為科研人員服務(wù)。
本屆圖博會(huì)的主題為“5XcOzwWE6SjQD+lllIcxjzQyy4qGGPYfpH7DA9VMb8k=深化文明互鑒,合作共贏未來(lái)”,一共有22萬(wàn)種中外圖書(shū)亮相博覽會(huì)。合作也是此次出版與技術(shù)創(chuàng)新大會(huì)的關(guān)鍵詞。北京印刷學(xué)院副院長(zhǎng)陳丹說(shuō),學(xué)院與國(guó)內(nèi)一些高校和科研院所建立了合作關(guān)系,希望形成一個(gè)學(xué)術(shù)共同體,共同推進(jìn)學(xué)術(shù)數(shù)據(jù)的開(kāi)發(fā)和利用;德國(guó)出版公司德古意特博睿首席商務(wù)官Ben Ashcroft表示,他們與全球各地的50家出版商合作,包括知名的美國(guó)大學(xué)出版社,一邊幫助他們把作品帶到中國(guó),一邊幫助中國(guó)研究者把研究成果發(fā)表在國(guó)外期刊上;大會(huì)舉辦方代表、第十四屆全國(guó)政協(xié)委員、中國(guó)圖書(shū)進(jìn)出口(集團(tuán))有限公司總經(jīng)理林麗穎強(qiáng)調(diào),作為連接出版上下游的中盤(pán)商和中外溝通橋梁的兩個(gè)特殊角色,公司能夠與不同類(lèi)型的合作伙伴在學(xué)術(shù)服務(wù)的應(yīng)用場(chǎng)景、跨境數(shù)據(jù)交易、智能閱讀、AI知識(shí)服務(wù)等不同維度進(jìn)行合作……
5年前,著名學(xué)術(shù)出版商施普林格·自然集團(tuán)出版了第一本由機(jī)器學(xué)習(xí)生成的書(shū)籍——《鋰離子電池:機(jī)器生成的當(dāng)前研究摘要》。5年后的今天,大會(huì)期間,施普林格·自然集團(tuán)宣布將在中國(guó)啟動(dòng)“Artificial Pen Project”AI生成式寫(xiě)書(shū)計(jì)劃。而它的合作伙伴,中圖科信數(shù)智技術(shù)(北京)有限公司則發(fā)布了“思瓜”LUFFAAI——一款為科研人員量身定制的自主訓(xùn)練大模型,預(yù)示著個(gè)性化知識(shí)服務(wù)的時(shí)代將加速到來(lái)。