劉宇陽
8月8日21時19分,四川九寨溝縣發生7.0級地震。21時57分15秒中國地震臺網機器人自動編寫稿件,僅用25秒出稿,540字并配發4張圖片。內容包括速報參數、震中地形、熱力人口、周邊村鎮、周邊縣區、歷史地震、震中簡介、震中天氣八大項。25秒能做什么?當人類記者還處在驚愕中時,機器人已經迅速完成了數據挖掘、數據分析、自動寫稿的全過程。
寫稿機器人正是一種人工智能。它用機器代替人完成實時監控信息源,利用文本解析和信息抽取技術實現自動信息抽取,采用機器學習算法并融合編輯記者團隊的經驗和智慧,以模板和規則知識庫的方式,根據實時抽取的信息作出判斷,輸出相應的模板及規則知識庫內容,從而產生新聞,以此應對海量、高速、多樣的大數據產生的信息。
1956年夏,以麥卡賽、明斯基、羅切斯特和申農等為首的一批有遠見卓識的年輕科學家在一起聚會,共同研究和探討用機器模擬智能的一系列有關問題,并首次提出了“人工智能”這一術語,它標志著“人工智能”這門新興學科的正式誕生。人工智能,簡稱AI,是研究使計算機來模擬人的某些思維過程和智能行為的學科,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理等。人工智能與基因工程、納米科學被稱為二十一世紀的三大尖端技術,幾十年來,它的迅猛發展使得很多應用它的領域都取得了令人刮目相看的成績。人工智能本身無論在理論和實踐上都已自成一個系統,逐步成為一個獨立的學科分支。
目前,人工智能的應用已經非常廣泛,各大新聞客戶端會根據你的閱讀興趣推送相關新聞、各大電商平臺會根據你的購買習慣推送相關商品、幾乎所有你瀏覽的網頁所呈現的廣告都與你的歷史搜索相關……這些都可以稱得上是人工智能。而且,與過去60年人工智能的發展主要集中在實驗室里不同,新一輪的人工智能已經在諸多應用場景中發揮威力,應該說,新一輪的人工智能浪潮才剛剛開始。從大數據到云計算到人工智能已經具備了相對堅實的基礎。其中,大數據稱得上是人工智能賴以開展的生產資料,而云計算則是人工智能發展的生產工具。不過,從當下人工智能的發展現狀看,大部分的人工智能還停留在大數據分析階段,距離真正的人工智能還有一定的距離。人工智能時代已經起航,“加速前進”的人工智能會否是新一輪產業革命的推動力?其標準又是什么?在這次技術變革中,新聞出版業是否可能實現彎道超車?這些,都是人工智能浪潮留給我們的思考維度。
人工智能的技術應用有哪些?
隨著大數據、物聯網、人工智能、虛擬現實等新技術、新產業不斷涌現,特別是實體經濟與信息技術加速融合,持續催生出新的增長點?;ヂ摼W發展進入了創新加速、智能轉型等新階段。隨著各項技術的突破,人工智能各項應用應運而生。近年來,世界各國如美國、英國、日本、俄羅斯等紛紛制定了人工智能國家發展計劃,我國相繼出臺了《“互聯網+”人工智能三年行動實施方案》《中國制造2025》《新一代人工智能發展規劃》等,建立一級人工智能學科的呼聲一浪高過一浪、此起彼伏。
1.計算機視覺
計算機視覺是機器認知世界的基礎,也是最主要的人工智能技術之一。2016年,Alpha Go戰勝韓國圍棋選手李世乭再次引爆了全球對于人工智能的討論和關注。計算機視覺受到深度學習的成功影響在近幾年內取得了突破性的進展,正在成為影響行業發展的下一個引擎。巨頭紛紛布局,市場也吸引了越來越多的創業人才參與其中。計算機視覺正在成為人工智能最火熱的細分領域之一。
人類認識了解世界的信息中91%來自視覺,同樣計算機視覺成為機器認知世界的基礎,終極目的是使得計算機能夠像人一樣“看懂世界”。目前計算機視覺主要應用在人臉識別、圖像識別方面(包括靜態、動態兩類信息)。
2.語音識別
在人工智能快速發展的今天,語音識別開始成為很多設備的標配,語音識別開始被越來越多的人關注,國外微軟、蘋果、谷歌、nuance,國內的科大訊飛、思必馳等廠商都在研發語音識別新策略新算法,似乎人類與語音的自然交互漸行漸近。
我們都希望像《鋼鐵俠》中那樣智能先進的語音助手,在與機器人進行語音交流時,讓它聽明白你在說什么。語音識別技術將人類這一曾經的夢想變成了現實。語音識別就好比“機器的聽覺系統”,該技術讓機器通過識別和理解,把語音信號轉變為相應的文本或命令。
語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述的語言。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術。語音識別是一門涉及面很廣的交叉學科,它與聲學、語音學、語言學、信息理論、模式識別理論以及神經生物學等學科都有非常密切的關系。語音識別技術正逐步成為計算機信息處理技術中的關鍵技術,語音技術的應用已經成為一個具有競爭性的新興高技術產業。
3.自然語言處理
人工智能技術的演進可以概括為三個層次:感知智能、認知智能、通用智能。目前AI技術正從感知邁入認知階段。而感知智能是指將物理世界的信號通過攝像頭、麥克風或者其他傳感器的硬件設備,借助語音識別、圖像識別等前沿技術,映射到數字世界,再將這些數字信息進一步提升至可認知的層次,比如記憶、理解、規劃、決策,等等。而在這個過程中,人機界面的交互至關重要。
丟一塊石頭到水里會發生什么?人工智能可以戰勝圍棋大師,卻會被這樣的簡單問題難倒——對自然語言的處理仍是一個待解難題。語言智能是人工智能“皇冠上的明珠”,如果語言智能實現突破,跟它同屬認知智能的知識和推理就會得到長足發展,進而推動整個人工智能體系的進步。自然語言是不精確的,字面背后還有太多意思,這也是為什么自然語言處理如此困難的原因。自然語言處理若想突破,需要做出范式上的改變。
4.機器人
機器人早在人工智能一詞出現之前就已存在,但那時的機器人,大多都是沒有認知能力的,只是在功能上簡單模仿人,給人的印象很“死板”?,F如今,人工智能賦予機器人語義、認知、理解等能力,給機器人帶來了無限可能。endprint
人工智能把外界輸入的信息向概念邏輯信息轉譯,將動態和靜態的圖像、文字、聲音等信息轉為形式化的概念邏輯信息,實現信息的識別轉換;人工智能對接收的信息進行不斷的自我學習、深度檢索、邏輯判斷,達到深度學習,下次遇到這種問題可以直接做出相對應的智能反應,加快處理速度和智能應對,實現數據的智能運算;人工智能通過算法和運算對實體進行控制……所以,在人工智能的大環境下,勢必會引領機器人從“呆板”向“智能”轉變,將會賦予機器人語義、視覺、聽覺等能力,將機器智能與人工智能結合,成為真正意義上的人工智能機器人。
5.機器學習
機器學習是人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演繹。是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。寫稿機器人是當下機器學習的最亮眼的實現形式之一,在新聞出版領域發揮著重要作用。
世界各國紛紛制定人工智能國家發展計劃
人工智能機器人應用前景廣闊、用途多樣,逐步滲透到數字新聞領域,采訪智能機器人走進直播間、電視頻道、媒體網站,寫稿機器人融進小說家家族、編輯行業,帶來了媒體資源的重新洗牌,逐步迎來了數字新聞報道人機有機結合智能化新時代。
1.人工智能已經上升到國家戰略,中國多部委聯合推動
近年來,多個國家部委頒布文件從政策上大力支持人工智能發展,給業界帶來諸多期待。特別是新聞出版業,有望在人工智能的幫助下實現跨越式發展。
2016年5月18日,國家發改委、科技部、工信部、中央網信辦發布了《“互聯網+”人工智能三年行動實施方案》。該方案提出到2018年,將打造出人工智能基礎資源與創新平臺,并基本建立人工智能產業體系、創新服務體系、標準化體系;在重點領域將培育若干全球領先的人工智能骨干企業,初步建成基礎堅實、創新活躍、開放協作、綠色安全的人工智能產業生態,形成千億級的人工智能市場應用規模。
2016年7月28日國務院印發《關于“十三五”國家科技創新規劃的通知》?!锻ㄖ穼θ斯ぶ悄艿陌l展也提出了新的展望。建立重大項目動態調整機制,綜合把握國際科技前沿趨勢和國家經濟社會發展緊迫需求,在人工智能等方面遴選重大任務,適時充實完善重大項目布局。重點發展大數據驅動的類人智能技術方法;突破以人為中心的人機物融合理論方法和關鍵技術,研制相關設備、工具和平臺;在基于大數據分析的類人智能方向取得重要突破,實現類人視覺、類人聽覺、類人語言和類人思維,支撐智能產業的發展。
2017年7月20日,《國務院關于印發新一代人工智能發展規劃的通知》發布。該規劃提出了中國人工智能三步走的概念,定下了詳細的時間表和路線圖。第一步,到2020年人工智能總體技術和應用與世界先進水平同步。初步建成人工智能技術標準、服務體系和產業生態鏈,培育若干全球領先的人工智能骨干企業,人工智能核心產業規模超過1500億元,帶動相關產業規模超過1萬億元。第二步,到2025年人工智能基礎理論實現重大突破。新一代人工智能在智能制造、智能醫療、智慧城市、智能農業、國防建設等領域得到廣泛應用,人工智能核心產業規模超過4000億元,帶動相關產業規模超過5萬億元。第三步,到2030年人工智能理論、技術與應用總體達到世界領先水平,人工智能核心產業規模超過1萬億元,帶動相關產業規模超過10萬億元。
2.美國國家人工智能發展與研究戰略計劃為人工智能的未來做好準備
中國人口基數大,移動互聯網發展迅速,有龐大的數據資源優勢。另外商業化應用場景豐富,在人工智能應用領域將出現更多突破。但在基礎算法和理論研究方面,與早于中國布局人工智能的美國還有差距。美國國家人工智能發展與研究戰略計劃于2016年10月13日公布,該報告由美國國家科學委員會下屬的機器學習與人工智能分委員會指定的人工智能研究組制定,其目的在于向整個國家提供一個跨部門的指導人工智能發展的戰略導向。同時,美國總統行政辦公室和科學技術委員會也同步發布了另一份報告《為人工智能的未來做好準備》,更多的從政府與治理的角度探討人工智能的挑戰與政府治理問題。這份報告包括簡言、公共物品與人工智能、人工智能在聯邦政府的應用、人工智能與管制、人工智能與安全等主題。
人工智能給新聞出版業帶來什么?
近年來,新聞出版業產業融合穩步推進,數字出版產業持續升溫,人工智能技術成為業內大熱門。人工智能將在新聞出版產業的融合發展中扮演什么樣的角色引發了業界的持續關注。剛剛結束的2017中國互聯網大會上,工業和信息化部部長苗圩表示將加強對關鍵核心技術攻關突破,加快人工智能、虛擬現實等技術的研發和商用。他還表示,將推動互聯網與其他產業跨界融合創新,加快構建普惠性、精準性創新支持政策體系,打造以市場服務為紐帶、以價值鏈共創為基礎的市場化運行機制。隨著各項技術的突破,人工智能各項應用應運而生。直面智能時代的挑戰,如何實現人機結合,是每一位數字新聞工作者亟待思考的問題。
1.通過數據找選題更容易
出版在整個經營和內容生產中將面對很多的數據,比如在經營中,圖書信息、作者信息、銷量信息、評價信息、讀者信息,以及用戶行為信息等,都可以通過大數據幫助出版單位進行選題營銷決策。
北大方正電子有限公司副總裁劉長明曾表示,人工智能意味著一場數據的革命。當前發展時期,新聞出版領域內的人工智能在算法層面已經取得重大突破,高質量且完善的數據資源集成為急需補充的稀缺資源。具體到出版而言,他認為通過數據服務,能幫助編輯進行更有效的選題策劃。
大數據還可以重塑內容分發機制,基于大數據的智能分發和個性化推薦,可以做到千人千面,或者每個人都可以享有自己關注的內容。圍繞出版大數據解決方案,可以滿足選題的優化,通過數據的分析和挖掘,在內容出版的發行和精準營銷上也能起到很好的支撐作用。方正目前已經構建了自己的大數據中心,為五六十家傳媒單位提供服務,他們也希望在出版領域,面向圖書的營銷、選題策劃以及內容的分發方面,提供相應的服務。endprint
2.內容定制實現高品質閱讀
在內容生產階段,人工智能能夠協助作家進行資料分析與用戶研究,協助作者進行創作,甚至進行機器創作。在內容傳播階段,人工智能能夠通過海量的數據分析,為用戶提供個性化的推薦與解決方案。在內容消費階段,以業務為載體,人工智能融合全息投影、語音閱讀、人工智能體驗等技術,全面提升閱讀展現形式和內容呈現模式。
中國移動咪咕數字傳媒有限公司總經理張燕鵬認為,人工智能時代里,數字閱讀將迎來一場全新的創新變革?!拔磥淼拈喿x會根據用戶的個體差別以及個人喜好進行內容的定制,實現高品質的閱讀享受?!睆堁帙i說,咪咕閱讀目前就已經能夠實現多場景、多角色的智能配音,并對人的語言進行模仿。“不同的用戶還可以選擇自己所喜歡的語音語調,讓1000個讀者讀出1000個哈姆雷特。”他認為,通過人工智能,借助全息成像、增強現實等技術,將來可全方面實現故事情節的全息投影與全新閱讀,為讀者帶來全新的閱聽感受。
3.人工智能將重塑出版流程
人工智能對新聞出版業的影響是深遠的,在它慢慢對整個產業滲透的進程中,不光編輯、印刷、發行環節受其影響極大提升了工作效率,在數字出版、數據挖掘與加工等細分領域也得到了廣泛的推廣——人工智能從一定程度上對出版業的流程進行了重塑。語音識別、數字編輯、機器學習等技術成功再造了出版流程,在完善人機交互的流程中也極大地提升了用戶體驗。
龍源數字傳媒集團副董事長湯楊提到人工智能在出版領域的應用時曾表示:“過去的出版社編輯做一本書需要的時間很久,隨著人工智能技術對出版產業的滲透,編輯的工作效率會得到大幅度提升,可能只需要一天的時間就可以完成一本書的編輯?!蓖瑫r,人工智能在出版流程的再造方面也提供了很多可能,比如語音錄入、機器協助校稿、機器寫作;在增強用戶交互體驗方面,很多機器在出版行業也得到逐步應用。
以編輯圖書為例,龍源旗下有一個人工智能平臺“知識樹”,當編輯定義了一部分內容以后,系統會自動幫他組成剩下的內容。同時,“知識樹”利用龍源背后數千萬篇文章的積累,能夠讓舊的內容煥發出新的活力。最為關鍵的是,龍源已經獲得了這些文章的授權。在“知識樹”的幫助下,編輯可以用一個半小時編輯一本書,再用一天時間去發行。湯楊介紹,目前龍源已經與亞馬遜、當當、京東進行了對接,并且這些內容可以輸出到現在數字出版幾乎所有的分發渠道,比如今日頭條等,流量在哪里,內容就可以被輸出到哪里。
理性看待人工智能的局限
人工智能發展歷史上有過兩次發展瓶頸。第一次泡沫破滅是因為人們發現當時的智能系統如邏輯證明器、感知器、增強學習等,只能做很簡單、非常專門且很窄的任務,稍微超出范圍就無法應對,這讓智能系統不足以解決任何實際的問題。第二次泡沫破滅也是因為專家系統所能解決的問題非常局限,遠遠無法達到人們的期待。目前看來,人工智能離取代人類還有很長的路要走,人機協作是必然趨勢。
1.人才、數據、計算平臺是當前制約人工智能發展的三大因素
人才是發展的第一資源。在新聞出版傳媒領域,人工智能時代帶來的一系列創新應用,給新聞出版的生產、編輯、模式帶來了全方位的變革,對人才需求提出了更高的要求。人工智能對人才的要求程度較高,特別是新聞出版業,需要對技術、出版流程、商業有著深刻的理解;當下國內外頂尖企業都在不惜代價招攬人工智能人才,說明人才的稀缺性和珍貴性;人才的缺乏將制約人工智能的發展。
數據是人工智能的基礎。對新聞出版行業而言,只要掌握了自己領域所針對的龐大數據資源集,就能成為出版企業轉型升級的重要競爭力。特別是對傳統出版單位而言,數據的來源比新媒體和高新技術企業在多樣性上已經落后。人工智能的發展需要大量的數據,進行不斷的驗證和優化,這些數據涵蓋了社會的各個層面;傳統出版單位由于行業、企業等特性,目前雖然已經積累了大量的數據,但數據仍舊存儲在不同的服務器中,難以得到共享及優化。
計算能力決定人工智能的發展進程。當前市場對現有的芯片和算法提出了新的需求。人工智能對計算能力的需求以及計算成本,導致行業巨頭成為主角;計算能力的提升以及成本下降才能吸引更多參與者。人們對人工智能的最大期待是不斷提升系統的智能水平,讓智能系統逐步拓展能夠處理的問題范圍,最終實現通用人工智能系統,解決幾乎所有領域問題。但由于算法等一系列原因,現實的系統尚無法達到人們所想象的智能水平。
2.人工智能尚不能完全取代傳統新聞出版人的工作
北京師范大學教授喻國明談到人工智能的發展與傳媒格局變化的邏輯時曾講到:“現階段人工智能發展的關鍵問題是人和機器如何在人機對話中實現功能的互補和價值的匹配。人工智能的特長在于,對于海量的資訊素材在規格化、模式化的處理,在數據方程和自學習能力可以達及的功能邏輯上,能夠顯出極高的效率和精準的處理。但是,在大跨度的復雜變量的處理和判斷方面、在微妙情感關系的處理和表達方面,尤其是在價值規則的制定和參照框架的選擇方面,人的智能和介入不可或缺。因此,這便是未來媒體人的價值和核心競爭力之所在。”
與慢慢滲透傳統出版流程的人工智能出版相比,傳統出版人和新聞人最大價值在于對事實的判斷以及對復雜邏輯關系的推理,這是作為一個出版人和新聞人本身創造性的體現,也是人工智能所暫時不具備的能力?,F階段,新聞出版業的人工智能主要應用在一般新聞采寫和數據分析,還不太可能完全取代編輯的工作,它們只是為了將出版人從單調、重復的工作中解放出來,去關注那些更加復雜,更加需要人類思考的東西,同時也能降低工作的時間成本。這也意味著,具有經驗和思想的傳統出版人對于整個新聞行業仍然起到支撐的作用。
3.具有人性境界的深度作品需要傳統出版人
出版人要依靠科技的力量,但不能成為科技的奴隸?,F階段,人工智能在新聞出版領域完成的工作多數是數據的分析和應用,人工智能技術還很難應對具有顯著人類主觀意識影響的社會文化和意識領域的各類問題,缺乏打動人的、有情感的細節。復雜、跨界、有深度的、情感的表達更為細膩的出版生產流程仍然需要傳統出版人。此外,質疑、追問、尋找出版流程中的線索和靈感,也是傳統出版人法寶。
具有創新能力的出版人將成為人工智能時代的強者。人工智能出版的出現,其實為傳統出版人提供了更上一層樓的動力和機遇。對于每一個出版人來說,只有更深入地了解出版行業以及人類獲得信息渠道、人類思考方式的本質,加深人工智能領域的人文探索,才能使人工智能更好地為我們所用。
在智媒體時代,能夠生產優質的、深度的、有觀點、有分析的作品的出版人更加珍貴。人機協作是必然趨勢。未來的出版物背后也許都會站著一個人類編輯和一個虛擬編輯,透過不同的視角看世界。endprint