999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

AI拯救冰島語

2023-11-16 14:19:30仇廣宇
青年文摘 2023年13期
關鍵詞:數據庫人工智能語言

仇廣宇

你知道是什么意思嗎?它是冰島語中的一個詞,描述的是一天中一個特殊時刻,在這個朦朧的黎明時分,大自然的光線,剛好讓人們能夠看清楚羊群。

用一個簡單的詞匯傳達出詩意和美感,正是冰島語的特色。但近百年來,這門精美的語言曾數次面臨滅絕危機。隨著全球化和高新科技的發展,只有三十幾萬人使用的冰島語,在現實里受到英語等強勢語言的威脅,在網絡空間里也沒有太多展示的空間。

不過,冰島人從未放棄為母語的生存而努力,這種努力甚至強大到將冰島語的命運反轉了過來。2023年3月15日,美國人工智能研究公司OpenAI發布最新的人工智能系統——GPT-4,并公布了一些正在使用GPT模型的案例。通過這些案例,人們發現,冰島政府正在訓練GPT模型學習冰島語。目前,GPT-4已經可以具備邏輯地用冰島語回答問題,并學會書寫冰島語的詩歌了。

這件事,讓人工智能在人們眼中多了一層善良、溫柔的色彩,人們發現它不只會搶走人類的飯碗,也能在恰當的利用之下,做一些保護傳統文化的有益工作。不過,說到底,這件事還是倔強的冰島人促成的。

科技背景下的語言危機

冰島語在十幾年前就遭遇過一次滅絕危機。2012年,一份名為《歐洲語言平等》的報告顯示,有超過20種語言可能在網絡世界中滅絕,其中,冰島語名列第二,僅次于馬耳他語。

這種危機是科技革命給小眾語言帶來的生存困境。十多年前,智能手機開始普及,之后,智能語音系統也開始伴隨智能音箱等產品進駐千家萬戶。在使用電子產品時,人們必須使用某種語言去和機器對話。但是,冰島人發現,當他們在自己家里使用這些設備時,其中并沒有冰島語的選項。當然,大部分冰島人是精通多語種的,他們可以改用英語、挪威語、丹麥語,也不會有太大問題,但這種不能在自己家里使用母語的局面,實在有些荒唐。

從那時起,冰島人就開始思考解決冰島語在數碼世界可能消失的問題。首先站出來的是一位技術從業人員——特勞斯蒂·克里斯蒂安松。克里斯蒂安松的父親編纂過冰島語詞典,他對本民族語言有著濃烈的情感。2012年,在谷歌公司任職的克里斯蒂安松,強烈要求把冰島語加入谷歌語音的備選語言中。

這個提議最初被谷歌否決了。原因是,要想在語音系統里加入冰島語,首先需要為它建立數據庫,而為越小眾的語言建立數據庫,所支出的成本就會越多。為了收集語言材料,公司要花費額外的人力物力,這樣做對一家企業而言很不劃算。為此,克里斯蒂安松只好與一位冰島學者展開合作,通過手機收集了冰島人朗讀的數百萬個句子。最終,以此為語料基礎,谷歌建立了互聯網上第一個完整的冰島語語料庫。如今,谷歌翻譯里的冰島語翻譯選項,也是以這個數據庫為基礎制作的。

之后,冰島官員也開始行動。冰島文化和商務部部長莉莉婭·阿弗萊德多蒂爾曾在2021年寫信給迪士尼,希望對方為網絡播放的電影添加冰島語字幕和配音,迪士尼答應了。2022年4月,冰島總統古德尼·約翰內松親自帶著團隊訪問了OpenAI,并最終促成了該公司與冰島的合作。

高新科技如何保護小眾語言

當人工智能學會了一門語言,就相當于這門語言有了一個永不停歇、不斷進化的“傳人”,那么,它滅絕的風險就大大降低了。聽起來很簡單,但背后有不少困難需要解決。

以中文為例。首先,如果語言材料本身的內容不豐富,量不夠大或者質量不夠高,都會令機器的學習效果大打折扣。比如,中文出版物大概只占全人類語料庫的5%,而英文出版物可以占到60%,這樣的話,機器學習英語的效果自然更好。其次,如果某一門語言的獨特性過強,也會妨礙機器對它的學習。比如,中文不屬于表音文字,是表意的,其一個詞語可能有很多重含義,此外,中文的詞和詞之間沒有空格,機器對這種一長串字符組成的句子并不能很好地理解。這也增加了機器識別的難度。

用這幾個條件比照,冰島語也面臨著類似的困境。由于使用人數、語言資料都比較少,因此用冰島語書寫的互聯網資源更是少得可憐。其次,冰島語雖然屬于表音的語言,但有大量長度極長、中間不會空格的復合詞,這些單詞也容易讓機器“讀不懂”。

為了訓練人工智能說冰島語,冰島方面花費四五年時間,調集60多名專家和數家冰島科技公司共同參與了這一過程。比如,有家公司建設了一個網站,呼吁所有會說冰島語的人都把自己說話的錄音傳上去,為語料庫做一份貢獻。冰島前總統維格迪絲·芬博阿多蒂爾也帶頭親自在數據庫里錄下了她的聲音。

還有一家公司組建了40人的團隊,專門訓練GPT-4回答冰島語問題。工作人員每天給GPT-4留一些冰島語“作業”,他們負責收集答案并進行評估。若發現機器的回答不準確,再教它改進,如此循環往復。在GPT-4的上一代模型——GPT-3.5所輸出的答案里,還會混有英語或其他北歐語言的單詞,但是很快,GPT-4就能給出純冰島語的答案了,而且日益準確。

在最新公布的2023年版《歐洲語言平等》報告中,冰島人為本民族語言留存所做的一切努力都得到了高度贊揚,盡管冰島語依然有著滅絕的風險,但這個趨勢是在不斷減小的。這也正如阿弗萊德多蒂爾所感慨的:作為一個小國,只要做足了功課,我們依然可以很好地保護我們的語言。

(摘自《中國新聞周刊》2023年第15期,本刊有刪節,一刀圖)

猜你喜歡
數據庫人工智能語言
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
讓語言描寫搖曳多姿
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
數據庫
財經(2017年2期)2017-03-10 14:35:35
累積動態分析下的同聲傳譯語言壓縮
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 国产欧美在线| 欧美久久网| 日韩第九页| 日本不卡在线| 婷婷色婷婷| 亚洲黄网在线| 99尹人香蕉国产免费天天拍| 久久a毛片| 国产成人a毛片在线| 欧美无专区| 国产精品漂亮美女在线观看| 伊人久久精品无码麻豆精品| 亚洲成人黄色在线观看| 日本亚洲国产一区二区三区| 日韩色图在线观看| 夜夜操国产| 成人免费午夜视频| 无码国内精品人妻少妇蜜桃视频| 四虎在线高清无码| 亚洲无码视频喷水| 国产精品浪潮Av| 免费人成网站在线观看欧美| 国产精品视频猛进猛出| 免费 国产 无码久久久| a毛片在线免费观看| 国产精品男人的天堂| 久久这里只有精品2| 一级毛片免费观看不卡视频| 日韩欧美一区在线观看| 亚洲日本在线免费观看| 美女一级免费毛片| 92精品国产自产在线观看| 香蕉综合在线视频91| 午夜福利视频一区| 欧美一区二区三区不卡免费| igao国产精品| 国产精品分类视频分类一区| 日本国产精品| 99久久精品免费看国产电影| 亚洲一道AV无码午夜福利| 国产人碰人摸人爱免费视频| 中文国产成人精品久久| 亚洲女同一区二区| 国产精品免费久久久久影院无码| 丁香综合在线| 日韩123欧美字幕| 激情无码视频在线看| 久久国产精品影院| 日韩天堂在线观看| 国产精品人人做人人爽人人添| 日本精品影院| 久久99国产精品成人欧美| 福利一区三区| 亚洲成人网在线观看| 999在线免费视频| 一区二区午夜| 国产69囗曝护士吞精在线视频| 18禁高潮出水呻吟娇喘蜜芽| 国产日本一线在线观看免费| 国产拍在线| 久久99久久无码毛片一区二区| av手机版在线播放| 久久久久久高潮白浆| 日韩免费毛片| 欧美色亚洲| 亚洲人成成无码网WWW| 亚洲色图欧美在线| 在线中文字幕日韩| 国产人成网线在线播放va| 亚洲精品色AV无码看| 国产精品hd在线播放| 538精品在线观看| 99久久免费精品特色大片| 在线观看热码亚洲av每日更新| 伊在人亞洲香蕉精品區| 真实国产精品vr专区| 国产美女无遮挡免费视频网站 | 中文字幕资源站| 日韩不卡高清视频| 97国产在线播放| 五月天久久婷婷| 日韩小视频网站hq|