999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Xunzi the LLM—A Way for People to Access Ancient Chinese Texts大型語言模型“荀子” 讓人們接觸中國古籍

2024-11-06 00:00:00
時代英語·高一 2024年7期
關鍵詞:文本用戶語言

Thousands of years ago, texts appeared on animal bones, bronzes, bamboo slips, and silk brocades before they were written on paper. But now these ancient Chinese texts have a new container.

In December 2023, a research team from Nanjing Agricultural University has rolled out Xunzi, a large language model (LLM) and XunziChat in association with Gulian, a professional ancient Chinese text publisher.

Wang Dongbo, the leader of the research team, said that the large language model was named after Xunzi because Xunzi was not only a prominent Confucian philosopher during the late Warring States Period (475 BC—221 BC), but also a pioneer in presenting and explaining theories of linguistics in ancient China.

When asked why he and his partners made the large language model, Wang explained that traditional Chinese characters, vertical layout, and the absence of pausing and punctuation are all obstacles that readers have to overcome when they read traditional texts.

To create Xunzi the LLM, Wang and his partners first did a lot of research. Since 2013, his team has worked tirelessly to digitize Chinese classics like the Siku Quanshu, or the Complete Library in Four Sections. “The hard work involves a large-scale corpus of two billion Chinese characters, which has laid a solid foundation for the large language model,” said Wang.

幾千年前,文字先是寫在獸骨、青銅器、竹簡和織錦上,然后才被人們寫在紙上。但如今,這些古老的中文文本已經有了新載體。

2023年12月,南京農業大學的一個研究團隊,與一家專業的古籍出版公司古聯聯手,推出了大型語言模型荀子和荀子對話模型。

研究團隊帶頭人王東波表示,該大型語言模型以荀子的名字命名,是因為荀子不僅是戰國(公元前475年—公元前221年)晚期著名的儒學思想家,還是提出和解釋中國古代語言學理論的先驅者。

當被問及他和他的同伴創建這個大型語言模型的原因時,王東波解釋道:繁體字、豎版、缺少停頓和標點符號都是讀者在閱讀繁體文本時需要克服的障礙。

為了創建大型語言模型荀子,王東波和他的同伴們先做了大量的研究。自2013年以來,他的團隊始終致力于將《四庫全書》等中國經典書籍數字化。“經過辛勤努力,我們建立了20億個漢字的大型語料庫,為建立大型語言模型奠定了堅實的基礎。”王東波說。

But their efforts seem to have paid off. Now Xunzi the LLM can tag, translate, punctuate, and understand scraps of ancient Chinese texts. It can even do part-of-speech analysis and retrieve specific information, such as names, events, and places from a text.

With this LLM, ancient Chinese texts can be accessed by more Chinese people, including students. For instance, if users type shangu into the chat box, they will not only discover what it is translated to but also see that it can refer to a person’s courtesy name in certain ancient Chinese texts. Through Xunzi’s retrieval function, users can get more specific cultural information based on courtesy names.

“The model can help us mine for more information hidden in our cultural legacy and find unnoticed models and connections,” said Wang.

But Wang and his team aren’t simply focused on target users in China. They are aiming at the rest of the world as well. They have shared the LLM on GitHub and other websites, allowing users to download and use it for free. “Our team is committed to the philosophy of making our data and model globally accessible. We hope this will encourage more people to appreciate excellent traditional Chinese culture,” Wang explained.

他們的努力似乎得到了回報。現在,大型語言模型荀子可以對中國古代文本的片段進行標記、翻譯、加標點和閱讀理解。它甚至可以進行詞性分析并檢索特定信息,如文本中的名稱、事件和地點。

通過這個大型語言模型,包括學生在內的更多中國人,可以接觸到中國古籍。例如,如果用戶在聊天框中輸入shangu的拼音,它不僅能識別出山谷一詞,還會給用戶指出與這個詞相關的、古籍中一個中國文人的字等。通過荀子的檢索功能,用戶可以根據古人的字獲取更具體的文化信息。

“這個模型可以幫助我們挖掘更多隱藏在文化遺產中的信息,找到未被注意到的樣本和關聯。”王東波說。

然而,王東波和他的團隊不僅著眼于中國的目標用戶,還將目光投向了世界其他地區。他們在GitHub和其他網站上共享了荀子,允許用戶免費下載和使用。“我們團隊秉持著讓我們的數據和模型能在全球范圍內被人們使用的理念,希望以此鼓勵更多人了解中國優秀傳統文化。”王東波解釋道。

Word Bank

theory /'θ??ri/ n. 理論;原理

pause /p??z/ v. 暫停;停頓

The woman spoke almost without pausing for breath.

obstacle /'?bst?kl/ n. 障礙;阻礙

analysis /?'n?l?s?s/ n. (對事物的)分析

appreciate /?'pri??ie?t/ v. 欣賞;賞識

You can’t really appreciate foreign literature in translation.

猜你喜歡
文本用戶語言
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
讓語言描寫搖曳多姿
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
累積動態分析下的同聲傳譯語言壓縮
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
我有我語言
主站蜘蛛池模板: 国产欧美成人不卡视频| 91美女视频在线观看| 99久久性生片| 国产黑丝一区| 国产男人的天堂| 国产xxxxx免费视频| 亚洲成aⅴ人在线观看| 五月婷婷综合网| 伊人久久精品无码麻豆精品| 欧美成人日韩| 久久精品国产在热久久2019| 国产伦精品一区二区三区视频优播| 久久精品国产国语对白| 午夜福利免费视频| 青青青国产精品国产精品美女| 亚洲色婷婷一区二区| 国产精品第5页| 国产特级毛片aaaaaa| 国产91在线|日本| 视频一本大道香蕉久在线播放 | 天天躁夜夜躁狠狠躁图片| 亚洲精品福利网站| 国产中文一区a级毛片视频 | 久久免费成人| 国产一级小视频| 日韩无码黄色| AV天堂资源福利在线观看| 毛片最新网址| 久久成人18免费| 国产成熟女人性满足视频| 国产精品va免费视频| 在线观看欧美国产| a级毛片免费看| 国产91视频观看| 久久久久亚洲Av片无码观看| 国产青榴视频在线观看网站| 国产人成在线观看| 人禽伦免费交视频网页播放| 国产精品99久久久| 久久综合结合久久狠狠狠97色| 亚洲AV无码久久精品色欲| 亚洲日韩精品伊甸| h视频在线播放| 国产麻豆精品手机在线观看| 在线欧美国产| 思思99思思久久最新精品| 婷婷六月激情综合一区| 亚洲第一视频网| 成人日韩视频| 亚洲成人福利网站| 国产成人综合网| 国产精品人成在线播放| 日韩欧美中文字幕在线韩免费| 欧美午夜在线观看| 国产综合精品日本亚洲777| a毛片免费在线观看| 国产亚洲精品va在线| 原味小视频在线www国产| 国产精品福利尤物youwu| 亚洲天堂在线免费| 精品黑人一区二区三区| 亚洲欧美色中文字幕| 欧美日韩在线亚洲国产人| 色婷婷电影网| 国产精品成| 激情综合网激情综合| 伊人久久婷婷| 日韩在线播放中文字幕| 久久五月天国产自| 亚洲第七页| 国产亚洲欧美在线中文bt天堂| 午夜a视频| 成人免费网站在线观看| 亚洲欧美日韩中文字幕在线| 亚洲黄网视频| 久久精品一卡日本电影| 99久久国产综合精品2020| 国产精品视频观看裸模| 青青草国产精品久久久久| 亚洲欧美综合另类图片小说区| 美女一级毛片无遮挡内谢| 毛片网站观看|