摘 要:討論了面向北京奧運(yùn)的多語語料庫建設(shè)中的若干基礎(chǔ)問題。提出了面向事件、多領(lǐng)域融合的語料收集原則,制定了具有分類信息的標(biāo)注規(guī)范,初步建立了具有近七萬句對(duì)的可控多語語料庫。
關(guān)鍵詞:語料收集原則;標(biāo)注規(guī)范;可控多語語料庫
中圖法分類號(hào):TP391
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1001—3695(2005)11—0023—02
計(jì)算機(jī)應(yīng)用研究2005年11期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化》2024年2期
4《微型小說月報(bào)》2024年10期
5《工業(yè)微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業(yè)管理與科技》2024年6期
9《現(xiàn)代食品》2024年4期
10《衛(wèi)生職業(yè)教育》2024年10期
關(guān)于參考網(wǎng)