999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

藏文屏幕取詞和翻譯關鍵技術

2019-11-30 02:24:03趙建平陳建新穆杰李永虎
電子技術與軟件工程 2019年7期
關鍵詞:進程詞匯系統

文/趙建平 陳建新 穆杰 李永虎

因為對新技術的一知半解,無形中強化了屏幕取詞的難度,很多人對屏幕取詞和翻譯技術望而卻步。但是隨著互聯網信息技術的發展普及,各種藏文網站、軟件產品和網頁等不斷涌現,在網絡信息的獲取中,我們隨時隨地都會瀏覽搜索到各種各樣的藏文網絡資源,在應用這些資源時,很可能遇到一些生僻的藏文詞語,因此藏文屏幕取詞和翻譯技術已成為近些年軟件開發的熱門項目。目前日臻成熟的中英文屏幕取詞和翻譯技術已經在生活中逐漸普及,給我們的生活帶來了實質性的幫助,以此為鑒開發藏文屏幕取詞和翻譯軟件技術,能優化用戶的閱讀效率,促進文化的發展與傳播。

1 屏幕取詞的實現原理

屏幕取詞與翻譯是基于Windows系統,而Windows的所有應用程序都是通過應用程序編程接口進行系統功能調用的,屏幕取詞相關的字符顯示程序也不例外。在Windows系統中,能通過Win32子系統中的gdi32.dll來截取系統對四個API函數的調用以進行屏幕取詞。所以,要實現屏幕取詞必須要注重兩個方面,其一是要截獲某個系統對Text等API函數的調用,通過自定義函數對目標函數進行內部調用,并將目標函數的結果作為自定義函數結果返還給目標進程。其二是需要分析截獲函數的入口參數等,得到要截取的詞。一般來說,為了截獲到目標函數,Win32操作系統都會保留2-4GB的地址空間由Win32的所有進程共享。

截獲系統要對API函數進行調用有兩種方式:

(1)直接改寫API函數的內存映像,在其中嵌入匯編代碼,使其調用時能調到指定的地址運用以便截獲;

(2)改寫輸入地址表(IAT),通過重新定向API函數的調用來截獲信息。總的來說只有打破進程邊界,在目標進程中輸入需截獲的API代碼,才能截獲API函數調用。

2 藏文屏幕取詞與翻譯核心內容

從屏幕取詞與翻譯的性能來看,其關鍵技術的核心內容包括兩個部分,即藏漢文詞典庫與藏文分詞信息。要對屏幕上選擇和截獲的詞語進行翻譯就需要查詢多語種詞典庫,經過查詢后的結果就是翻譯的最終結果。所以,為了實現多語種、多內容的翻譯,詞典庫的數據必須要包含學科術語、語言種類、語法詞匯信息、例句、讀音、詞性等基本需求,這些信息是否完善直接關系到屏幕取詞和翻譯系統的適用范圍和使用價值。因為是藏文屏幕取詞,所以相關詞典庫至少需要具備藏漢英三種語言,除了基本的詞匯表達外,還需要包括特殊詞匯、人名地名等相關信息。

在不同的上下文組合中,同一個詞匯會有不同的詞性和詞意,此時即便是通過屏幕截取了詞語,也不一定能準確判斷詞匯的詞性詞意。為了掌握詞匯的組合性與交集性,減少詞匯歧義的出現,就需要利用藏文自動分詞的方法對捕獲截取的文本做分詞,以確定目前截取詞匯的真實意義。一般來說,藏語詞匯由一個或多個音節組成,其詞語的序列構成了藏文的句子和語塊,但由于藏文格助詞的連續特征,如主格、屬格、于格通常與前詞緊密黏結,因此所有音節在按字預切分之時,還需對黏結詞的音節進行預切分。

3 屏幕取詞與翻譯關鍵技術應用

要完成對目標函數的尋找和修改,從而實現屏幕取詞與翻譯,就必須依賴于以下兩種技術的應用:

3.1 鉤子技術

Win32進程的私有空間地址只有0-2GB,且所有進程的地址空間都是相對獨立的,要實現屏幕取詞,就要利用鉤子技術打破進程邊界,突破空間獨立性。鉤子技術的本質是Win32系統中用于處理系統消息或者特定程序的函數,它能通過系統調用掛入到系統中。根據消息監管范圍的不同,鉤子技術能分為線程局部與系統全局鉤子兩類,線程局部只能監視本進程中的指定線程,全局鉤子的監視范圍可以擴展到當前系統運行的所有線程,而在藏文屏幕取詞中所用到的是系統鼠標鉤子。相比其他鉤子技術而言,鼠標鉤子需要提供一個位于動態鏈接庫中的鼠標鉤子回調函數,系統會在安裝完成后將這個動態鏈接庫加載到進程的私有空間內,這樣在每次移動鼠標的時候,系統就會調動輸掉鉤子來回調函數,當鼠標停留在屏幕某一處一定時間,就會自動截取鼠標所處位置的藏文。

3.2 PE文件格式技術

利用PE文件來截獲目標函數是常見的屏幕取詞技術之一,其主要內容包括Win32中的EXE和DLL文件。PE文件格式定義了多個數據結構,其應用范圍十分廣泛,包括文件保存代碼、數據、輸入輸出的函數等相關信息,而利用這些結構也能便于操作PE文件。前文提到截獲API函數調用的關鍵是修改輸入地址表,而PE文件中的.idata節就包含了相關的DLL數據及函數信息。利用PE文件修改輸入地址表以截獲API函數需要涉及進程私有地址空間中的DLL板塊,包括NT攝像頭、定位輸入表等相關內容,通過改變進程中私有空間的目標函數調用,以實現目標函數調用的截獲。

4 結束語

綜上可知,目前藏文屏幕取詞課翻譯關鍵技術已經得到了一定的開發,基于C/S模式的Win32操作系統中藏文屏幕自動取詞與翻譯的核心技術,能有效實現屏幕文本獲取。在Win32操作系統中通過攔截API函數調用來進行屏幕取詞,需要充分考慮程序系統的穩定性和兼容性。利用鉤子技術和PE格式技術,通過加載動態鏈接庫和修改輸入地址等方式,結合藏文自動分詞和詞典庫,在最新的互聯平臺上進行詞典編撰、信息抽取和語料庫建設等相關工作,能有效實現藏文資源的屏幕取詞與翻譯工作,對用戶學習和掌握藏文資源的相關內容具有重要的實用價值。

猜你喜歡
進程詞匯系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
本刊可直接用縮寫的常用詞匯
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
債券市場對外開放的進程與展望
中國外匯(2019年20期)2019-11-25 09:54:58
本刊可直接用縮寫的常用詞匯
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
社會進程中的新聞學探尋
民主與科學(2014年3期)2014-02-28 11:23:03
我國高等教育改革進程與反思
教育與職業(2014年7期)2014-01-21 02:35:04
主站蜘蛛池模板: 亚洲国语自产一区第二页| 毛片国产精品完整版| 777午夜精品电影免费看| 蜜桃臀无码内射一区二区三区| 55夜色66夜色国产精品视频| 久久免费观看视频| 日韩免费毛片| 久精品色妇丰满人妻| 国产精品黄色片| 91九色国产在线| 青草精品视频| 久久精品国产亚洲麻豆| 91精品综合| 国产制服丝袜无码视频| 人妻无码中文字幕一区二区三区| 毛片免费在线视频| 久久精品最新免费国产成人| 精品国产自在在线在线观看| 国产毛片不卡| 国产男人的天堂| 中国成人在线视频| 久久青草精品一区二区三区| 一级爆乳无码av| 日韩欧美中文在线| 麻豆国产精品视频| 67194亚洲无码| 亚洲国产天堂在线观看| 国产微拍精品| 成人国内精品久久久久影院| 一区二区午夜| 久久婷婷五月综合97色| av在线无码浏览| 日本欧美视频在线观看| 四虎永久在线精品影院| 国产欧美日韩综合一区在线播放| 91视频99| 国产美女人喷水在线观看| 欧美成人精品一级在线观看| 好紧好深好大乳无码中文字幕| 国产Av无码精品色午夜| 中文字幕第4页| 岛国精品一区免费视频在线观看| 欧美亚洲香蕉| 国产成人综合久久精品尤物| 亚洲欧洲日韩综合色天使| 在线中文字幕日韩| av在线手机播放| 丁香婷婷久久| 国产91精选在线观看| 又黄又湿又爽的视频| 国产精品第一区| 2022精品国偷自产免费观看| 欧美日在线观看| 黄色网页在线播放| 女人18毛片一级毛片在线 | 亚洲日产2021三区在线| 免费国产不卡午夜福在线观看| 亚洲欧美成人网| 人妻中文久热无码丝袜| 91小视频在线观看免费版高清| 91亚洲精品国产自在现线| 无码AV日韩一二三区| 99免费在线观看视频| 91娇喘视频| 亚洲 成人国产| 幺女国产一级毛片| 精品成人一区二区三区电影| 婷婷六月综合网| 夜夜拍夜夜爽| 1769国产精品免费视频| 免费精品一区二区h| a亚洲天堂| 亚洲福利一区二区三区| 色偷偷男人的天堂亚洲av| 一级毛片在线免费视频| 国产内射在线观看| 国产成人免费观看在线视频| 免费在线视频a| 在线毛片网站| av午夜福利一片免费看| 国产第一页亚洲| 国产网站黄|