一般來(lái)說(shuō),網(wǎng)絡(luò)上比較火的小說(shuō)均是制作成圖片給大家閱讀,想要將圖片上的文字轉(zhuǎn)換為T(mén)XT文件放在移動(dòng)設(shè)備上閱讀,自己動(dòng)手敲打文字,似乎不太現(xiàn)實(shí);而不少OCR文字識(shí)別軟件只能識(shí)別本地磁盤(pán)的圖片,且識(shí)別率不是想象中的那么高。想要在線識(shí)別圖片文字也很簡(jiǎn)單,通過(guò)Sciweavers網(wǎng)站(www.sciweavers.org/free-online-ocr)就可以在線對(duì)圖片進(jìn)行OCR識(shí)別。
登錄網(wǎng)站后,首先在“Language(語(yǔ)言)”選項(xiàng)中選中“Chinese- Simplified”,把文字設(shè)置為簡(jiǎn)體中文(如圖1),然后在主界面的左下側(cè)的“Image(圖片)”欄中選擇“URL”,再把需要識(shí)別的圖片網(wǎng)絡(luò)地址輸入欄中。
完畢后,點(diǎn)擊“Convert”按鈕開(kāi)始對(duì)圖片識(shí)別。當(dāng)識(shí)別完畢后,在頁(yè)面的左側(cè)就顯示出剛識(shí)別出的純文本,可隨時(shí)復(fù)制、編輯,而右側(cè)顯示的是原版圖片供用戶(hù)比對(duì)(如圖2)。當(dāng)然,Sciweavers不只支持在線圖片的轉(zhuǎn)換,還能轉(zhuǎn)換本地磁盤(pán)中的圖片文件,并且支持TIF、 JPEG、 PNG、 BMP等多種圖片格式。
小貼士:
OCR(光學(xué)字符識(shí)別)技術(shù),是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過(guò)檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程;即,對(duì)文本資料進(jìn)行掃描,然后對(duì)圖像文件進(jìn)行分析處理,獲取文字及版面信息。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文