



平時看視頻、幻燈片和PDF格式的電子書時,總有一些文字是我們所需要的。如果文字較少,我們可以將它們逐一打下來,如果文字較多,這樣的方法就很悲催了。所以這里我們提供了幾個非常高效的方法,希望能對有此需要的朋友有所幫助。
快速抓取對話框或窗口中的文字
對話框和窗口中經(jīng)常有我們需要的文字,這時,我們可以借助AquaDesktop這款工具來將其抓取下來。
第一步:下載解壓后,雙擊wText.exe文件運行程序。程序會在系統(tǒng)托盤區(qū)添加一個圖標,右擊該圖標,在出現(xiàn)的右鍵菜單中選擇“捕獲助手”,打開相應(yīng)的對話框,選擇“文本”項,單擊“下一步”按鈕,在接下來的界面中,根據(jù)自己的需要,選擇好要捕捉的選項,如“矩形區(qū)域的文本”、“單個詞語”或“窗口的全部文本”等(筆者這里選擇的是“矩形區(qū)域的文本”項),選擇完畢,單擊“下一步”按鈕(如圖1)。
第二步:單擊“捕獲”按鈕,拖動鼠標選定好要捕捉的區(qū)域,該區(qū)域中的文字即會被捕捉下來。然后在出現(xiàn)的菜單中選擇“點擊復(fù)制文本”命令,將抓取到的文字復(fù)制到剪切板中,隨后粘貼到需要的地方即可。
快速抓取視頻或圖片中的文字
識別圖片或視頻中的文字,說白了就是OCR識別,不過,我們通常所見的OCR識別工具,如“漢王OCR圖片識別”和“清華紫光OCR”等,識別時,需要先將要識別的圖片導(dǎo)入到程序中,而且其本身并不支持視頻識別功能,操作起來比較麻煩。其實我們完全可以用“文通慧視”這款綠色的工具,簡化識別流程。
第一步:下載解壓后,雙擊其中的WtSign32.reg進行注冊,然后執(zhí)行“文字識別.exe”運行程序,此時屏幕上方會出現(xiàn)一個相應(yīng)的工具條。使用圖片瀏覽工具打開要截取文字的圖片,單擊工具條中的“慧視屏幕”按鈕,這時,鼠標會變成“+”字形。按下鼠標左鍵選取圖片上要截取的區(qū)域,在隨后出現(xiàn)的對話框中,分別選擇“內(nèi)容”為“文本”、“背景”為“自動”、語言為“簡體”,單擊“確定”按鈕。相應(yīng)的文字即會被識別出來并顯示到記事本中(如圖2),然后將其保存或復(fù)制到需要的地方即可。
第二步:視頻文字的截取方法類似。在播放器中暫停相應(yīng)畫面,然后打開“屏幕識別”對話框,勾選下方的“視頻識別”項,然后拖動鼠標框選視頻播放畫面中的文字區(qū)域,單擊“識別”按鈕,很快就可抓取到播放畫面中的文字。
快速提取PPT中的文字
PPT幻燈片中的內(nèi)容主要分標題、文本和備注三部分,根據(jù)要提取的內(nèi)容不同,我們可采取兩種不同的方法。
實例1:利用PPT自身功能完成
如果幻燈片中的內(nèi)容只包含標題、文本,或者你只想提取這兩部分內(nèi)容,且你目前使用的是Office 2010及其以后的版本,可利用PPT自身的功能完成。
啟動要提取文字的PPT文檔,切換到“文件”標簽,在出現(xiàn)的菜單中選擇“另存為”,打開“另存為”對話框,保存文件為“大綱/RTF文件”類型(如圖3),最后雙擊這個RTF文件,系統(tǒng)會默認使用Word將其打開,對其中的內(nèi)容進行編輯后將其保存成Word文檔即可。
實例2:利用專用工具完成
如果你使用的不是Office 2010或以后的版本,而且要提取的內(nèi)容包括PPT中的備注,則可借助“幻燈片文字提取程序”來完成。
第一步:關(guān)閉要轉(zhuǎn)換的PPT文檔,同時打開一個空白的PPT文檔和Word文檔,安裝并運行程序,此時,屏幕上會出現(xiàn)一個對話框,要求我們關(guān)閉當前打開的PPT和Word文檔,不管他(否則無法完成轉(zhuǎn)換),單擊“確定”按鈕關(guān)閉該對話框,進入程序主界面。
第二步:在資源管理器中找到要轉(zhuǎn)換的PPT文檔,用鼠標將其拖拽到程序主界面的文本框中,單擊“開始”按鈕(如圖4),軟件就會自動打開每一頁幻燈片,依次復(fù)制標題、文本框和備注中的文字內(nèi)容,并按原來的順序粘貼到Word窗口中。通常整個轉(zhuǎn)換過程只需一兩分鐘,轉(zhuǎn)換后的Word文檔,程序會以“XXX.ppt.Convertor.doc”(其中“XXX”為原文檔名)的命名方式,將其存到PPT文檔所在的目錄下。
批量抓取PDF中的文字
顯然,用上面我們提到的“文通慧視”,照樣能夠抓取PDF文檔中的文字,不過,這僅僅限于要抓取的文字較少的情況下,有些時候,我們需要抓取整個PDF文檔中的文字,這時,我們可用ABBYYFineReader來達到目的。
第一步:安裝并運行程序,單擊工具欄中的“新建任務(wù)”按鈕,打開相應(yīng)的對話框,選擇左側(cè)的“常用”項,然后在右側(cè)選擇“文件(PDF/圖像)至Microsoft Word”項(如圖5),打開“打開圖像”對話框,選擇需要識別的PDF文件。
第二步:軟件會自動打開該文檔的每一個頁面并進行識別,同時給出識別進度。識別完成,將自動打開Word文檔,并以與原PDF文檔相同的版式,顯示出識別的內(nèi)容,如文字、圖片。對其中的內(nèi)容進行編輯,編輯完畢,直接將其保存成Word格式,整個提取過程即告結(jié)束了。