999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

最好的OCR文字識別軟件: Abbyy FineReader

2014-09-27 17:19:44盤俊春
中國信息技術教育 2014年15期
關鍵詞:頁面文本

盤俊春

老師們在日常教學中經常會碰到這樣的問題,就是想把一張圖片或一個PDF文件里的文字拿出來放到Word里編輯。當然想直接把文字復制到Word里是不行的,因為圖片和PDF文件里的文字是無法復制的。這時候很多老師可能會選擇一個字一個字敲進電腦,太麻煩了。是不是希望有一種東西能自動識別讀取這些文字?怎么去做呢?筆者在試過很多方法后,得出的結論是:使用Abbyy FineReader軟件來實現轉化是最好的辦法。下面就來介紹它的功能及使用方法。

● ABBYE FineReader的主要功能及特點

AbbyyFineReader是俄羅斯ABBYY公司研制成功的一款真正的專業OCR的軟件!OCR(Optical Character Recognition,光學字符識別)技術,是指電子設備(如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別法將形狀翻譯成計算機文字的過程。

安裝并打開軟件(官方下載地址:http://www.abbyy.cn/),啟動后顯示任務窗口,在窗口的右上角選擇文檔語言,這里選擇了簡體中文。在任務窗口中有幾個常用任務選項,包括Word、PDF、電子書和其他格式等文件操作(如圖1)。

界面很簡潔,菜單類似于普通的Windows菜單,如有“文件”、“編輯”等菜單命令,即使是新手,也能不費吹灰之力就使用該軟件。

Abbyy FineReader的主要功能和特點為:①把靜態紙文件和PDF文件轉換成可管理的電子數據;②重建原生的多頁文件格式;③支持輕松創建最流行格式的電子圖書;④可以提供直觀的工具掃描文件,并隨時轉換圖像掃描、照片成為可編輯和可搜索的電子格式的PDF文件;⑤多國語言可以選擇,能轉換幾乎所有打印的文檔類型,包括書籍、雜志上的文章與復雜的布局、表格和電子表格,甚至能以準確的精度發傳真。

● Abbyy FineReader在教學中的應用

下面以把PDF中的文字轉換成Word中的文字為例,來說說Abbyy FineReader軟件的具體應用。

1.打開PDF文件并設置參數

進入Abbyy FineReader軟件,選擇任務后會自動進入下一個界面,此時會自動彈出讓使用者選擇文件,如果沒有選擇文件,則可以在菜單欄中點擊“打開”,然后選擇需要轉換的文件,注意在文件類型中選擇相應的類型,這里應該選擇PDF,默認的是圖形文件,不更改的話最后得到的是亂碼。

打開后可進行基本設置。在菜單欄中選擇“工具”中的“選項”,彈出如圖2的窗口。選項設置窗口中可以設置要保存的格式,里面有10種可選的格式,這里我們轉成的是DOC或者DOCX,所以選擇第一個。窗口里面還有讀取模式等多項設置,這里就不再一一列舉了。

2.文字識別

在所打開的PDF文件中,選擇要轉換的頁面,當然也可以對全部頁面或頁面的部分內容進行轉換。這里有兩個窗口,一個是轉換前的PDF圖像頁面,另一個是轉換后的文本頁面。單擊PDF圖像頁面窗口的“讀取”選項,進行OCR識別,就是讓軟件把圖片中的文字讀取出來(圖片中文字越多,識別花費的時間越長),完成識別之后,就會在文本頁面出現所轉換的文本。其中的一些文字帶有青色背景底色,這說明這些文字是有可能出現錯誤的,我們要對它們進行修正(如圖3)。

3.文字修正

一般來講,圖片越清晰、對比越鮮明的時候,該軟件對文字的識別率就越高。識別率與圖片清晰度、文字大小、文字的端正程度、文字與底色的對比程度有關。Abbyy FineReader的識別率在所有OCR軟件中是最好的,基本能在95%以上,當然不能保證100%。為保險起見,還是要人工核對一下識別的結果,尤其是格式特別復雜、有特殊文字和符號的地方很容易出錯。當然如果使用者用肉眼都看不清楚或者不能分辨的文字,那該軟件識別出來的可能性是不大的。

該軟件的原理是使用掃描的文本字符與系統內置的字符形狀、語言辭典進行比較,從而識別文字,只能掃描指定的語言,其他語言不能識別。所以如果錯誤率太高,則要更改使用的掃描語言。

單擊文本頁面窗口的“驗證”選項,此時會彈出驗證窗口(如圖4)。在這個窗口中會有一些帶有青色背景底色的不確定文字或字符,如果錯誤的話我們可以直接修改,若是正確則可點擊“忽略”跳過。

完成修正后就可以保存所轉換的文本了,有包括DOC/DOCX在內的10多種保存格式可以選擇,一般選擇為Word97-2003格式或DOCX格式,完成后就能在Word中進行文本編輯了。對于提取JPG、BMP等格式圖片中的文字的方法與PDF格式操作大同小異,這里就不再說明。

另外,值得一提的是,如果圖片較為模糊或擺放不正,會影響軟件對圖片文字的讀取效果,此時使用者就需要用到工具欄中的“編輯圖像”進行圖像校正。點擊“編輯圖像”就會彈出圖像編輯窗口(如圖5)。使用者可以看到右側有一排工具,用這些工具可以對圖像的歪斜校正等多種參數進行編輯修正處理,這樣會大大提高圖片的識別率。

總的來說,Abbyy FineReader軟件不愧是最好的圖片、PDF文字識別軟件,它能給我們的教育教學帶來極大的便捷。

endprint

老師們在日常教學中經常會碰到這樣的問題,就是想把一張圖片或一個PDF文件里的文字拿出來放到Word里編輯。當然想直接把文字復制到Word里是不行的,因為圖片和PDF文件里的文字是無法復制的。這時候很多老師可能會選擇一個字一個字敲進電腦,太麻煩了。是不是希望有一種東西能自動識別讀取這些文字?怎么去做呢?筆者在試過很多方法后,得出的結論是:使用Abbyy FineReader軟件來實現轉化是最好的辦法。下面就來介紹它的功能及使用方法。

● ABBYE FineReader的主要功能及特點

AbbyyFineReader是俄羅斯ABBYY公司研制成功的一款真正的專業OCR的軟件!OCR(Optical Character Recognition,光學字符識別)技術,是指電子設備(如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別法將形狀翻譯成計算機文字的過程。

安裝并打開軟件(官方下載地址:http://www.abbyy.cn/),啟動后顯示任務窗口,在窗口的右上角選擇文檔語言,這里選擇了簡體中文。在任務窗口中有幾個常用任務選項,包括Word、PDF、電子書和其他格式等文件操作(如圖1)。

界面很簡潔,菜單類似于普通的Windows菜單,如有“文件”、“編輯”等菜單命令,即使是新手,也能不費吹灰之力就使用該軟件。

Abbyy FineReader的主要功能和特點為:①把靜態紙文件和PDF文件轉換成可管理的電子數據;②重建原生的多頁文件格式;③支持輕松創建最流行格式的電子圖書;④可以提供直觀的工具掃描文件,并隨時轉換圖像掃描、照片成為可編輯和可搜索的電子格式的PDF文件;⑤多國語言可以選擇,能轉換幾乎所有打印的文檔類型,包括書籍、雜志上的文章與復雜的布局、表格和電子表格,甚至能以準確的精度發傳真。

● Abbyy FineReader在教學中的應用

下面以把PDF中的文字轉換成Word中的文字為例,來說說Abbyy FineReader軟件的具體應用。

1.打開PDF文件并設置參數

進入Abbyy FineReader軟件,選擇任務后會自動進入下一個界面,此時會自動彈出讓使用者選擇文件,如果沒有選擇文件,則可以在菜單欄中點擊“打開”,然后選擇需要轉換的文件,注意在文件類型中選擇相應的類型,這里應該選擇PDF,默認的是圖形文件,不更改的話最后得到的是亂碼。

打開后可進行基本設置。在菜單欄中選擇“工具”中的“選項”,彈出如圖2的窗口。選項設置窗口中可以設置要保存的格式,里面有10種可選的格式,這里我們轉成的是DOC或者DOCX,所以選擇第一個。窗口里面還有讀取模式等多項設置,這里就不再一一列舉了。

2.文字識別

在所打開的PDF文件中,選擇要轉換的頁面,當然也可以對全部頁面或頁面的部分內容進行轉換。這里有兩個窗口,一個是轉換前的PDF圖像頁面,另一個是轉換后的文本頁面。單擊PDF圖像頁面窗口的“讀取”選項,進行OCR識別,就是讓軟件把圖片中的文字讀取出來(圖片中文字越多,識別花費的時間越長),完成識別之后,就會在文本頁面出現所轉換的文本。其中的一些文字帶有青色背景底色,這說明這些文字是有可能出現錯誤的,我們要對它們進行修正(如圖3)。

3.文字修正

一般來講,圖片越清晰、對比越鮮明的時候,該軟件對文字的識別率就越高。識別率與圖片清晰度、文字大小、文字的端正程度、文字與底色的對比程度有關。Abbyy FineReader的識別率在所有OCR軟件中是最好的,基本能在95%以上,當然不能保證100%。為保險起見,還是要人工核對一下識別的結果,尤其是格式特別復雜、有特殊文字和符號的地方很容易出錯。當然如果使用者用肉眼都看不清楚或者不能分辨的文字,那該軟件識別出來的可能性是不大的。

該軟件的原理是使用掃描的文本字符與系統內置的字符形狀、語言辭典進行比較,從而識別文字,只能掃描指定的語言,其他語言不能識別。所以如果錯誤率太高,則要更改使用的掃描語言。

單擊文本頁面窗口的“驗證”選項,此時會彈出驗證窗口(如圖4)。在這個窗口中會有一些帶有青色背景底色的不確定文字或字符,如果錯誤的話我們可以直接修改,若是正確則可點擊“忽略”跳過。

完成修正后就可以保存所轉換的文本了,有包括DOC/DOCX在內的10多種保存格式可以選擇,一般選擇為Word97-2003格式或DOCX格式,完成后就能在Word中進行文本編輯了。對于提取JPG、BMP等格式圖片中的文字的方法與PDF格式操作大同小異,這里就不再說明。

另外,值得一提的是,如果圖片較為模糊或擺放不正,會影響軟件對圖片文字的讀取效果,此時使用者就需要用到工具欄中的“編輯圖像”進行圖像校正。點擊“編輯圖像”就會彈出圖像編輯窗口(如圖5)。使用者可以看到右側有一排工具,用這些工具可以對圖像的歪斜校正等多種參數進行編輯修正處理,這樣會大大提高圖片的識別率。

總的來說,Abbyy FineReader軟件不愧是最好的圖片、PDF文字識別軟件,它能給我們的教育教學帶來極大的便捷。

endprint

老師們在日常教學中經常會碰到這樣的問題,就是想把一張圖片或一個PDF文件里的文字拿出來放到Word里編輯。當然想直接把文字復制到Word里是不行的,因為圖片和PDF文件里的文字是無法復制的。這時候很多老師可能會選擇一個字一個字敲進電腦,太麻煩了。是不是希望有一種東西能自動識別讀取這些文字?怎么去做呢?筆者在試過很多方法后,得出的結論是:使用Abbyy FineReader軟件來實現轉化是最好的辦法。下面就來介紹它的功能及使用方法。

● ABBYE FineReader的主要功能及特點

AbbyyFineReader是俄羅斯ABBYY公司研制成功的一款真正的專業OCR的軟件!OCR(Optical Character Recognition,光學字符識別)技術,是指電子設備(如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別法將形狀翻譯成計算機文字的過程。

安裝并打開軟件(官方下載地址:http://www.abbyy.cn/),啟動后顯示任務窗口,在窗口的右上角選擇文檔語言,這里選擇了簡體中文。在任務窗口中有幾個常用任務選項,包括Word、PDF、電子書和其他格式等文件操作(如圖1)。

界面很簡潔,菜單類似于普通的Windows菜單,如有“文件”、“編輯”等菜單命令,即使是新手,也能不費吹灰之力就使用該軟件。

Abbyy FineReader的主要功能和特點為:①把靜態紙文件和PDF文件轉換成可管理的電子數據;②重建原生的多頁文件格式;③支持輕松創建最流行格式的電子圖書;④可以提供直觀的工具掃描文件,并隨時轉換圖像掃描、照片成為可編輯和可搜索的電子格式的PDF文件;⑤多國語言可以選擇,能轉換幾乎所有打印的文檔類型,包括書籍、雜志上的文章與復雜的布局、表格和電子表格,甚至能以準確的精度發傳真。

● Abbyy FineReader在教學中的應用

下面以把PDF中的文字轉換成Word中的文字為例,來說說Abbyy FineReader軟件的具體應用。

1.打開PDF文件并設置參數

進入Abbyy FineReader軟件,選擇任務后會自動進入下一個界面,此時會自動彈出讓使用者選擇文件,如果沒有選擇文件,則可以在菜單欄中點擊“打開”,然后選擇需要轉換的文件,注意在文件類型中選擇相應的類型,這里應該選擇PDF,默認的是圖形文件,不更改的話最后得到的是亂碼。

打開后可進行基本設置。在菜單欄中選擇“工具”中的“選項”,彈出如圖2的窗口。選項設置窗口中可以設置要保存的格式,里面有10種可選的格式,這里我們轉成的是DOC或者DOCX,所以選擇第一個。窗口里面還有讀取模式等多項設置,這里就不再一一列舉了。

2.文字識別

在所打開的PDF文件中,選擇要轉換的頁面,當然也可以對全部頁面或頁面的部分內容進行轉換。這里有兩個窗口,一個是轉換前的PDF圖像頁面,另一個是轉換后的文本頁面。單擊PDF圖像頁面窗口的“讀取”選項,進行OCR識別,就是讓軟件把圖片中的文字讀取出來(圖片中文字越多,識別花費的時間越長),完成識別之后,就會在文本頁面出現所轉換的文本。其中的一些文字帶有青色背景底色,這說明這些文字是有可能出現錯誤的,我們要對它們進行修正(如圖3)。

3.文字修正

一般來講,圖片越清晰、對比越鮮明的時候,該軟件對文字的識別率就越高。識別率與圖片清晰度、文字大小、文字的端正程度、文字與底色的對比程度有關。Abbyy FineReader的識別率在所有OCR軟件中是最好的,基本能在95%以上,當然不能保證100%。為保險起見,還是要人工核對一下識別的結果,尤其是格式特別復雜、有特殊文字和符號的地方很容易出錯。當然如果使用者用肉眼都看不清楚或者不能分辨的文字,那該軟件識別出來的可能性是不大的。

該軟件的原理是使用掃描的文本字符與系統內置的字符形狀、語言辭典進行比較,從而識別文字,只能掃描指定的語言,其他語言不能識別。所以如果錯誤率太高,則要更改使用的掃描語言。

單擊文本頁面窗口的“驗證”選項,此時會彈出驗證窗口(如圖4)。在這個窗口中會有一些帶有青色背景底色的不確定文字或字符,如果錯誤的話我們可以直接修改,若是正確則可點擊“忽略”跳過。

完成修正后就可以保存所轉換的文本了,有包括DOC/DOCX在內的10多種保存格式可以選擇,一般選擇為Word97-2003格式或DOCX格式,完成后就能在Word中進行文本編輯了。對于提取JPG、BMP等格式圖片中的文字的方法與PDF格式操作大同小異,這里就不再說明。

另外,值得一提的是,如果圖片較為模糊或擺放不正,會影響軟件對圖片文字的讀取效果,此時使用者就需要用到工具欄中的“編輯圖像”進行圖像校正。點擊“編輯圖像”就會彈出圖像編輯窗口(如圖5)。使用者可以看到右側有一排工具,用這些工具可以對圖像的歪斜校正等多種參數進行編輯修正處理,這樣會大大提高圖片的識別率。

總的來說,Abbyy FineReader軟件不愧是最好的圖片、PDF文字識別軟件,它能給我們的教育教學帶來極大的便捷。

endprint

猜你喜歡
頁面文本
微信群聊總是找不到,打開這個開關就好了
大狗熊在睡覺
刷新生活的頁面
保健醫苑(2022年1期)2022-08-30 08:39:14
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
論《柳毅傳》對前代文本的繼承與轉化
人間(2015年20期)2016-01-04 12:47:10
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
同一Word文檔 縱橫頁面并存
主站蜘蛛池模板: 免费无码一区二区| 成人日韩精品| 91娇喘视频| 精品夜恋影院亚洲欧洲| 99久久婷婷国产综合精| 性色一区| 国产一区成人| 久久情精品国产品免费| 久久香蕉国产线| 亚洲中文字幕日产无码2021| 国产精品成人久久| 亚洲欧美综合在线观看| 久久99久久无码毛片一区二区| 激情在线网| 国产精品香蕉| 亚洲欧美国产视频| 五月激情婷婷综合| 伊人欧美在线| 亚洲中文精品人人永久免费| 亚洲国产中文欧美在线人成大黄瓜 | 免费观看亚洲人成网站| 亚洲AⅤ波多系列中文字幕 | 色婷婷亚洲十月十月色天| 欧美性爱精品一区二区三区| 亚洲无码高清视频在线观看 | 免费人成网站在线观看欧美| 亚洲丝袜中文字幕| 欧美伊人色综合久久天天| 日韩A∨精品日韩精品无码| 欧洲亚洲一区| 57pao国产成视频免费播放| 国产h视频免费观看| 国内精自视频品线一二区| 一本色道久久88| 亚洲国产日韩一区| 精品精品国产高清A毛片| 亚洲熟女偷拍| 五月天综合网亚洲综合天堂网| 91精品国产91欠久久久久| 精品黑人一区二区三区| 全午夜免费一级毛片| 波多野结衣二区| 日本不卡视频在线| 欧美一区二区啪啪| 久久永久视频| 亚洲天堂.com| 国产激爽爽爽大片在线观看| 国产毛片片精品天天看视频| 99re66精品视频在线观看| 在线看片免费人成视久网下载| 亚洲视频免费在线看| www.91中文字幕| 91麻豆国产视频| 精品99在线观看| 四虎国产在线观看| 手机在线看片不卡中文字幕| 亚洲无码高清一区| 日韩精品一区二区三区大桥未久| 亚洲色无码专线精品观看| 天天操精品| 日韩午夜片| 亚洲综合二区| 亚洲国产中文欧美在线人成大黄瓜 | 亚洲一区二区成人| 亚洲欧美日韩中文字幕在线一区| 91青青草视频在线观看的| 国产日韩精品一区在线不卡 | 自慰网址在线观看| 色视频久久| 久爱午夜精品免费视频| 国产伦片中文免费观看| 园内精品自拍视频在线播放| 亚洲国产91人成在线| 免费一级成人毛片| 丰满少妇αⅴ无码区| 伊人久久大香线蕉成人综合网| 婷婷五月在线视频| 又爽又黄又无遮挡网站| 国产91线观看| 国产在线无码一区二区三区| 亚欧美国产综合| 国产精品美女网站|