- 軟件大小(xiǎo):43.54M
- 軟件語言(yán):中文
- 軟(ruǎn)件類型:國產軟件
- 軟件類別:免費軟件 / 文字處理
- 更新時間:2014-12-17 09:17
- 運行環境:WinAll, WinXP
- 軟件等級:
- 軟件廠商:
- 官方網站:http://www.ynaad.com
0KB/中文(wén)/5.0
34.08M/中文/10.0
54.88M/中文/10.0
0KB/中文/10.0
8.99M/中文/10.0
尚(shàng)書7號OCR軟件是一款專門為識別文字而研發的(de)軟件,本軟件係統是(shì)應用OCR(Optical Character Recognition)技術,為滿足書籍、報刊雜誌、報表票據、公文檔案等錄入需求而設計的軟件係統。 目前,許多信息資料需要轉化成(chéng)電子文檔以便於各(gè)種應用及管理,但因信息數字(zì)化處理的方式落後,不但費時費(fèi)力,而且資金耗費巨大,造成了大量文檔資料的積壓,因此急需一種快速高效的軟件(jiàn)係統(tǒng)來滿足這種海量錄入需求。尚書七號OCR軟件適用於個人、小型圖書館、小型(xíng)檔案館、小型企業進行大(dà)規模文檔輸入、圖書翻印、大量資料電子化的軟件係統。
識別(bié)字符 簡體字符集:國標GB2312-80的全(quán)部一、二級漢字(zì)6800多個。純英文字符集。 簡繁字集:除了簡體漢字外,還可以混識台灣繁體(tǐ)字5400多個以及香港繁體字和GBK漢字。
識別字體種類 能識別宋體、仿(fǎng)宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字體,並支持多種字體混排。
識別字(zì)號 初號 小六號字體。
表格識(shí)別 可以自動判(pàn)斷、拆分、識(shí)別和還(hái)原各種(zhǒng)通用型印刷體表格。
可支持繁(fán)體WINDOWS係統
用掃描儀掃描的文字圖像,不能對個別文字進行編輯修改,在教學中,需要利用文字識別(bié)軟件,將文字圖像進行識別,將圖像格式轉化成(chéng)文本格式,常見的文字識別軟件有很多,主要功能基本相同,尚書七號就是其中很優秀的一款。用尚書(shū)七(qī)號對文字圖像識別(bié)轉化(huà)的過程,利用其主菜單:“文件”、“編(biān)輯”、“識別”、“輸出”可以很方便地(dì)完成。
步驟1:獲取(qǔ)文字圖像文件。
選擇“文件”菜單下的“掃描”或“打開圖像”(將已經掃描好的圖像文件打開)命令,打開圖像文件。如果連接了多台掃描儀,可以選擇“文(wén)件”菜單(dān)下的“選擇掃描儀”命令,調用掃描儀。
步(bù)驟2:對掃描的圖像頁進行調整
選擇“編輯”菜單下“圖像頁麵(miàn)的處理”子菜單下(xià)的“圖像頁的傾斜校正”(提供自動和手動實現方法)及“旋(xuán)轉”等命令,將掃描的圖像頁進行(háng)調整。
步驟3:版麵分析與文字識別轉化
版麵分析,選擇識別範圍,在進行文字識別前要選擇識別範圍,識別過程(chéng)的核心是“版麵分析”。尚書七號的自動版麵分析功能很強,對報紙雜誌等複雜的(de)版麵,也能保持很高的分析正確率。
設置好後,直接點擊(jī)“開始識別”的按鈕就可(kě)以進行文字識別了。
步驟4:校對修(xiū)改
自動識(shí)別完畢,識別結(jié)果的“文本窗口(kǒu)”會彈出,這個窗口能夠提供識別結果的校對,為了校對方(fāng)便,尚書七號增加了光標跟隨顯示原圖像(xiàng)行的校對方法(如圖3出現的黃色提示行的出現(xiàn))。
提供的(de)校對方(fāng)法,一眼就能夠看到圖像(xiàng)原文和識(shí)別出文本的差(chà)別,如果發現識別(bié)有誤(wù),可以進行修改(gǎi)。
步驟5:輸出
如果檢查修改後確認無誤,選擇識別結果的(de)“輸出”菜(cài)單,輸出的文件格式有:RTF、HTML、XLS、22238,可以(yǐ)根據自己的需(xū)要選擇對應的(de)格式。如果用戶想(xiǎng)得到類似原文的(de)識別結果,請選擇RTF格(gé)式。把RTF格式輸(shū)出的文件用WORD打開後(hòu),會發現幾乎保留了原(yuán)文(wén)的所有痕跡,包括原來頁麵中的彩色圖像,都已(yǐ)經保留在WORD中了。
本軟件(jiàn)係統是應用OCR(Optical Character Recognition)技術,為滿足書籍、報刊(kān)雜誌、報表票據(jù)、公文檔(dàng)案等錄入需求而(ér)設計的軟件係統(tǒng)。 目前,許多信息資料需要轉化成電子文檔以便於各種應用及管理(lǐ),但因信(xìn)息數字化處理的方式落後,不但費時費力,而且資金耗費巨大,造(zào)成(chéng)了大量文檔(dàng)資料的積壓,因(yīn)此急需一種快速高效的軟件係統來滿足(zú)這種海量錄入需求。
本軟件係統正是適用於個人、小型圖書館、小型檔案館、小型企業進行大(dà)規模文(wén)檔輸入、圖書翻印、大量資(zī)料電子化的軟件係統。
識別字符(fú) 簡體字符集:國(guó)標GB2312-80的全部一、二(èr)級漢字6800多個。純英文字符集。 簡繁字集:除了簡體(tǐ)漢字外,還可(kě)以混識(shí)台灣繁體字5400多個以及香港繁體字和GBK漢字。
識別字體種類 能識(shí)別宋體、仿宋(sòng)、楷、黑、魏碑、隸書、圓體、行楷等一(yī)百多種字體,並支持多種字體混排。
識(shí)別字號 初號 小六號字體。
表格識別 可以自動(dòng)判斷、拆分(fèn)、識別和還原各種通用型(xíng)印刷體表格。
可支持(chí)繁體WINDOWS係統
用掃描儀掃描的文字圖(tú)像,不能對(duì)個別文字進(jìn)行編輯修改(gǎi),在教學中(zhōng),需要利用文字識別軟件,將文(wén)字圖像進行識別,將圖像格式轉化成文本格式,常見的文字識別軟件有很多,主要功能基本相同,尚書七號就(jiù)是其中很優秀的一款。用尚書七號對文字圖像識(shí)別轉化的過程,利(lì)用其主菜單:“文件”、“編輯”、“識別”、“輸出”可以很方便地完成。具體步驟為:
步(bù)驟1:獲取文字圖像文件。
選擇(zé)“文件(jiàn)”菜單下的“掃描”或“打開圖像”(將已經掃描好的圖像文件打開(kāi))命令,打開(kāi)圖(tú)像文件。如果連接了多台掃描儀,可以選擇“文件”菜單下的“選擇掃描儀”命令,調(diào)用掃描儀。
步驟2:對掃描(miáo)的圖像頁進行調整
選擇“編輯”菜單下“圖像頁麵的處理”子菜單下(xià)的(de)“圖像(xiàng)頁的(de)傾斜校正”(提供自動(dòng)和手動實現方法)及“旋轉”等命令,將(jiāng)掃描的圖像頁進行調整。
步驟3:版麵分析與文字識別轉化(huà)
版麵分析,選擇識別範圍,在進行文字識別前要選擇識(shí)別範圍,識別過程(chéng)的核心是“版麵(miàn)分析”。尚書(shū)七號的自(zì)動版麵(miàn)分析功能很強,對報紙雜(zá)誌(zhì)等複雜的版麵,也能保持很高的分(fèn)析正確率(lǜ)。
設置好後,直接點擊“開(kāi)始識別(bié)”的按鈕就可以(yǐ)進行文字識別了。
步驟(zhòu)4:校(xiào)對修改
自動識別完畢,識別結果的“文本窗口”會彈出,這個窗口能(néng)夠提供識別結果的校對,為了校對方便,尚書七號增加了光標跟隨顯示原圖像行的校對方法(如圖3出現的黃色提示行的出現(xiàn))。
提供的校對方法,一眼就能夠看(kàn)到圖像原文和識別出文(wén)本的(de)差別,如果發現識別有誤,可以進行修(xiū)改。
步驟5:輸出
如果檢查修改後確(què)認無誤,選擇識別結果的“輸出”菜單,輸出的文件格式有:RTF、HTML、XLS、22238,可以根據自己(jǐ)的需要選擇對應的格式。如果用戶(hù)想得到(dào)類似原文的(de)識別結果,請選擇RTF格式。把(bǎ)RTF格式輸出的文件用WORD打開後,會發現幾乎保留了(le)原文的所有(yǒu)痕跡,包括原來頁麵中的彩色圖像,都已經保留在WORD中了。
請(qǐng)描述您所遇到的錯誤,我們將盡快予以修正,謝謝!
*必填項,請輸入內容