|
|
電信博物館 >
多媒體 > 怎樣與多媒體打交道
>
低眉信手續(xù)續(xù)彈
手寫數(shù)字識(shí)別的原理及應(yīng)用
一、引言
手寫數(shù)字識(shí)別是“光學(xué)字符識(shí)別技術(shù)”(簡(jiǎn)稱OCR)的一個(gè)分支,它研究的對(duì)象是:如何利用電子計(jì)算機(jī)自動(dòng)辨認(rèn)人手寫在紙張上的阿拉伯?dāng)?shù)字。
在整個(gè)OCR領(lǐng)域中,最為困難的就是脫機(jī)手寫字符的識(shí)別。到目前為止,盡管人們?cè)诿摍C(jī)手寫英文、漢字識(shí)別的研究中已取得很多可喜成就,但距實(shí)用還有一定距離。而在手寫數(shù)字識(shí)別這個(gè)方向上,經(jīng)過(guò)多年研究,研究工作者已經(jīng)開(kāi)始把它向各種實(shí)際應(yīng)用推廣,為手寫數(shù)據(jù)的高速自動(dòng)輸入提供了一種解決方案。
二、研究的實(shí)際背景
字符識(shí)別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國(guó)家、各民族的文字(如:漢字、英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機(jī)手寫方面技術(shù)已趨向成熟,并推出了很多應(yīng)用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號(hào)組成的各種編號(hào)和統(tǒng)計(jì)數(shù)據(jù),如:郵政編碼、統(tǒng)計(jì)報(bào)表、財(cái)務(wù)報(bào)表、銀行票據(jù)等等,處理這類信息的核心技術(shù)是手寫數(shù)字識(shí)別。這幾年來(lái)我國(guó)開(kāi)始大力推廣的“三金”工程在很大程度上要依賴數(shù)據(jù)信息的輸入,如果能通過(guò)手寫數(shù)字識(shí)別技術(shù)實(shí)現(xiàn)信息的自動(dòng)錄入,無(wú)疑會(huì)促進(jìn)這一事業(yè)的進(jìn)展。因此,手寫數(shù)字的識(shí)別研究有著重大的現(xiàn)實(shí)意義,一旦研究成功并投入應(yīng)用,將產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)效益。
三、研究的理論意義
手寫數(shù)字識(shí)別作為模式識(shí)別領(lǐng)域的一個(gè)重要問(wèn)題,也有著重要的理論價(jià)值:
1、阿拉伯?dāng)?shù)字是唯一的被世界各國(guó)通用的符號(hào),對(duì)手寫數(shù)字識(shí)別的研究基本上與文化背景無(wú)關(guān),這樣就為各國(guó)、各地區(qū)的研究工作者提供了一個(gè)施展才智的大舞臺(tái)。在這一領(lǐng)域大家可以探討,比較各種研究方法。
2、由于數(shù)字識(shí)別的類別數(shù)較小,有助于做深入分析及驗(yàn)證一些新的理論。這方面最明顯的例子就是人工神經(jīng)網(wǎng)絡(luò),相當(dāng)一部分的人工神經(jīng)網(wǎng)絡(luò)模型都以手寫數(shù)字識(shí)別作為具體的實(shí)驗(yàn)平臺(tái),驗(yàn)證理論的有效性,評(píng)價(jià)各種方法的優(yōu)缺點(diǎn)。
3、盡管人們對(duì)手寫數(shù)字的識(shí)別已從事了很長(zhǎng)時(shí)間的研究,并已取得了很多成果,但到目前為止機(jī)器的識(shí)別本領(lǐng)還無(wú)法與人的認(rèn)知能力相比,這仍是一個(gè)有難度的開(kāi)放問(wèn)題。
4、手寫數(shù)字的識(shí)別方法很容易推廣到其它一些相關(guān)問(wèn)題,一個(gè)直接的應(yīng)用是對(duì)英文這樣的拼音文字的識(shí)別。事實(shí)上,很多學(xué)者就是把數(shù)字和英文字母的識(shí)別放在一塊兒研究的。
四、基于手寫數(shù)字識(shí)別的典型應(yīng)用
手寫數(shù)字識(shí)別有著極為廣泛的應(yīng)用前景,這也正是它受到世界各國(guó)的研究工作者重視的一個(gè)主要原因。下面我們將介紹基于手寫數(shù)字識(shí)別的應(yīng)用系統(tǒng)的特殊要求,以及一些以手寫數(shù)字識(shí)別技術(shù)為基礎(chǔ)的典型應(yīng)用。
。ㄒ唬 手寫數(shù)字識(shí)別在大規(guī)模數(shù)據(jù)統(tǒng)計(jì)中的應(yīng)用
在大規(guī)模的數(shù)據(jù)統(tǒng)計(jì)(如:行業(yè)年鑒、人口普查等)中,需要輸入大量的數(shù)據(jù),以前完全要手工輸入,則需要耗費(fèi)大量的人力和物力。近年來(lái)在這類工作中采用OCR技術(shù)已成為一種趨勢(shì)。
因?yàn)樵谶@種應(yīng)用中,數(shù)據(jù)的錄入是集中組織的,所以往往可以通過(guò)專門設(shè)計(jì)表格和對(duì)書寫施加限制以便于機(jī)器的自動(dòng)識(shí)別。目前國(guó)內(nèi)的大多數(shù)實(shí)用系統(tǒng)都要求用戶按指定規(guī)范在方格內(nèi)填寫。另外,這些系統(tǒng)往往采用合適的用戶界面對(duì)識(shí)別結(jié)果做全面的檢查,最終保證結(jié)果正確無(wú)誤?梢钥闯,這是一類相對(duì)容易的應(yīng)用,對(duì)識(shí)別核心算法的要求比較低,是目前國(guó)內(nèi)很多單位應(yīng)用開(kāi)發(fā)的熱點(diǎn)。
(二) 手寫數(shù)字識(shí)別在財(cái)務(wù)、稅務(wù)、金融領(lǐng)域中的應(yīng)用
財(cái)務(wù)、稅務(wù)、金融是手寫數(shù)字識(shí)別大有可為的又一領(lǐng)域。隨著我國(guó)經(jīng)濟(jì)的迅速發(fā)展,每天等待處理的財(cái)務(wù)、稅務(wù)報(bào)表、支票、付款單等越來(lái)越多。如果能把它們用計(jì)算機(jī)自動(dòng)處理,無(wú)疑可以節(jié)約大量的時(shí)間、金錢和勞力。與上面提到的統(tǒng)計(jì)報(bào)表處理相比,在這個(gè)領(lǐng)域的應(yīng)用難度更大,原因有:1、對(duì)識(shí)別的精度要求更高;2、處理的表格往往不止一種,一個(gè)系統(tǒng)應(yīng)能智能地同時(shí)處理若干種表格;3、由于處理貫穿于整個(gè)日常工作之中,書寫應(yīng)盡量按一般習(xí)慣(如:不對(duì)書寫者的寫法做限定,書寫時(shí)允許寫連續(xù)的字串,而不是在固定的方格內(nèi)書寫),這樣對(duì)識(shí)別及預(yù)處理的核心算法要求也提高了。
(三) 手寫數(shù)字識(shí)別在郵件分揀中的應(yīng)用
隨著人們生活水平的提高,經(jīng)濟(jì)活動(dòng)的發(fā)展,通信聯(lián)系的需求使信函的互換量大幅度增加,我國(guó)函件業(yè)務(wù)量也在不斷增長(zhǎng),預(yù)計(jì)到2000年,一些大城市的中心郵局每天處理量將高達(dá)幾百萬(wàn)件,業(yè)務(wù)量的急劇上升使得郵件的分揀自動(dòng)化成為大勢(shì)所趨。在郵件的自動(dòng)分揀中,手寫數(shù)字識(shí)別(OCR)往往與光學(xué)條碼識(shí)別、人工輔助識(shí)別等手段相結(jié)合,完成郵政編碼的閱讀。目前使用量最大的OVCS分揀機(jī)的性能指標(biāo):OCR拒分率30%,OCR分揀差錯(cuò)率1.1%。
五、手寫數(shù)字識(shí)別技術(shù)展望
隨著國(guó)家信息化進(jìn)程的加快,手寫數(shù)字識(shí)別的應(yīng)用需求將越來(lái)越廣泛,因此應(yīng)當(dāng)加強(qiáng)這方面的研究工作。作者認(rèn)為,應(yīng)用系統(tǒng)的性能的關(guān)鍵與瓶頸仍然在于手寫數(shù)字識(shí)別核心算法性能上,最終目標(biāo)是研究零誤識(shí)率和低拒識(shí)率的高速識(shí)別算法。此外,盡早建立反映中國(guó)人書寫習(xí)慣的、具有國(guó)家標(biāo)準(zhǔn)性質(zhì)的手寫數(shù)字樣本庫(kù)也是當(dāng)務(wù)之急。
[上一頁(yè)] [下一頁(yè)]
|
|
|