ocr識別原理

【ocr識別原理】
ocr識別原理為:電子設備依賴光學字符識別技術,檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字 。
進行ocr識別時,首先要經過預處理過程,該過程主要包括灰度化,二值化,噪聲去除,傾斜矯正等 。然后旋轉圖像識別收據,最后經過二值化處理即可識別成功 。
ocr技術主要采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工 。一個OCR識別系統,其目的很簡單,只是要把影像作一個轉換 , 使影像內的圖形繼續保存、有表格則表格內資料及影像內的文字,一律變成計算機文字,使能達到影像資料的儲存量減少、識別出的文字可再使用及分析,當然也可節省因鍵盤輸入的人力與時間 。

    推薦閱讀