联系我们
- 地 址:北京市海淀区北四环西路9号 ,主 营:人脸识别,活体检测,身份证识别,银行卡识别,名片识别,车牌识别,OCR识别等及智能识别技术。
- 电 话:13146317170 廖经理
- 传 真:
- 邮 箱:398017534@qq.com
OCR技术的前世今生
【摘要】随着计算机网络的飞速发展,信息电子化已经成为一个时代必然趋势,OCR技术可以实现对文本资料进行扫描,进而对图 像文件进行分析处理,获取文字及版面相关信息,本文介绍了 OCR的发展及应用现状,并对OCR技术的应用前景进行了前瞻。
【关键词】光学字符识别(OCR)研究进展前瞻
1、 概述
OCR(Optical Character Recognition),即光学字符识别,是指 电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检 测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计 算机文字的过程;即对文本资料进行扫描,然后对图像文件进行分 析处理,获取文字及版面信息的过程。
随着计算机网络飞速发展,信息电子化已经成为一个时代必然 趋势。文字作为信息中最重要、最集中的载体,其电子化进程显得 尤为重要。而OCR技术则是文字电子化过程中最重要的环节,它改 变了传统的纸质介质资料输入的概念。比如,通过OCR技术,用户 可以将通过摄像机、扫描仪等光学输入方式得到的报刊、书籍、文 稿、表格等印刷品的图像信息转化为可以供计算机识别和处理的文 本信息。因此,与传统的手工录入方式相比,OCR技术大大提高了 人们进行资料存储、检索、加工的效率。目前市场上符合银行、证 券、保险、税务、公安、海关、机场、工商、军队及其它行业应用 的OCR产品已经相对成熟,它们已经通过市场检验并被广大用户大 规模使用[1-4]。
2、 OCR技术的起源及发展
OCR的起源最早追溯到1 929年德国的科学家Taushcck获得了 光学字符识别技术专利[5],但是对于当时的科技发展情况而言,一 切仅仅是个设想,直到计算机的诞生才使得这种设想成为现实。经 过近百年的发展,OCR已经成为当今模式识别领域中最活跃的分支 之一。它综合了数字图像处理、计算机图形学及人工智能等多方面 的理论知识,并在计算机及其相关领域中得到了相当广泛的应用。 近几年来,它同语音识别、行为识别等一起日益成为人们研究及关 注的焦点。
在二十世纪六七十年代,世界各国就已经展开了光学字符识别 研究,如我们的邻国曰本,在六十年代中期就有了邮政编码识别系 统的产品问世,该系统能够识别邮件上的邮政编码,帮助邮局进行 区域分信作业,这也使得邮政编码一直沿用至今[6]。随后,经过科 研学者的努力,曰本的三洋,富士,理光,松下等知名公司也相继 有字符识别系统的产品面世。
我国的光学字符识别研究相对国外起步较晚,但是发展十分迅 速。从早期简单的单体识别发展到多种字体混合排列的多体识别, 从中文印刷材料的识别发展到中英文混排印刷材料的双语言识别, 目前各个系统都可以支持简、繁体汉字的识别,也有同时支持中, 英,韩等多国文字的识别系统,它们解决了多体多字号混排文本的 识别问题,对于简单的版面可以进行效的定量分析,同时汉字识别 率已经可以达到98%以上。
3、 OCR技术的应用
国外的OCR技术应用相对成熟,包括旧M、Motorola、HP和 Microsoft等世界型大公司都陆续展开了这方面的研究,在他们的产 品中绑定OCR技术。光符识别设备把报纸、杂志和其它印刷材料上 的印刷字符读取到计算机内存。OCR软件可以和任何流行的操作系 统一起使用。除了识别印刷字符之外,OCR也可能识别栏目布局, 这种布局会在报纸中出现。例如,微软公司最新推出的办公套件一 —Microsoft Office XP中,不仅加强了原有对手写输入的支持,还 新增加了光学字符识别(OCR)的工具组件。字符识别产品的广泛应 用推动了模式识别等相关理论的发展,促进了计算机应用的普及。 2008年,Google也宣布它将开始在网络蜘蛛中使用OCR技术,这样就可以识别许多非格式化文本和图像并将其索引到数据库。
如今,OCR技术在我国的应用也极为广泛,可以说有汉字的地 方就有OCR技术应用的存在。在信息技术及计算机技术日益普及的 今天,如何将文字方便、快捷地输入到计算机中已经成为影响人机 接口效率的一个重要难题,也关系到计算机是否能够真正在我国得 到普及和应用。
汉字输入主要分为人工键盘输入和机器自动识别输入两种。其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入 及语音识别输入。从识别技术的难度来说,手写体识别的难度高于 印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过联 机手写体识别。到目前为止,除了脱机手写体数字的识别已有实际 应用外,汉字等文字的脱机手写体识别还处在实验室阶段。简单来 说,从影像到结果输出,须经过影像输入、影像前处理、文 字特征抽取、比对识别、最后经人工校正将认错的文字更正, 将结果输出等环节的过程。
随着我国信息化建设全面普及,OCR技术的应用前景将更加地广阔。就目前从行业需求来看,金融、保险、税务、工商、电子商务等行业对信息识别的需求已经越来越广泛,促进了识别技术的大 规模应用。而个人消费者对资料电子化、手写识别技术等各方面需 求则拓展了OCR识别技术在这一领域的应用之路,另一方面,网络时代的高速发展使个人资料电子化、商务办公自动化等需求的呼声 也变得越来越高。
4、结语
当计算机、手机以及形形色色的各种IT产品通用于时代,世界被数字化一统天下之时,不仅是IT技术的热点,连生活的热点都必 将转移到人机智能交互技术之上,人机智能交互技术将成为我们认 识世界、了解世界,同时成为计算机理解我们的出口。
本文对OCR技术进行了简要的概述,并结合当今发展现状介绍 了几个正在应用中的识别软件产品。OCR技术已经取得了长足的进 步,关于它的研究已经成为模式识别领域中最前沿的研究内容之 一,反映了认知科学、人工智能和制造工艺的最新进展。
可以说因特网和计算机的普及为OCR的发展提供了更加广阔 的应用舞台。目前科研学者努力攻克的方向主要集中在手写体汉字 识别、全字体识别、图文混排文档文字识别、视频图像文字识别等 方面。在今后的发展过程中,OCR技术及其产品必将不断完善,应 用领域也将更加广泛,它的深入研究不仅可以带动模式识别、人工 智能等相关学科及分支学科的发展,而且可以拉近人与计算机之间 的距离,促进人类科学地巨大发展,更好地为人类科技生活服务。