OCR识别,也许这个词我们会稍感陌生,但事实上它和我们的生活、工作息息相关。尤其对于商务白领阶层而言,OCR是必不可少的工作助手。
所谓OCR识别,即是利用光学字符识别技术,对图像上的文字内容、符号等进行识别,转换为可编辑状态进行使用。例如,通过扫描仪将一份文档进行扫描,再通过OCR进行文字识别,那么即可对相关文字进行修改、调整。这种技术,会大大提升工作效率,如汉王、文通等企业,都是OCR领域的巨头,相关软件在商务办公领域有着广泛应用。
由此可见,OCR的目的很简单:对影像进行转换,让影像内的图形、表格和文字得以保存,并形成计算机文字,这会有效节约键盘输入的人力与时间。
早在20世纪60年代,OCR识别就已经开始进行探索,时至今日已经具有较为完善的平台和软件。尤其在物流、医疗、金融、保险、传统制造业等领域,OCR都有着广泛的应用。不过,在提升效率的同时,传统OCR的问题也越来越明显。
1.原始文件存在缺陷,直接影响OCR效果
传统OCR会将文件进行扫描,然后通过识别系统进行转换,这就意味着:如果原始文件存在明显污渍、歪斜、噪点等问题,那么就会直接造成识别效果极差,出现乱码等情况。
例如,很多时候,商业表格单据通常都会加盖印章,导致文字被遮盖,OCR识别时会出现明显的错误;再如,涉及到跨国经济的文件,通常会有中文、英文、法文等多种文字的组合,造成文字识别干扰,极大影响识别准确率。
尽管部分OCR软件,提供了后期调整倾斜度、旋转与翻转、橡皮擦等功能,但这些功能应用较为复杂,如果缺陷较为严重,反而还会造成效率的低下。同时,如果污渍较为严重,使用橡皮擦功能也无法进行修改,就会导致识别无法继续进行。
2.操作较为复杂,需要多设备支持
传统OCR识别,通常都采用“扫描仪+OCR软件”的方式,这就意味着我们不仅要安装OCR软件,还要学习扫描仪使用方式。当文件扫描结束后,还需要保存至本地电脑,再打开OCR软件操作。如果文件量较大,很容易出现文件归类偏差,影响工作效率;同时,如果扫描仪、OCR软件、电脑任何一个环节出现问题,就意味着整个识别工作都必须停滞。
3.对手写字体的识别错误率较高
对于计算机字体,传统OCR具有较强的识别能力,但是对于手写字体,OCR软件往往会陷入混乱,经常出现错字的现象。由于手写字体并不像计算机字体那样标准,所以面对手写文件,OCR识别通常往往只能望“字”兴叹,所有工作依然只能依靠手动输入完成。
繁琐与错误率,是传统OCR识别最大的弊端,制约了OCR识别的进一步发展。但随着人工智能系统引入OCR领域,这些让人头疼的烦恼,终将迎刃而解。(www.xing528.com)
随着人工智能时代的到来,几十年几乎一成不变的OCR识别领域,忽然有了全新的变化。这种变化,是颠覆式的,它让识别变得更加轻松,甚至即便不会使用扫描仪、OCR软件,我们也能快速完成识别工作。
例如,华为推出的智能OCR技术,就让OCR拥有了一双“智慧”的双眼。
与传统OCR相比,智能OCR明显的升级点就是——图像预处理技术。华为智能OCR系统就植入了Autoencoder自编码器,这个系统会有效分离文字、表格和其他各种图案,无需人工进行筛选,它就能自动完成分类,同时降低噪点,极大简化了后续的文字识别和版面分析过程。它会将整个图片分门别类地进行建档,帮助我们快速应用。
仅“分层”这一点,就是传统OCR无法胜任的。它不仅需要我们进行前期扫描,还需要专业的制图师通过PHOTOSHOP等软件进行后期处理,动辄就是数天的时间。
同时,针对各类复杂背景下的证件OCR,华为的智能OCR将会自动进行关键点捕捉,将有效的信息从复杂的背景中提取,并自动进行水平校对和角度修正。如果关联至指定页面,它还会根据定位自动进行填充,调整文字字号到校,适应框体。尤其对于繁琐复杂的数据表格来说,这种模式能够大大降低人工工作量,在极短时间内完成相关数据填写。
甚至,人工智能独有的深度学习功能,还会让手写字体的识别不再是“噩梦”。人工智能会不断学习各种写字习惯,只要给它一个数据,它就会在极短的时间内,完成这个字不下几百种的写法,可谓“最恐怖的学习达人”。任何一个字它都能在一秒钟内完成识别,即便如山一样的手写稿,也许不过一顿饭的时间,它即可全部完成。
如果由我们人来做,恐怕我们需要成立一个专业小组,花费数天时间才能完成初稿的输入。相信经历过这种工作的人,脑海中一定会浮现四个字:苦不堪言!
除了华为,如金山等公司,都加入到智能OCR的大军之中。除了有效提升正确率之外,降低繁琐的操作也成为了发展的重点方向。
当前,智能手机发展迅速,尤其智能摄像头的应用,可以最大限度保证图像、字体的清晰,并提供相应的修改工具,让照片更加清晰。智能OCR就结合这一技术,我们不必再打开笨重的扫描仪,只需将手机对准文件拍照,即可快速完成识别前的准备工作。智能OCR具有云储存功能,手机端拍摄完毕,PC端即完成同步,可以立刻进行识别,不再需要繁琐的硬件连接。
与此同时,各类在线智能OCR平台的诞生,让OCR的使用更加呈现出全民化的特点。例如当我们拿到一款复杂的名片时,不必再打开通讯录繁琐地输入,只需拍照并打开OCR APP,将图片上传,很快软件就会将姓名、电话、公司名称等重要内容完整识别,并自动保存于通讯录之中。这类在线OCR识别,尽管应用范围较窄,但实用度较高,可以有效满足我们快速识别文字信息的目的。
人工智能时代的OCR识别,已经不再局限于文本文字,它的应用已经扩展到身份证识别、护照识别、银行卡识别、名片识别、车牌识别等,对智慧城市、智慧金融、智能交通等同样具有非常有效的帮助。所以,在过去OCR识别仅限于“办公室一族”,但是未来它的身影,将会出现于我们身边任何一个角落。
“一键识别,无需修改”,当这样的智能识别OCR技术进入我们的工作之中,也许未来,文秘的工作也要让位于人工智能!
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。