什么是手写识别
编辑手写识别(HWR),也称为手写文本识别(HTR),是计算机从纸质文档,照片,触摸屏和其他设备等来源接收和解释可理解的手写输入的能力。可以通过光学扫描(光学字符识别)或智能单词识别从一张纸上“离线”感知书写文字的图像。可替代地,笔尖的移动可以例如通过基于笔的计算机屏幕表面“在线”被感测,这是通常更容易的任务,因为存在更多线索。手写识别系统可以处理格式,对字符进行正确的分割并找到最合理的单词。
离线识别
编辑脱机手写识别涉及将图像中的文本自动转换为可在计算机和文本处理应用程序中使用的字母代码。通过这种形式获得的数据被视为笔迹的静态表示。离线手写识别相对困难,因为不同的人具有不同的手写风格。并且,到目前为止,OCR引擎主要集中于机器打印的文本和手工“打印”文本的ICR。
传统技术
字符提取
脱机字符识别通常涉及扫描过去某个时候编写的表格或文档。这意味着需要提取扫描图像中包含的各个字符。存在能够执行此步骤的工具。但是,此步骤中存在几个常见的缺陷。最常见的情况是,将连接的字符作为包含两个字符的单个子图像返回时。这在识别阶段引起了主要问题。还有许多降低连接字符风险的算法。
字符识别
提取单个字符后,将使用识别引擎来识别相应的计算机字符。当前有几种不同的识别技术。
特征提取
特征提取的工作方式与神经网络识别器类似。但是,程序员必须手动确定他们认为重要的属性。这种方法使识别器可以更好地控制识别中使用的属性。但是,使用这种方法的任何系统都比神经网络需要更多的开发时间,因为不会自动学习特性。
现代技术
传统技术着重于对单个字符进行分割以进行识别,而现代技术着重于识别经分割的文本行中的所有字符。特别地,他们专注于能够学习视觉特征的机器学习技术,从而避免了先前使用的有限特征工程。最先进的方法使用卷积网络来提取文本行图像的多个重叠窗口上的视觉特征,RNN使用这些窗口来产生字符概率。
在线识别
编辑在线手写识别涉及在特殊的数字化仪或PDA上书写时自动转换文本,在此传感器会拾取笔尖的移动以及上/下笔切换。这种数据称为数字墨水,可以视为手写的数字表示。所获得的信号被转换为可在计算机和文本处理应用程序中使用的字母代码。
在线手写识别界面的元素通常包括:
研究
编辑手写识别拥有活跃的学术研究社区。xxx的手写识别会议是在偶数年举行的国际手写识别领域国际会议(ICFHR)和在奇数年举行的国际文档分析和识别会议(ICDAR)。这两个会议均得到IEEE和IAPR的认可。研究的活跃领域包括:
- 在线识别
- 离线识别
- 签名验证
- 邮政地址解释
- 银行支票处理
- 作家认可
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/107582/