首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

联机手写汉字识别的相关算法

联机手写汉字识别的相关算法

在联机手写汉字识别系统中,基于结构特征模式表示的汉字,往往会从输入得到待识别的特征向量,而对于标准汉字都已经定义了参考的特征模式。只要把待识别的特征向量与标准的参考模式进行匹配,即可得出相应的汉字。那么采用什么方法来进行匹配,才能使汉字识别得到更高的识别率与性能呢。这里参考了一些相关论文,列举几种相关的方法。
   “结构匹配方法又可以分为四类:DP(DynamicProgramming,动态规化)匹配,笔段对应,相关性匹配及基于知识的匹配。DP匹配是基于序列的匹配,因此其是笔顺依赖的。DP匹配是寻找两个输入字符串的最小编辑距离。在联机手写识别中,由于输入是点的时序列,这种DP匹配也叫做动态时间扭屈(DynamicTimeWarp,简称DTW)。DP匹配是一个成熟的技术,但是利用其是否能具有显著的分类性,则取决于DTW的具体定义及判别方法的选取。笔段对应技术同样也是将输入笔段与模板原型中的笔段对应,将所有笔段间距离的总和作为最终模式之间的距离。与DP不同的是,有时它允许按照一定的规则,在局部进行笔段先后顺序的交换。笔段对应与相关性匹配的区别在于,它不考虑笔段间是否相交等相互关系。笔段的对应过程中有时要用到DP技术。与此相关的另一个技术是继承匹配,它可以提高匹配的速度,当一些笔段或是基元被一些汉字所共享时,分类器可以变为一个决策树或是网络。当一个笔段或是基元被确定时,字符识别器就在树或网络上前进一条边。相关性匹配是在一定的关系限定下寻找对应。它可以被认为是一个一致性标记问题,而使用启发式搜索技术或是松弛标记技术来解决。一种很著名的启发式搜索技术A*算法。基于知识的匹配是事先将字符的结构信息作为启发规则或是限制。这种限制可以有效的减小结构匹配的搜索空间,而且基于知识的方法也被用于对笔段序列进行重新排序,基元检测及字符匹配等。”(该段内容摘抄自《基于笔段特征与方向特征的联机手写汉字识别研究》)
   其中,DP动态规化匹配方法在多论文中都有被提到用作联机手写汉字的识别。在《模式识别》一书中,翻看了第八章《模板匹配》。其中所讲的“基于最优路径搜索技术的测度”就是动态规化匹配方法,其中还讲到了在语音识别中的应用例子。可以发现,实时的语音识别与联机的手写识别具有一定的相似性。而且考虑其最优匹配的特性,对汉字识别的模板匹配有很大的作用。
   假设标准模板中参考模式P1={1,2,3}和P2={2,2,3}。由手写输入得到的待识别特征向量是C={1,2,3}。通过计算D(P1,C)值和D(P1,C),小的D值表示输入的待识别模式与该参考模式匹配度更高。所以P1和C能很好的匹配中。如果由于特征提取有误或者输入有误,取得失真的待识别模式是C={4,2,3}或{2,3}。那么待识别的模式和预期汉字的参考模式还是具有相当高的匹配度的。当然如果失真后的C={2,2,3},那么C与P1的匹配度就没有P2高了。所以该方法也是有它的适用范围和约束性的。首先该方法是时序限制的,并不是无序匹配的;其次该方法对距离的计算要进行设计;最后是应该有一个识别范围阙值。
  从实际角度来看,个人觉得该方法适用于联机手写的汉字识别。其适用性较强,符合基于笔段或笔划特征的汉字识别;再加上它的难度适中,适合现阶段的本科生学习与实现。
继承事业,薪火相传
返回列表