我一直在尝试创建一个算法,从汉字中提取笔画信息。我尝试了各种方法,但没有一个很令人满意,可能是因为我对图形算法的知识有限。
基本上,我有以下数据:
汉字,可以是像素或矢量(黑色)
笔画的整体轮廓,以像素表示(红色)
整体方向(蓝色箭头)。
从这个图中,我正在尝试提取笔画。如果你必须使用现有数据进行此操作,你会使用哪些方法?你能想到任何自动提取笔画的方法吗?
我一直在尝试创建一个算法,从汉字中提取笔画信息。我尝试了各种方法,但没有一个很令人满意,可能是因为我对图形算法的知识有限。
基本上,我有以下数据:
汉字,可以是像素或矢量(黑色)
笔画的整体轮廓,以像素表示(红色)
整体方向(蓝色箭头)。
从这个图中,我正在尝试提取笔画。如果你必须使用现有数据进行此操作,你会使用哪些方法?你能想到任何自动提取笔画的方法吗?
我不认为你能够设计出一个没有错误的算法。有些字的一部分看起来相同,但并不等同于相同的笔画数。例如,从视觉上讲(当然不是语言学上),马在技术上也包括口。
我唯一的想法是将区域分成小区域,并编写算法尝试按照笔画的设置顺序进行操作,但我无法想象这会很容易,而且根据字体的不同,有些线条会延伸到不应该存在的区域。
此外,由于其不寻常的布局,还有一些字符无法与算法配合良好,只有遵循笔画顺序的严格规则才能得到正确的笔画数:例如凹和凸。
我必须问一下 - 笔画数是每个汉字的基本信息 - 为什么需要创建一个计算它的算法?是否更容易进行字符识别,然后在自定义字典中查找字符的笔画数?
我认为最简单的可行方法是:
完成上述步骤后,您可以进一步研究更复杂的策略,以选择一个好的、依赖于线段的T值。