24 Jun

OCR技术浅探：5. 文本切割

By 苏剑林 | 2016-06-24 | 59468位读者 |

经过上一步，得到单行的文本区域之后，我们就可以想办法将单行的文本切割为单个的字符了. 因为第三步的模型师针对单个的字符建立的，因此这一步也是必须的.

均匀切割 #

基于方块汉字的假设，事实上最简单的切割方法是均匀切割，也就是说不加任何判断，直接按照高度来将单行文本切割为一个个的正方形图片. 这种思路可以应对大部分的单行文本，如下图上.

均匀切割成功

均匀切割失效

当然，均匀切割的弊端也是很明显的. 大多数汉字都是方块汉字，但多数英语和数字都不是，因此如果出现中英文混排的时候，均匀切割就失效了，如上图下.

统计切割 #

从图15中可以看出，经过前面的操作，字与字都被很好地分离开了. 因此，另外一种比较简单的思路是对单行的文字图片进行垂直方向的求和，和为0的所在的列就是被切割的的列.

用这种统计的思路可以很好地解决中英文混排的单行文字图片分割的问题，但是它也存在一定的弊端. 最明显的就是诸如“小”、“的”等字就被切割开为两部分了.

前后比较 #

一个更好的思路是结合前面两部分结果，通过比较前后两部分区域是否组成方形来确定是否切割. 具体步骤是：

1. 通过统计求和的思路，得出候选的切割线；
2. 如果该候选切割线到左右两条候选切割线的距离之和超过~~（宽）~~高长度的1.2倍，那么该候选切割线确定为切割线；
3. 如果得到的区域是一个明显的长条矩形，并且没办法按照上面两个步骤切割，那个就均匀切割.

这三个步骤比较简单，基于两个假设：1、数字、英文字符的底与高之比大于60%；2、汉字的底与高之比低于1.2. 经过测试，该算法可以很好地用于前面步骤所提取的图片文本特征的分割.

转载到请包括本文地址：https://kexue.fm/archives/3823

更详细的转载事宜请参考：《科学空间FAQ》

如果您还有什么疑惑或建议，欢迎在下方评论区继续讨论。

如果您觉得本文还不错，欢迎分享/打赏本文。打赏并非要从中获得收益，而是希望知道科学空间获得了多少读者的真心关注。当然，如果你无视它，也不会影响你的阅读。再次表示欢迎和感谢！

如果您需要引用本文，请参考：

苏剑林. (Jun. 24, 2016). 《OCR技术浅探：5. 文本切割》[Blog post]. Retrieved from https://kexue.fm/archives/3823

@online{kexuefm-3823,
        title={OCR技术浅探：5. 文本切割},
        author={苏剑林},
        year={2016},
        month={Jun},
        url={\url{https://kexue.fm/archives/3823}},
}

分类：信息时代标签：图像, OCR, 文字 8 评论

< OCR技术浅探：4. 文字定位 | OCR技术浅探：6. 光学识别 >

你也许还对下面的内容感兴趣

发表你的看法

ujx

December 14th, 2017

非常感谢作者的分享，有个小疑问，2. 如果该候选切割线到左右两条候选切割线的距离之和超过宽长度的1.2倍，那么该候选切割线确定为切割线；这里是否为超过高长度的1.2倍

回复评论

苏剑林发表于 December 14th, 2017

应该是，感谢你的仔细阅读。

回复评论

OCR技术浅探：基于深度学习和语言模型的印刷文字OCR系统 R11; 99阿狸云

April 18th, 2018

[...]OCR技术浅探：5. 文本切割[...]

回复评论

xzops

June 17th, 2020

谢谢大神的分享，最近在做OCR，遇到中英文切割，遇到像"H性"这样字符分割。
阅读到这片好文。

下面有个疑问，请解答一下，谢谢

数字、英文字符的底与高之比大于60%；2、汉字的底与高之比低于1.2. 经过测试

切割时，底和高，是什么含义？思考很久没有明白。

回复评论

苏剑林发表于 June 17th, 2020

自己看参考代码吧，我也忘记了～

回复评论

OCR技术浅探：基于深度学习和语言模型的印刷文字OCR系统 - SEOOS技术门户

November 17th, 2022

[...]OCR技术浅探：5. 文本切割[...]

回复评论

OCR技术浅探：基于深度学习和语言模型的印刷文字OCR系统 - 站壳网

November 17th, 2022

[...]OCR技术浅探：5. 文本切割[...]

回复评论

OCR技术浅探：基于深度学习和语言模型的印刷文字OCR系统 R11; 94007技术网

April 1st, 2023

[...]OCR技术浅探：5. 文本切割[...]

回复评论

内容速览

均匀切割

统计切割

前后比较

智能搜索

支持整句搜索！网站自动使用结巴分词进行分词，并结合ngrams排序算法给出合理的搜索结果。

SEARCH

MENU

CATEGORIES

NEWPOSTS

COMMENTS

USERLOGIN

OCR技术浅探：5. 文本切割

均匀切割 #

统计切割 #

前后比较 #

你也许还对下面的内容感兴趣

内容速览

智能搜索

热门标签

随机文章

最近评论

友情链接