机器学习-照片OCR应用

Photo Optical Character Recognition

机器学习流水线:

19机器学习流水线

滑动窗口

以特定的大小遍历整幅图片,传给分类器

在整幅图片中找到包含字符的矩形框

再次利用滑动窗口分离单个字符

获取大量数据以及人工生成

  1. 选取不同字体和背景进行人工合成

  2. 对现有数据进行字符拉伸、模糊等操作

    19获取更多数据的方法

1 用学习曲线做一个合理检验,查看更多的数据是否有用

2 需要花多少时间来获得当前10倍的数据量

天花板分析(上限分析)

在某几个环节给予正确的结果,查看改善后系统准确度变化。

决定集中精力来优化某些模块

19天花板分析

---------------- 本文结束 ----------------

本文标题:机器学习-照片OCR应用

文章作者:Pabebe

发布时间:2019年08月09日 - 13:49:30

最后更新:2020年06月16日 - 18:24:34

原始链接:https://pabebezz.github.io/article/5e39b6d7/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

0%