业精于勤，荒于嬉；行成于思，毁于随。

机器学习-照片OCR应用

发表于 2019-08-09 | 分类于 machine learning | 次阅读

字数统计: 195 字 | 阅读时长 ≈ 1 分钟

Photo Optical Character Recognition

机器学习流水线：

19机器学习流水线

滑动窗口

以特定的大小遍历整幅图片，传给分类器

在整幅图片中找到包含字符的矩形框

再次利用滑动窗口分离单个字符

获取大量数据以及人工生成

选取不同字体和背景进行人工合成
对现有数据进行字符拉伸、模糊等操作

1 用学习曲线做一个合理检验，查看更多的数据是否有用

2 需要花多少时间来获得当前10倍的数据量

天花板分析（上限分析）

在某几个环节给予正确的结果，查看改善后系统准确度变化。

决定集中精力来优化某些模块

19天花板分析

---------------- 本文结束 ----------------

本文标题:机器学习-照片OCR应用

文章作者:Pabebe

发布时间:2019年08月09日 - 13:49:30

最后更新:2020年06月16日 - 18:24:34

原始链接:https://pabebezz.github.io/article/5e39b6d7/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际转载请保留原文链接及作者。

0%