Photo Optical Character Recognition
机器学习流水线:
滑动窗口
以特定的大小遍历整幅图片,传给分类器
在整幅图片中找到包含字符的矩形框
再次利用滑动窗口分离单个字符
获取大量数据以及人工生成
选取不同字体和背景进行人工合成
对现有数据进行字符拉伸、模糊等操作
1 用学习曲线做一个合理检验,查看更多的数据是否有用
2 需要花多少时间来获得当前10倍的数据量
天花板分析(上限分析)
在某几个环节给予正确的结果,查看改善后系统准确度变化。
决定集中精力来优化某些模块