报纸的文字量大,字体相对较小,对于扫描识别是一个挑战。采用300dpi黑白扫描模式进行扫描后,我们首先对报纸的版面进行分析,从分析结果来看,由文字的位置基本都可以识别出来,反白字体则被识别为图片。
报纸版面分析 |
我们对其中的一段文字进行识别,一共153个字符,只有一个字识别错误,正确率达到99.35%。同时,识别结果对于“人”和“入”这样难以区分的字符都识别正确。
识别效果 |
报纸的文字量大,字体相对较小,对于扫描识别是一个挑战。采用300dpi黑白扫描模式进行扫描后,我们首先对报纸的版面进行分析,从分析结果来看,由文字的位置基本都可以识别出来,反白字体则被识别为图片。
报纸版面分析 |
我们对其中的一段文字进行识别,一共153个字符,只有一个字识别错误,正确率达到99.35%。同时,识别结果对于“人”和“入”这样难以区分的字符都识别正确。
识别效果 |