Ubuntu 14.04下用OCRFeeder进行中文OCR-服务器评测

OCRFeeder是我用过的Linux下OCR软件中中文识别较好的一个。它基于tesseract，人机界面友好可惜的是tesseract发展好像很慢。

先安装ocrfeeder，方法很简单仓库里就有0.7.11版，OCR引擎选择上有大改进这个后面说。

2014-04-16 17:42:13 的屏幕截图 2014-04-16 17:41:41 的屏幕截图

装完ocrfeeder再装中文的OCR识别库，随带安装的只有英文的识别库。

2014-04-16 17:41:23 的屏幕截图

我安装的是简体中文识别库，从上图看可选的识别库是很多的。

接下来启动程序

2014-04-16 17:56:53 的屏幕截图

更多详情见请继续阅读下一页的精彩内容： http://www.linuxidc.com/Linux/2014-04/100339p2.htm

添加一个图片开始识别

2014-04-16 18:17:31 的屏幕截图

怎没没结果？看看引擎设置

2014-04-17 10:20:46 的屏幕截图

2014-04-17 09:46:19 的屏幕截图

这个版本添加了语言映射，这样就可以根据你当前会话的语种选取引擎，可是有中文映射呀，检查下tesseract的参数

2014-04-17 09:48:01 的屏幕截图

参数没变啊，原来安装包虽然是chi-sim但语言名是chi_sim修改下OCR引擎定义

2014-04-17 09:45:52 的屏幕截图

再识别，OK！

2014-04-17 09:45:27 的屏幕截图

tesseract对于混排识别还是不理想，只有期待他的改进了。

更多Ubuntu相关信息见Ubuntu 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=2

Ubuntu 14.04下用OCRFeeder进行中文OCR