GroupBlog

自写服务端-客户端实现tesseract-ocr功能——项目规划

跟据老师需求，我要实现一个可以通过移动端实现一个有一下功能的小项目：

OCR图像识别系统

1.系统介绍：

该系统以识别图片或PDF文件中文字为目标，可以对手写体和打印体进行识别，并具备自我训练的功能，从而提高其识别的正确率。

客户端：可用web实现或手机app

服务端：远程服务器

OCR 引擎：谷歌tesseract-ocr引擎

2.系统功能：

系统能够通过客户端接受到所要识别的图片或PDF文件，并对其进行识别，转换成计算机文字，将结果返回到客户端。在客户端可以人工对其进行更错，然后将错误的文字返回到服务端，服务端将把错误的文字和相应图像储存到database中，当下次再次遇到该字，可以正确识别，以提高其识别正确率。

3.功能模块架构：

4.模块介绍：

文件I/O模块：

通过（移动）PC终端（web或app）接受到用户传进的文件，并通过发送到远程的服务器。当文件被处理后，返回其生成的文件，并通过（移动）PC终端显示出来。

OCR模块：

对接受到的图片或PDF文件进行处理，图像识别，输出识别出的计算机文字。

人工更正错字模块：

将识别出的计算机文字返回到客户端，由客户端人工对OCR模块输出的计算机文字进行更正，保存更正的文字及其对应的图像。

训练模块：

对人工更正的错字进行储存整理与分析，并将其图像和其正确的文字储存到database中，一一对应，当该系统再次与遇到该类错字的时候，能保证其再次遇到该字，进行正确转化。当其正确率带到一定程度，就终止训练，允许小程度的错误，以提高程序效率。