自写服务端-客户端 实现tesseract-ocr功能——项目规划
跟据老师需求,我要实现一个可以通过移动端实现一个有一下功能的小项目:
OCR图像识别系统
1.系统介绍:
该系统以识别图片或PDF文件中文字为目标,可以对手写体和打印体进行识别,并具备自我训练的功能,从而提高其识别的正确率。
客户端:可用web实现或手机app
服务端:远程服务器
OCR 引擎:谷歌tesseract-ocr引擎
2.系统功能:
系统能够通过客户端接受到所要识别的图片或PDF文件,并对其进行识别,转换成计算机文字,将结果返回到客户端。在客户端可以人工对其进行更错,然后将错误的文字返回到服务端,服务端将把错误的文字和相应图像储存到database中,当下次再次遇到该字,可以正确识别,以提高其识别正确率。
3.功能模块架构:
4.模块介绍:
文件I/O模块:
通过(移动)PC终端(web或app)接受到用户传进的文件,并通过发送到远程的服务器。当文件被处理后,返回其生成的文件,并通过(移动)PC终端显示出来。
OCR模块:
对接受到的图片或PDF文件进行处理,图像识别,输出识别出的计算机文字。
人工更正错字模块:
将识别出的计算机文字返回到客户端,由客户端人工对OCR模块输出的计算机文字进行更正,保存更正的文字及其对应的图像。
训练模块:
对人工更正的错字进行储存整理与分析,并将其图像和其正确的文字储存到database中,一一对应,当该系统再次与遇到该类错字的时候,能保证其再次遇到该字,进行正确转化。当其正确率带到一定程度,就终止训练,允许小程度的错误,以提高程序效率。