1.利用.tif图片文件生成.box文件
tesseract xi.ha.exp0.tif xi.ha.exp0 -l chi_sim batch.nochop makebox
这里chi_sim指中文,可换成相应文字
这里图片以xi.ha.exp0.tif命名
2.jTessBoxEditor工具进行修改
3.训练box 、生成字符集、等、
tesseract xi.ha.exp0.tif xi.ha.exp0 box.train
unicharset_extractor xi.ha.exp0.box
echo ha 0 0 0 0 0 >> font_properties
shapeclustering -F font_properties -U unicharset xi.ha.exp0.tr
mftraining -F font_properties -U unicharset -O xi.unicharset xi.ha.exp0.tr
cntraining xi.ha.exp0.tr
mv inttemp xi.inttemp
mv pffmtable xi.pffmtable
mv normproto xi.normproto
mv shapetable xi.shapetable
combine_tessdata xi.
4.拷贝已训练文件到tessract 调用文件中