我一直在使用Tesseract 3.0.2 OCR SDK进行图像文本提取。但是,如果我使用中文文本图像并通过OCR处理,那么Tesseract不会向我提供中文字符,而是得到数字和英文字符。但是我需要显示在图像中使用的中文字符。
如何实现这一点?有没有办法获得中文字符而不是其他字符?
如何实现这一点?有没有办法获得中文字符而不是其他字符?
Tesseract* tesseract= [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"chi_sim"];
如果您遇到任何问题,您可以从https://github.com/aryansbtloe/ExperimentWithTesseract.git下载我的tessaract(支持中文语言)实验。
我已经测试过了,希望您会觉得这个实验有用。