是否有针对屏幕截图中的文本识别而非扫描文本设计的OCR引擎?我正在进行一个项目,需要检索和识别应用程序中的文本,在我的尝试中,没有任何OCR引擎在截图方面表现良好。
理想情况下,该引擎应能够处理颜色和背景噪声,但如果没有类似的引擎,我可能需要做一些让步。
它需要与.NET兼容,要么是用.NET编写的,要么具有.NET可调用的API。
是否有针对屏幕截图中的文本识别而非扫描文本设计的OCR引擎?我正在进行一个项目,需要检索和识别应用程序中的文本,在我的尝试中,没有任何OCR引擎在截图方面表现良好。
理想情况下,该引擎应能够处理颜色和背景噪声,但如果没有类似的引擎,我可能需要做一些让步。
它需要与.NET兼容,要么是用.NET编写的,要么具有.NET可调用的API。
private void ConvertBitmapToTIF(Bitmap convert)
{
ImageCodecInfo codecInfo = GetEncoderInfo("image/tiff");
System.Drawing.Imaging.Encoder encodeCom = System.Drawing.Imaging.Encoder.Compression;
System.Drawing.Imaging.Encoder encodeBPP = System.Drawing.Imaging.Encoder.ColorDepth;
EncoderParameters parms = new EncoderParameters(2);
EncoderParameter param0 = new EncoderParameter(encodeCom, (long)EncoderValue.CompressionNone);
EncoderParameter param1 = new EncoderParameter(encodeBPP, 8L);
parms.Param[0] = param0;
parms.Param[1] = param1;
convert.Save("output.tif", codecInfo, parms);
}
你基本上在寻找各种研究人员尝试过并且有些成功的验证码绕过工具。
另一种方法是使用平滑算法来插值96 DPI截图并将其转换为300 DPI(例如,使用Photoshop),然后使用标准OCR工具。
使用第一个答案(OCR软件),对于屏幕截图,您可以发送PRNTSCRN(打印屏幕)字符,然后将剪贴板(bmp)的内容转换为tiff。
希望这能对您的事业有所帮助。