Tesseract检测线条。

4

我正在使用Objective-C开发OCR应用程序。目前,我的图像识别效果相当不错,但我希望检测行和列以获得更好和更美观的结果。

我的项目中包括tesseract库和leptonica库。我查看了tesseract的baseapi.h文件,我认为我需要的是名为

    Boxa* GetTextlines(Pixa** pixa, int** blockids);

我不确定如何在我的项目中使用这个函数,也不确定它是否是我正在寻找的正确函数。有人能提供一些见解吗?

谢谢!

1个回答

0

检测页面元素(例如块、段落、行、单词等)的标准方法是使用PageIterator类。我不知道如何在Objective-C中实现,但这里有一个C++示例代码可供参考:

tesseract::ResultIterator* ri = tess->GetIterator();
while (ri->Next(tesseract::RIL_LINE)) {
  // Do whatever you want with that line
  // Recognize line's text
  char* ctext = ri->GetUTF8Text(tesseract::RIL_LINE);
  // Get line's bounding box
  ri->BoundingBox(tesseract::RIL_WORD, &left, &top, &right, &bottom);
}

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接