PaddleOCR 在 MacOs Ventura M1 上卡住了

4

这是我在这里的第一篇帖子。

我一直在使用PaddleOCR编写Python脚本从照片中获取文本。显然,在Windows x64上一切都按预期工作。 我成功地在我的MacBook Pro M1上安装了paddleocr,手动编译了一些依赖项,如MuPdf和lanms-neo,但是,当paddleocr尝试处理图像时,脚本永远挂起,CPU占用率达到100%,但什么也没有发生。我已经在我的Windows机器上测试了上面的示例,并且它立即运行。有人有类似的经验并知道如何使其在我的M1上工作吗?

from paddleocr import PaddleOCR

ocr = PaddleOCR(lang='en')
lines = ocr.ocr('<path to image>')
text = ''
    for string in lines:
        text += " " + string[1][0].replace(' ', '')

我尝试了不同的Python版本,3.9.6是唯一能在M1上与PaddleOCR正常工作的版本。使用pip3安装paddleocr包并不直接。在安装它们的Python包之前,我不得不手动编译MuPdf 1.19、lanms-neo和freetype2的wheels,因为即使安装了python-dev,它们仍然无法获取一些头文件。安装成功,没有错误,也没有缺少依赖项。使用pip3安装PaddlePaddle包时没有问题。

2个回答

1
pip install https://github.com/pymupdf/PyMuPDF/archive/master.tar.gz

答案来源请查看这里


请问您能否详细说明一下您的回答? - Hissaan Ali
1
你引用的注释还包括一个重要步骤: brew install mupdf swig - Brown nightingale

1

我有一台M1 Mac,上周使用以下版本使其正常工作:

pip install paddlepaddle==2.3.2
pip install paddleocr==2.6.1.0
pip install opencv-python==4.5.5.64

它起作用了。我卸载了之前的版本并安装了这些新版本。在我的情况下,我不需要指定opencv的特定版本。 - Hissaan Ali

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接