这是我在这里的第一篇帖子。
我一直在使用PaddleOCR编写Python脚本从照片中获取文本。显然,在Windows x64上一切都按预期工作。 我成功地在我的MacBook Pro M1上安装了paddleocr,手动编译了一些依赖项,如MuPdf和lanms-neo,但是,当paddleocr尝试处理图像时,脚本永远挂起,CPU占用率达到100%,但什么也没有发生。我已经在我的Windows机器上测试了上面的示例,并且它立即运行。有人有类似的经验并知道如何使其在我的M1上工作吗?
from paddleocr import PaddleOCR
ocr = PaddleOCR(lang='en')
lines = ocr.ocr('<path to image>')
text = ''
for string in lines:
text += " " + string[1][0].replace(' ', '')
我尝试了不同的Python版本,3.9.6是唯一能在M1上与PaddleOCR正常工作的版本。使用pip3安装paddleocr包并不直接。在安装它们的Python包之前,我不得不手动编译MuPdf 1.19、lanms-neo和freetype2的wheels,因为即使安装了python-dev,它们仍然无法获取一些头文件。安装成功,没有错误,也没有缺少依赖项。使用pip3安装PaddlePaddle包时没有问题。
brew install mupdf swig
- Brown nightingale