如何在Python中修复tabula.read_pdf()函数的错误

Question

如何在Python中修复tabula.read_pdf()函数的错误

4

我将尝试用Python(Pycharm)从PDF文件中提取表格。

我已经尝试了以下代码：

 from tabula import wrapper
 object = wrapper.read_pdf("C:/Users/Ojasvi/Desktop/sample.pdf")

最初的回答

然而，我遇到的错误是：

"tabula.errors.JavaNotFoundError: `java` command is not found from this Python process. Please ensure Java is installed and PATH is set for `java`"

- Ojasvi Jain

请阅读位于 https://pypi.org/project/tabula-py 的“使tabula-py工作”部分。 - balderman

我认为这两篇文章应该会对你有所帮助：https://stackoverflow.com/questions/29204638/how-to-set-java-path-on-windows 和 https://dev59.com/Q3I-5IYBdhLWcg3wy7wd。如果可以的话，请告诉我。 - dome

工作了！谢谢！@dome - Ojasvi Jain

我已经发布了答案。你能否给我点赞并接受它，因为我解决了你的问题？ - dome

你需要安装Amazon Corretto，这是一个开源的JDK。这个过程帮助我解决了问题。 - Deepak Harish

显示剩余2条评论

2个回答

1

我已经设置好了Java并配置了Java路径，但仍然遇到相同的错误。花了半天时间后，我采取了以下措施，一切都正常了。

我正在使用Python环境并在Python环境中运行Tabula。我遇到了问题中提到的错误。

我更改了我的Python环境，基本上是默认的没有环境，所有东西都正常工作了。我认为一旦我们进入Python环境，Tabula就无法检测到Java。

- Tokci

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- dome · Accepted Answer

您可能需要将java添加到系统path中。您可以查看以下帖子，它们应该能帮助您解决问题：