如何在Python中修复tabula.read_pdf()函数的错误

4
我将尝试用Python(Pycharm)从PDF文件中提取表格。
我已经尝试了以下代码:
 from tabula import wrapper
 object = wrapper.read_pdf("C:/Users/Ojasvi/Desktop/sample.pdf")

最初的回答
然而,我遇到的错误是:
"tabula.errors.JavaNotFoundError: `java` command is not found from this Python process. Please ensure Java is installed and PATH is set for `java`"

请阅读位于 https://pypi.org/project/tabula-py 的“使tabula-py工作”部分。 - balderman
我认为这两篇文章应该会对你有所帮助:https://stackoverflow.com/questions/29204638/how-to-set-java-path-on-windows 和 https://dev59.com/Q3I-5IYBdhLWcg3wy7wd。如果可以的话,请告诉我。 - dome
工作了!谢谢!@dome - Ojasvi Jain
我已经发布了答案。你能否给我点赞并接受它,因为我解决了你的问题? - dome
你需要安装Amazon Corretto,这是一个开源的JDK。这个过程帮助我解决了问题。 - Deepak Harish
显示剩余2条评论
2个回答

4

1
我已经设置好了Java并配置了Java路径,但仍然遇到相同的错误。花了半天时间后,我采取了以下措施,一切都正常了。
我正在使用Python环境并在Python环境中运行Tabula。我遇到了问题中提到的错误。
我更改了我的Python环境,基本上是默认的没有环境,所有东西都正常工作了。我认为一旦我们进入Python环境,Tabula就无法检测到Java。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接