禁止或删除Python Tabula-py警告

21

我有使用tabula-py的Python代码,用于读取PDF并提取文本,然后通过tabula-py将其转换为表格形式。但是它给了我一个警告。

Nov 15, 2017 3:40:23 PM org.apache.pdfbox.pdmodel.font.PDSimpleFont toUnicode
WARNING: No Unicode mapping for .notdef (9) in font Helvetica

这个警告来自于tabula-py,而Tabula-py是用Java编写的。所以我不能简单地使用-W ignore来抑制上述警告。

有没有办法去除或抑制上述警告?


我认为这与此相关:https://github.com/tabulapdf/tabula-java/issues/115 - Elisha
我已经使用了参数silent=True。然而,它并没有抑制任何警告信息...有人有答案吗? - hackwithharsha
PDF文件有问题吗?请查看https://issues.apache.org/jira/plugins/servlet/mobile#issue/PDFBOX-3296。您能分享一个产生此问题的样本PDF吗? - user650654
3个回答

9

这似乎不起作用,我仍然会在每个页面上看到以下内容: “Picked up _JAVA_OPTIONS: -Djavax.net.ssl.trustStore=C:\Windows\Sun\Java\Deployment\trusted.certs” - Cazforshort

3
Tabula 提供了一个内置功能,可以抑制 Java 的警告信息。
在请求中尝试使用 silent=True 参数:
tabula.read_pdf("/path/to/sample.pdf", pages="all", silent=True)

文档来源


0

可以尝试这个:

import warnings
warnings.filterwarnings('ignore')

在这种情况下,警告来自Java。 - Brown Bear
1
正如@BearBrown所说,警告来自于tabula-java,而warnings无法解决。 - chezou

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接