使用PDFminer将PDF转换为HTML

5

我正在尝试使用pdfminer命令行工具将pdf文件转换为html文件,运行以下命令:

pdf2txt.py -o output.html -t html casino.pdf

我得到了以下错误:
Traceback (most recent call last):
  File "/usr/local/bin/pdf2txt.py", line 101, in <module>
    if __name__ == '__main__': sys.exit(main(sys.argv))
  File "/usr/local/bin/pdf2txt.py", line 87, in main
    layoutmode=layoutmode, laparams=laparams, outdir=outdir)
TypeError: __init__() got an unexpected keyword argument 'outdir'

我以前使用过这个库,它完美地发挥作用。但现在我真的很难理解发生了什么。
这是该库的链接:http://www.unixuser.org/~euske/python/pdfminer/index.html
2个回答

2
在文件/usr/local/bin/pdf2txt.py的第98行中,删除,debug=debug,它就可以工作了。我不确定为什么代码作者在错误的地方插入了这个参数。

2

删除并重新安装库后,似乎正常工作了。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接