Java ProcessBuilder无法与wkhtmltopdf一起工作

4
我要尝试从网页中生成PDF文件,并通过Java ProcessBuilder在Centos OS上调用wkhtmltopdf。问题是,当我运行一个包含main方法的简单类时,该进程会以以下方式终止:
Command has terminated with status: 139
Output:

Error: Loading pages (1/6) ....

创建一个空的 PDF 文件(大小为 0B)

我在类中包含了一个方法,它会打印出我调用 wkhtmltopdf 时使用的参数。当我复制这个命令并在 bash 中运行它时,它能够正常工作并创建 PDF 文件。更重要的是:当我在 Windows 中运行完全相同的类时,它也能正常工作。什么原因导致错误代码 139?可能是 wkhtmltopdf 的 bug 还是我做错了什么?

以下是一些更多信息:

操作系统:

[root@host sandbox]# uname -a
Linux xxxxxx.com 2.6.32-279.22.1.el6.x86_64 #1 SMP Wed Feb 6 03:10:46 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux

[root@host bin]# ./wkhtmltopdf --version
Name:
  wkhtmltopdf 0.12.0 03c001de254b857f08eba80b62d4b6490ffed41d

我正在尝试使用进程构建器运行的命令:

 /root/wk/wkhtmltox/bin/wkhtmltopdf --window-status export-ready 
     --encoding UTF-8 
     --custom-header username username
     --custom-header password pass
     --run-script "<some correctly escaped js>" 
     http://xx.xx.xx.xx/url?param1=1&param2=2 
     /root/sandbox/test.pdf

生成PDF的代码:

public String exportToPdf(final String bookmarkableUrl) {
    String uuid = UUID.randomUUID().toString();

    final String fullUrl = "http://" + hostName + ":" + port + bookmarkableUrl;

    // .html extension at the end is very important - wkhtmltopdf won't read
    // the file if not there
    String generatedPdfPath = tempDirPath + "/EMF/" + uuid;
    try {
        ProcessBuilder processBuilder = new ProcessBuilder();
        processBuilder.command(prepareCommandArguments(fullUrl, generatedPdfPath + PDF_FILE_EXTENSION));
        Process start = processBuilder.start();
        // One has to handle the error stream 
        handleStream(start.getErrorStream());
        handleStream(start.getInputStream());
        // Wait until process is executed.
        start.waitFor();
    } catch (IOException | InterruptedException e) {
        throw new RuntimeException("Error while generating PDF", e);
    }
    return generatedPdfPath;
}

编辑:添加我用于使用命令参数创建列表的代码:

private List<String> prepareCommandArguments(String inputUrl, String outputUrl) {
    List<String> arguments = new ArrayList<>(15);
    // absolute path to the wkhtmltopdf executable
    arguments.add(wkhtmltopdfLocation);
    // Wait until window.status is equal to this string before rendering page
    arguments.add("--window-status");
    arguments.add("export-ready");
    // Set the default text encoding, for input
    arguments.add("--encoding");
    arguments.add("UTF-8");
    // Set an additional HTTP header for system username
    arguments.add("--custom-header");
    arguments.add("username");
    arguments.add(exportUsername);
    // Set an additional HTTP header for system user password 
    arguments.add("--custom-header");
    arguments.add("password");
    arguments.add(exportPassword);
    // Run this additional javascript after the page is done loading
    // Used to remove irrelevant divisions and spanning of 
    // the html page, leaving only the print preview of the document
    arguments.add("--run-script");
    arguments.add(getScriptFromFile(jsFilePath));
    // Bookmarkable url of the document 
    arguments.add(inputUrl);    
    // Path to the generated pdf
    arguments.add(outputUrl);
    return arguments;
}

在Process.start()之前,System.out.println(processBuilder.command())的输出结果是:
/root/wk/wkhtmltox/bin/wkhtmltopdf, --window-status, export-ready, --encoding, UTF-8, --custom-header, username, admin, --custom-header, password, admin, --run-script, "\$('.idoc-comments-column').remove(); \$('.idoc-left-column').remove(); \$('.idoc-left-column').remove(); \$('#topHeader').remove(); \$('#header').remove(); \$('.tree-header.breadcrumb_header').remove(); \$('.idoc-middle-column.pull-left.idoc-first-row').remove(); \$('.idoc-middle-column.pull-left').remove(); \$('.pull-left.text-center').remove(); \$('html').addClass('print-override-overflow'); \$('.idoc-editor').css('width', '80%'); \$('.idoc-editor').css('font-size', '14px'); \$('.idoc-editor').css('max-width', 'none'); \$('.idoc-editor').css('margin-left', '10%'); \$('.idoc-editor').css('margin-right', '10%'); \$('.idoc-editor').css('margin-top', '5%'); \$('.idoc-editor').css('margin-bottom', '5%');", http://xx.xx.xx.xx:xxxx/url/page.jsf?param1=1&param2=2, /root/sandbox/file.pdf

@A4L 我已经添加了代码,它并不特别,只是将参数添加到一个List<String>中。 - Ivo
1
你的 getScriptFromFile 方法返回一个被双引号包裹的字符串。你确定脚本文件本身没有任何双引号,可能会提前终止外部的双引号吗? - shazin
1
根据此帖子的说法,程序似乎存在分段故障,因此是一个漏洞。而根据此帖子的说法,升级到另一个版本已经解决了这个问题。 - A4L
1
如果在 processBuilder.start() 之前放置 System.out.println(processBuilder.command()),会输出什么? - pingw33n
1
我认为你不需要在ProcessBuilder中进行任何shell转义。尝试将JS代码原样传递,不要转义美元符号和双引号。 - pingw33n
显示剩余9条评论
1个回答

3
您不需要使用ProcessBuilder进行任何Shell转义。尝试直接传递JS代码,无需转义美元符号和双引号即可。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接