使用POI将HTML数据表导出到Excel

3

请问,我们如何处理这种情况:我们有一些以纯HTML表格形式呈现的数据,需要将其转换为适当的Excel表格。

这是我编写的源代码,但我遇到了一个异常——> 错误:无效的文件头签名;读取0x6D78206C6D74683C,期望0xE11AB1A1E011CFD0|#]

    // Resulting byte stream from the DB
    resultBytes = dokumentSession.getXlsZuAuftrag(ts);
    if (resultBytes != null && resultBytes.length > 0) {
        try {
            InputStream fos = new ByteArrayInputStream(resultBytes);
            HSSFWorkbook workbook = new HSSFWorkbook(fos);
            workbook.createSheet("sheet1");
            FileOutputStream fileOut = new FileOutputStream("ipa_loader.xls");
            workbook.write(fileOut);
            fileOut.close();
        } catch (Exception e)
        {// Catch exception if any
            System.err.println("Error: " + e.getMessage());
        }
    }

请让我知道您对此的任何意见,非常感谢您的帮助。


你的代码中没有解析HTML并在XLS中创建单元格的内容。根据你提供的代码,你的问题没有意义。 - Jim Garrison
@JimGarrison,你能给我一些提示吗?我以前从未使用过apache-POI API,这是我从apache网站的示例中学到的东西。 - user2053574
这超出了我们可以处理的范围。你的代码似乎认为它正在从 dokumentSession 读取二进制 Excel 数据,然后将其作为工作簿打开并写出。它所抱怨的“签名”(0x6D78206C6D74683C) 的解码结果是 mx lmth<。如果您编辑帖子以包括完整的堆栈跟踪,并指示引发异常的代码行,那将会很有帮助。 - Jim Garrison
1个回答

3

您提供的链接并没有帮助解决问题。请提供能够具体而简洁地演示如何解析HTML表格并使用POI进行输出的链接。 - csteel
这个项目似乎实现了以下步骤(使用JSoup读取HTML,使用POI编写XLSX):https://github.com/alanhay/html-exporter - golimar

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接