我有一堆word文档(docx),其中包含测试用例名称作为段落标题,随后的表格中包含测试步骤和其他信息。
我需要使用Apache POI从表格中提取测试用例名称(从段落中)和测试步骤。
示例word内容如下:
Section 1: Index
Section 2: Some description
A. Paragraph 1
B. Table 1
C. Paragraph 2
D. Paragraph 3
E. Table 2
Section 3: test cases ( The title "test cases" is constant, so I can look for it in the doc)
A. Paragraph 4 (First test case)
B. Table 3 (Test steps table immediately after the para 4)
C. Paragraph 5 (Second test case)
B. Table 4 (Test steps table immediately after the para 5)
Apache POI提供API以给出段落和表格列表,但是我无法读取段落(测试用例)并立即查找接下来的表格。
我尝试使用XWPFWordExtractor(读取所有文本),bodyElementIterator(迭代所有正文元素),但大多数都给出getParagraphText()
方法,该方法以列表形式给出段落[para1,para2,para3,para4, para5]
和getTables()
方法,该方法将文档中的所有表格作为列表[table1,table2,table3,table4]
给出。
如何遍历所有段落,在标题“测试用例”(第4段)之后停止,然后查找紧随第4段之后的表格(第3个表格)。 然后对段落5和表格4重复此操作。
这里是我尝试的代码链接,它提供了段落和表格列表,但不是我可以跟踪的顺序。
非常感谢您的任何帮助。