我有一个2003版的Word文档。我正在使用Powershell来解析文档内容。该文档包含几行文本,十几个列数不同的表格,然后再加一些文本。
我希望能够读取文档,并按以下步骤处理:
1. 读取文档(创建必要的对象等); 2. 获取每行文本; 3. 如果不属于表格,则按文本处理并输出; 4. 否则, 5. 如果属于表格, 6. 获取表格编号(按顺序),并根据列数解析输出; 7. 结束If语句。
下面是我已经开始编写的Powershell脚本:
我希望能够读取文档,并按以下步骤处理:
1. 读取文档(创建必要的对象等); 2. 获取每行文本; 3. 如果不属于表格,则按文本处理并输出; 4. 否则, 5. 如果属于表格, 6. 获取表格编号(按顺序),并根据列数解析输出; 7. 结束If语句。
下面是我已经开始编写的Powershell脚本:
$objWord = New-Object -Com Word.Application
$objWord.Visible = $false
$objDocument = $objWord.Documents.Open($filename)
$paras = $objDocument.Paragraphs
foreach ($para in $paras)
{
Write-Output $para.Range.Text
}
我不确定段落是否符合我的需求。有没有更适合我目的的东西? 现在我所得到的只是整个文档的内容。我应该如何控制我所获得的内容?比如,我想要获取一行,能够确定它是否属于表格,并根据它所在的表格编号采取相应的行动。