在将HTML文本导出到Excel表格时,我试图保留基本格式,例如HTML换行符(
因此,我的问题是:
是否有人知道一个可以将HTML转换为纯文本并保留基本格式的类/库?
更新2013-05-10
我最终使用了一个函数,请在Pastebin上查看完整代码。
<br>
,<p>
),列表(<ol>
,<ul>
)等。
< p > 示例输入:
<p>This is a test.</p>
<p>This is another<br>test.</p>
<ul>
<li>10</li>
<li>20</li>
<li>30</li>
</ul>
<p>End.</p>
示例输出:
This is a test.
This is another
test.
- 10
- 20
- 30
End.
著名的NirSoft开发者提供的免费实用工具HTMLAsText似乎正是我需要的,但不幸的是它没有源代码:
因此,我的问题是:
是否有人知道一个可以将HTML转换为纯文本并保留基本格式的类/库?
更新2013-05-10
我最终使用了一个函数,请在Pastebin上查看完整代码。