我刚刚使用一个导出应用将我的整个LiveJournal博客导出到了一个XML文件中。这样做的原因是为了归档并保存给未来的后代。我想为它制作一个简单的布局文件,这样我就可以阅读帖子并感受怀旧之情。它看起来像任何普通的XML文件:
<livejournal>
<entry>
<itemid>1</itemid>
<eventtime>Date/time</eventtime>
<subject>Subject Line</subject>
<event>The actual post</event>
<allowmask>0</allowmask>
<current_mood>current mood</current_mood>
<current_music>current mood</current_music>
<taglist>comma, separated, tags</taglist>
<comment>
<itemid>2433</itemid>
<eventtime>Date</eventtime>
<subject>Subject Line</subject>
<event>The actual comment</event>
<author>
<name>Commenter</name>
<email>Commenter@email</email>
</author>
</comment>
</entry>
<entry>
</livejournal>
到目前为止一切都很好。问题出现在我尝试为它制作xsl文件时。xml文件中的<event>标签不仅包含文本,还包含HTML。而且这些HTML是2004年编写的,并由各种meme生成器生成。因此代码的价值不高。我们看到了可爱的标签和大量未关闭的img、input、br和hr标签。
当前版本的导出已经用<>替换了所有的<>,因此它将被视为一个xml文件。我想做的是能够查看带有所有预期HTML标签的XML文件。因此<b></b>会使事情变得粗体。但是,由于<b></b>不能正确评估,我不知道该怎么做。
<event>I ate a <b>tasty</b> cucumber</event>
输出
我吃了一根美味的黄瓜
而不是
我吃了一根美味的黄瓜
有没有办法解决这个问题?将xml文件中的所有lt、gt更改为<>会使其无法评估,因为HTML存在错误。我也不想手动处理700多个帖子以使它们正确地评估。