我在数据库中有HTML编码的字符串,但许多字符实体不仅仅是标准的&
和<
。例如“
和—
等实体。不幸的是,我们需要将这些数据提供给基于Flash的RSS阅读器,而Flash无法读取这些实体,但它们可以读取Unicode等效项(例如“
)。
使用.Net 4.0,是否有任何实用程序方法可将HTML编码的字符串转换为使用Unicode编码的字符实体?
这里有一个更好的例子。数据库中有像这样的HTML字符串:<p>John & Sarah went to see $ldquo;Scream 4$rdquo;.</p>
,我需要在<description>
标记内输出的rss/xml文档是:<p>John &#38; Sarah went to see &#8220;Scream 4&#8221;.</p>
我正在使用XmlTextWriter从数据库记录创建xml文档,类似于此示例代码http://www.dotnettutorials.com/tutorials/advanced/rss-feed-asp-net-csharp.aspx
因此,我需要将来自数据库的HTML字符串中的所有字符实体替换为它们的Unicode等效项,因为基于Flash的RSS阅读器不认识除&
之外的任何实体。