HTML清洗和关闭不完整的标签

Question

HTML清洗和关闭不完整的标签

htmlruby-on-railsrubyruby-on-rails-3.1sanitize

6

在ApplicationHelper中的sanitize()方法没有关闭标签。

s = "<a href='http://example.com'>incomplete"
sanitize(s, :tags => ['a', 'p'])

上述代码片段会保留原始字符串。如何强制它添加一个闭合标签</a>或至少将<a>标签删除？

- mahemoff

2个回答

2

更新后的答案是

 s = "<a href='http://example.com'>incomplete"
 html = sanitize(s, tags: %w[a p])
 Nokogiri::HTML::DocumentFragment.parse(html).to_html

- jvnill

最后一行单独使用对我非常有效，而且还关闭了未关闭的标签。 - Max Williams

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Niklas B. · Accepted Answer

你可以使用一个合适的HTML解析器来实现此功能。我建议使用Nokogiri工具来处理：

require 'nokogiri'
# ...
s = "<a href='http://example.com'>incomplete"
Nokogiri::HTML::fragment(sanitize(s, :tags => ['a', 'p'])).to_xml
# => "<a href=\"http://example.com\">incomplete</a>"

这将始终返回有效的XML。当然，您可以将其打包到自己的辅助方法中，以便更轻松地使用。