在HTML中,使用包含非ASCII字符的IRI作为属性值(例如href属性)而不是URI是否有效? HTML和XHTML(4和5)之间有什么区别吗?至少RFC 3986似乎暗示它不是。
我意识到使用百分号编码可能会更安全(关于较旧和不支持IRI的软件),但我正在寻找标准的明确答案。
到目前为止,我已经使用{{link2:W3C验证器}}进行了一些测试,并且在HTML 4/5和XHTML 4/5 doctype中,未转义的Unicode字符在URI中不会触发任何警告或错误(但是当然没有错误消息并不意味着没有错误)。
至少Chrome还支持原始UTF-8 IRI,但在发出HTTP请求之前对其进行百分号转义。此外,我的Web服务器(lighttpd)似乎支持在HTTP请求中以其百分比编码形式及其未编码形式使用UTF-8字符。