这是我的代码:
$oDom = new DOMDocument();
$oDom->loadHTML("èàéìòù");
echo $oDom->saveHTML();
这是输出结果:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body><p>èà éìòù</p></body></html>
我想要这个输出:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body><p>èàéìòù</p></body></html>
我已经尝试过....
$oDom = new DomDocument('4.0', 'UTF-8');
或者使用1.0和其他的东西但什么都没有。
另一件事...
有没有一种方法可以获得完全相同未更改的HTML?
例如,使用此输入中的html <p>hello!</p>
仅使用DOMDocument解析DOM并在标记内进行一些替换,以获得相同的输出<p>hello!</p>
。
Ã
,那么说明你的UTF-8编码出现了问题,可能被转换成了iso-8859或其他编码格式。 - Marc B