我将从Html文件中保存一个字符串到我的数据库中。但是我无法将这个字符串修剪并去除空格。
我创建了这个简化的函数来总结问题以及我迄今为止尝试过的方法。
<?php
function get_content($html)
{
$dom = new DOMDocument();
$dom->loadHTML($html);
$div = $dom->getElementById('whitespace');
$content = $div->textContent;
# Goal: trim leading, trailing, and non-breaking space
$content = str_replace(' ','',$content);
$content = str_replace('U+00A0','',$content);
$content = str_replace('\u00a0','',$content);
$content = str_replace('\xa0','',$content);
$content = str_replace(chr(160),'',$content);
$content = trim($content);
return $content;
}
file_put_contents(
'trim.output',
get_content('<div id="whitespace"> TuffToTrim</div>'
));
?>
输出结果为:
TuffToTrim
虽然我希望它是这样的:
TuffToTrim
我现在有点绝望 :) 有什么想法吗?
$content = str_replace(' ','',$content);
替换它们。 - ivion$div->textContent
对
的处理有些奇怪。当您直接将文本粘贴到$content
中时,一切都正常。我知道这还没有帮助 - 但它可能会提示您进一步搜索的方向。 - Jeff