$html=strip_tags($html);
$html=ereg_replace("[^A-Za-zäÄÜüÖö]"," ",$html);
$words = preg_split("/[\s,]+/", $html);
这个正则表达式是否会将所有非(A-Z,a-z,带有umlauts的a o u)字符替换为空格?我失去了像zugänglich等umlauts单词。
这个正则表达式有什么问题吗?
编辑:
我用preg_replace替换了ereg_replace,但是某些特殊字符如::,®不能被替换为空格...
[^A-Za-zäÄÜüÖö]
模式放在其中?此外,ereg_replace自5.3.0版本起已被弃用,因此我不会使用它。 - Matt Ellenereg_replace()
自5.3版本起已被弃用,建议使用preg_replace()
。 - powtac