我一直在为第三方公司创建产品数据源。我所使用的数据中存在各种无效字符、特殊字符和双重空格等问题。他们还要求对数据进行HTML编码,其中使用了特殊字符。
以下是一些可能传递的数据示例 = "购买厨房辅助工艺品™搅拌机4.8L"
try
{
var removeDoubleSpace = Regex.Replace(stringInput, @"\s+", " ");
var encodedString = HttpUtility.HtmlEncode(removeDoubleSpace).Trim();
var encodedAndLineBreaksRemoved = encodedString.Replace(Environment.NewLine, "");
var finalStringOutput = Regex.Replace(encodedAndLineBreaksRemoved, @"(™)|(’)|(”)|(–)", "");
return finalStringOutput;
}
catch (Exception)
{
return stringInput;
}
我正在尝试提供一种方法,可以执行上述所有操作,而不是使用多个Regex
表达式进行清理。或者,也许存在一种涵盖所有情况的正则表达式吗?