我如何从字符串中删除除破折号和空格字符之外的所有非字母数字字符?
用空字符串替换[^a-zA-Z0-9 -]
。
Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");
我本可以使用正则表达式,它们可以提供优美的解决方案,但它们可能会造成性能问题。这里是一个解决方案
char[] arr = str.ToCharArray();
arr = Array.FindAll<char>(arr, (c => (char.IsLetterOrDigit(c)
|| char.IsWhiteSpace(c)
|| c == '-')));
str = new string(arr);
当使用紧凑框架(该框架没有FindAll函数)时
用1替换FindAll函数
char[] arr = str.Where(c => (char.IsLetterOrDigit(c) ||
char.IsWhiteSpace(c) ||
c == '-')).ToArray();
str = new string(arr);
char[] arr = str.Where(c => (char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-')).ToArray();
替换FindAll。这个表达式可以过滤字符串中的非字母数字、空格和破折号,并将结果存储在字符数组arr中。 - ShawnFeatherlystr = string.Concat(str.Where(c => Char.IsLetterOrDigit(c) || Char.IsWhiteSpace(c)))
- VDWWD.Where
作为一种最后的选择呈现出来,如果Array.FindAll
不可用的话,但对我来说,它似乎要简单得多。你有什么理由更喜欢FindAll
呢? - Arthur Tacca你可以尝试:
string s1 = Regex.Replace(s, "[^A-Za-z0-9 -]", "");
其中s
是你的字符串。
string withOutSpecialCharacters = new string(stringWithSpecialCharacters.Where(c =>char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-').ToArray());
[^\w\s\-]*
:
\s
比空格()更好用,因为文本中可能存在制表符。
基于这个问题的答案,我创建了一个静态类并添加了这些内容。认为它可能对一些人有用。
public static class RegexConvert
{
public static string ToAlphaNumericOnly(this string input)
{
Regex rgx = new Regex("[^a-zA-Z0-9]");
return rgx.Replace(input, "");
}
public static string ToAlphaOnly(this string input)
{
Regex rgx = new Regex("[^a-zA-Z]");
return rgx.Replace(input, "");
}
public static string ToNumericOnly(this string input)
{
Regex rgx = new Regex("[^0-9]");
return rgx.Replace(input, "");
}
}
那么这些方法可以这样使用:
string example = "asdf1234!@#$";
string alphanumeric = example.ToAlphaNumericOnly();
string alpha = example.ToAlphaOnly();
string numeric = example.ToNumericOnly();
想要快速的东西吗?
public static class StringExtensions
{
public static string ToAlphaNumeric(this string self,
params char[] allowedCharacters)
{
return new string(Array.FindAll(self.ToCharArray(),
c => char.IsLetterOrDigit(c) ||
allowedCharacters.Contains(c)));
}
}
这将使您能够指定您想要允许的字符。
public static unsafe void ToAlphaNumeric(ref string input)
{
fixed (char* p = input)
{
int offset = 0;
for (int i = 0; i < input.Length; i++)
{
if (char.IsLetterOrDigit(p[i]))
{
p[offset] = input[i];
offset++;
}
}
((int*)p)[-1] = offset; // Changes the length of the string
p[offset] = '\0';
}
}
对于那些不想使用不安全的方法或不信任字符串长度技巧的人。
public static string ToAlphaNumeric(string input)
{
int j = 0;
char[] newCharArr = new char[input.Length];
for (int i = 0; i < input.Length; i++)
{
if (char.IsLetterOrDigit(input[i]))
{
newCharArr[j] = input[i];
j++;
}
}
Array.Resize(ref newCharArr, j);
return new string(newCharArr);
}
我提供了一种不同的解决方案,通过消除控制字符,这是我的原始问题。
这比列出所有“特殊但好”的字符更好。
char[] arr = str.Where(c => !char.IsControl(c)).ToArray();
str = new string(arr);
这个技术更简单,所以我认为它更好!
这里有一个扩展方法,灵感来自@ata的回答。
"hello-world123, 456".MakeAlphaNumeric(new char[]{'-'});// yields "hello-world123456"
如果您需要除连字符以外的其他字符...
"hello-world123, 456!?".MakeAlphaNumeric(new char[]{'-','!'});// yields "hello-world123456!"
public static class StringExtensions
{
public static string MakeAlphaNumeric(this string input, params char[] exceptions)
{
var charArray = input.ToCharArray();
var alphaNumeric = Array.FindAll<char>(charArray, (c => char.IsLetterOrDigit(c)|| exceptions?.Contains(c) == true));
return new string(alphaNumeric);
}
}
-
必须位于字符类结尾或以反斜杠进行转义。 - Peter Boughtonreturn Regex.Replace(str, "[^a-zA-Z0-9_.]+", "", RegexOptions.Compiled);
同样的基本问题 - Paige Watson""
和string.Empty
完全相同。https://dev59.com/XXVC5IYBdhLWcg3w51hv - Jared