可能是重复问题:
C#中的自然排序顺序
我有一个包含许多数字的列表。 但由于一些额外的字母,它们保存为字符串。
我的列表看起来像这样:
1
10
11
11a
11b
12
2
20
21a
21c
A1
A2
...
但它应该看起来像这样
1
2
10
11a
11b
...
A1
A2
...
如何对我的列表进行排序以获得这个结果?
可能是重复问题:
C#中的自然排序顺序
我有一个包含许多数字的列表。 但由于一些额外的字母,它们保存为字符串。
我的列表看起来像这样:
1
10
11
11a
11b
12
2
20
21a
21c
A1
A2
...
但它应该看起来像这样
1
2
10
11a
11b
...
A1
A2
...
如何对我的列表进行排序以获得这个结果?
根据之前的评论,我会实现一个自定义的IComparer<T>
类。从我所了解的情况来看,这些项的结构要么是一个数字,要么是一个由数字后跟字母(s)组成的组合。如果是这种情况,以下IComparer<T>
实现应该可以工作。
public class CustomComparer : IComparer<string>
{
public int Compare(string x, string y)
{
var regex = new Regex("^(d+)");
// run the regex on both strings
var xRegexResult = regex.Match(x);
var yRegexResult = regex.Match(y);
// check if they are both numbers
if (xRegexResult.Success && yRegexResult.Success)
{
return int.Parse(xRegexResult.Groups[1].Value).CompareTo(int.Parse(yRegexResult.Groups[1].Value));
}
// otherwise return as string comparison
return x.CompareTo(y);
}
}
使用这个 IComparer<T>
,你可以通过以下方式对字符串列表进行排序
var myComparer = new CustomComparer();
myListOfStrings.Sort(myComparer);
以下内容已经测试通过:
2, 1, 4d, 4e, 4c, 4a, 4b, A1, 20, B2, A2, a3, 5, 6, 4f, 1a
测试结果如下:
1, 1a, 2, 20, 4a, 4b, 4c, 4d, 4e, 4f, 5, 6, A1, A2, a3, B2
^(\\d+)
。更好的做法是,将正则表达式改为 (\\d+)
,这样可以处理 Region 1, Region 10, Region 2
和 1, 10, 2
这些情况。 - stack247由于这个算法涉及到许多字符串操作、正则表达式等,我认为它不是一种高效的算法,但它似乎能够工作。
List<string> list1 = new List<string>() { "11c22", "1", "10", "11", "11a", "11b", "12", "2", "20", "21a", "21c", "A1", "A2" };
List<string> list2 = new List<string>() { "File (5).txt", "File (1).txt", "File (10).txt", "File (100).txt", "File (2).txt" };
var sortedList1 = NaturalSort(list1).ToArray();
var sortedList2 = NaturalSort(list2).ToArray();
public static IEnumerable<string> NaturalSort(IEnumerable<string> list)
{
int maxLen = list.Select(s => s.Length).Max();
Func<string, char> PaddingChar = s => char.IsDigit(s[0]) ? ' ' : char.MaxValue;
return list
.Select(s =>
new
{
OrgStr = s,
SortStr = Regex.Replace(s, @"(\d+)|(\D+)", m => m.Value.PadLeft(maxLen, PaddingChar(m.Value)))
})
.OrderBy(x => x.SortStr)
.Select(x => x.OrgStr);
}
您需要从每个字符串中提取数字,然后根据数字列表作为键对字符串列表进行排序。 这需要分为两步。
要从每个字符串中提取数字,我认为最简单的方法是使用正则表达式-查找(\d+)
的匹配项(如果有负数或小数,您将不得不使用不同的正则表达式)。 假设您在名为ExtractNumber
的函数中执行了此操作
现在可以使用一些创意LINQ进行排序,例如:
strings.Select(s=>new { key=ExtractNumber(s), value=s }) // Create a key-value pair
.OrderBy(p=>p.key) // Sort by key
.Select(p=>p.Value); // Extract the values
A1
和A2
时会发生什么? - Richard我对C#还比较新,但是这里有一个我在Java中很欣赏的解决方案:你需要分两步进行,首先定义一个自定义的IComparer,然后在调用sort方法时使用它。所以你应该能够做到类似这样的事情:
public class MyListSorter : IComparer<MyObject>
{
public int Compare(MyObject obj1, MyObject obj2)
{
if ( !Char.IsNumber(obj1) && Char.IsNumber(obj2) )
{
return 0;
}
else if ( Char.IsNumber(obj1) && !Char.IsNumber(obj2) )
{
return 1;
}
else
{
return obj2.CompareTo(obj1);
}
}
}
然后
myObjectList.Sort(new MyListSorter());
有关 IComparer 的更多信息:http://support.microsoft.com/kb/320727
Char.IsNumber(obj1)
怎么可能编译通过呢? - MakePeaceGreatAgain