什么是将分组分组的最佳方法?

3
最近我遇到了一个问题,我的团队和我需要按条件对对象列表进行分组,然后再按更多的条件进行分组,接着再按更多的条件进行分组,等等,一共进行7个或者更多级别的分组。经过几天的思考后,我最终想出了一种树形结构,尽管每一级都是手动定义的(主要是为了便于阅读,因为一旦编程完成,它就会不变)。如何处理这个问题是最好的方法,如果可能的话,为什么?
以下是使用随机整数列表的示例代码。检查的顺序是:先判断是否可被2整除,然后是否可被3整除,最后是否可被5整除(尽管条件的顺序对需求没有影响)。
这里是包含随机整数列表和TopNode类的代码:
Random rand = new Random();
List<int> ints = new List<int>();
for (int i = 0; i < 10; i++)
{
   ints.Add(rand.Next(0, 10000001));
}

TopNode node = new TopNode(ints);

这是顶层节点类的其余代码。
public class TopNode 
{ 
    public Even Even { get; set; }
    public Odd Odd { get; set; }
    public TopNode(List<int> ints)
    {
        var even = ints.Where(x => x % 2 == 0).ToList();
        var odd = ints.Where(x => x % 2 != 0).ToList();
        if (even.Count > 0)
        {
            Even = new Even(even);
        }
        if (odd.Count > 0)
        {
            Odd = new Odd(odd);
        }
    }
} 

public class Even {
    public Mulitple3 Mulitple3 { get; set; }
    public NotMulitple3 NotMulitple3 { get; set; }
    public Even(List<int> ints)
    {
        var multiple = ints.Where(x => x % 3 == 0).ToList();
        var not = ints.Where(x => x % 3 != 0).ToList();
        if (multiple.Count > 0)
        {
            Mulitple3 = new Mulitple3(multiple);
        }
        if (not.Count > 0)
        {
            NotMulitple3 = new NotMulitple3(not);
        }
    }
} 

public class Odd {
    public Mulitple3 Mulitple3 { get; set; }
    public NotMulitple3 NotMulitple3 { get; set; }
    public Odd(List<int> ints)
    {
        var multiple = ints.Where(x => x % 3 == 0).ToList();
        var not = ints.Where(x => x % 3 != 0).ToList();
        if (multiple.Count > 0)
        {
            Mulitple3 = new Mulitple3(multiple);
        }
        if (not.Count > 0)
        {
            NotMulitple3 = new NotMulitple3(not);
        }
    }
}

public class Mulitple3
{
    public Multiple5 Multiple5 { get; set; }
    public NotMultiple5 NotMultiple5 { get; set; }
    public Mulitple3(List<int> ints)
    {
        var multiple = ints.Where(x => x % 5 == 0).ToList();
        var not = ints.Where(x => x % 5 != 0).ToList();
        if (multiple.Count > 0)
        {
            Multiple5 = new Multiple5(multiple);
        }
        if (not.Count > 0)
        {
            NotMultiple5 = new NotMultiple5(not);
        }
    }
}

public class NotMulitple3
{
    public Multiple5 Multiple5 { get; set; }
    public NotMultiple5 NotMultiple5 { get; set; }
    public NotMulitple3(List<int> ints)
    {
        var multiple = ints.Where(x => x % 5 == 0).ToList();
        var not = ints.Where(x => x % 5 != 0).ToList();
        if (multiple.Count > 0)
        {
            Multiple5 = new Multiple5(multiple);
        }
        if (not.Count > 0)
        {
            NotMultiple5 = new NotMultiple5(not);
        }
    }
}

public class Multiple5
{
    public List<int> ints { get; set; }
    public Multiple5(List<int> ints)
    {
        this.ints = ints;
    }
}

public class NotMultiple5
{
    public List<int> ints { get; set; }
    public NotMultiple5(List<int> ints)
    {
        this.ints = ints;
    }
}

3
除非你有数百万个对象,“最好”的方法可能就是简单地使用 List<T> 并使用 LINQ 的 GroupBy 进行分组。这样编写最容易,最容易理解,最容易应对不断变化的要求,并且可以处理大量内存中的数据,如果需要的话还可以转换为数据库查询。永远不要低估优化代码扫描简单数据结构所具备的暴力速度,相比于在一些“聪明”的指针网络中跳来跳去的内存操作。 - Ian Mercer
@KyleW 因为每个组都需要成为上面那个组的一部分。所以{1,2,3,4,5,6,7,8} -> {1,2,3,4} -> {1,3} {2,4} 和 {5,6,7,8} -> {5,7} {6,8},以此类推。我试图想出一种用属性来实现这个过程的方法,但是我所有的解决方案最终都会重复相同的计算,并且很快就变得非常难以处理。 - Madmmoore
@IanMercer但是,当每个组也需要分组,并且那些组再次分组时,是否仍然适用?就像这样:{1,2,3,4,5,6,7,8} -> {1,2,3,4} -> {1,3} {2,4}和{5,6,7,8} -> {5,7} {6,8}。我找到了一种使用分组的方法,但它变得非常快,而且我只深入了3层。 - Madmmoore
@NetMage 不是所有的都会,有些会,有些不会。我在我的例子中没有表达清楚,但一种方法是x%3 = 1、2和0。这将最终变成3组而不是2组。 - Madmmoore
1
如果我们能看到更接近实际需求的东西,可能会有所帮助。使用LINQ来执行ints.Where(i => i.IsEven).Where(i => i.IsAMultipleOf3)非常容易使用、修改和理解。如果我们更好地了解您的用例,那么建议更好的东西将更容易。这也很容易从中获取层次结构,因此我很难看出层次结构的目的是什么。 - Kyle W
显示剩余9条评论
4个回答

1

最简单的树只是一个 IEnumerable<IEnumerable<...>>,你可以使用 GroupBy 来形成它。

下面是一个简单的例子,根据2、3和5的整除性将一些整数分组成树形结构。输出结果如下:

{{{{1,7,23,29},{5}},{{3,9,87,21}}},{{{4,8,34,56}},{{78},{30}}}}

.

public static void Main()
{
    int[] input = new int[]{1, 3, 4, 5, 7, 8, 9, 23, 34, 56, 78, 87, 29, 21, 2*3*5};

    // TREE
    var groupedTree = input.GroupBy(x => x % 2 == 0)
        .Select(g => g.GroupBy(x => x % 3 == 0)
        .Select(h => h.GroupBy(x => x % 5 == 0)));

    Console.WriteLine(Display(groupedTree));
}

// Hack code to dump the tree
public static string DisplaySequence(IEnumerable items) => "{" + string.Join(",", items.Cast<object>().Select(x => Display(x))) + "}";
public static string Display(object item) => item is IEnumerable seq ? DisplaySequence(seq) : item.ToString();

0
NetMage和Theodor的回答正是我所需要的。然而,由于我的示例代码中存在一个疏忽,我忘记提到有时答案会返回不止true或false,而是会返回3或4个值(在非常罕见的情况下,其中一个返回值需要分组并迭代)。这不是他们的错,他们的工作实际上非常好,而且很有用,但这是我的疏忽。因此,基于评论,我决定采用Ian和Kyle的答案,并得出了以下结论:
虽然它不是完美的,但它允许我返回任意数量的值,如果需要分组(在case语句中定义),如果只需要过滤2个而不是所有3个或需要更改顺序,则可以根据需要将它们添加到条件数组中。
再次感谢您的帮助,对于问题我没有表述清楚,我感到非常抱歉。
Random rand = new Random();
List<int> ints = new List<int>();
for (int i = 0; i < 10000000; i++)
{
   ints.Add(rand.Next(0, 10000001));
}
string[] conditions = new string[] { "even", "div3", "div5" };
var dynamicSort = new Sorted(ints);

public class Sorted
{
    public List<List<int>> returnVal { get; set; }
    public static List<int> Odd(List<int> ints)
    {
        return ints.Where(x => x % 2 != 0).ToList();
    }
    public static List<int> Even(List<int> ints)
    {
        return ints.Where(x => x % 2 == 0).ToList();
    }
    public static List<int> DivThree(List<int> ints)
    {
        return ints.Where(x => x % 3 == 0).ToList();
    }
    public static List<int> NotDivThree(List<int> ints)
    {
        return ints.Where(x => x % 3 != 0).ToList();
    }
    public static List<int> DivFive(List<int> ints)
    {
        return ints.Where(x => x % 5 == 0).ToList();
    }
    public static List<int> NotDivFive(List<int> ints)
    {
        return ints.Where(x => x % 5 != 0).ToList();
    }

    public Sorted(List<int> ints, string[] conditions)
    {
        returnVal = GetSorted(ints, conditions, 0);
    }
    public List<List<int>> GetSorted(List<int>ints, string[] conditions, int index)
    {
        var sortReturn = new List<List<int>>();
        switch (conditions[index].ToLower()) 
        {
            case "even":
            case "odd":
                {
                    if (index == conditions.Length - 1)
                    {
                        sortReturn.Add(Odd(ints));
                        sortReturn.Add(Even(ints));
                    }
                    else
                    {
                        var i = ++index;
                        sortReturn.AddRange(GetSorted(Odd(ints), conditions, i));
                        sortReturn.AddRange(GetSorted(Even(ints), conditions, i));
                    }
                    break;
                }
            case "div3":
            case "notdiv3":
                {
                    if (index == conditions.Length - 1)
                    {
                        sortReturn.Add(DivThree(ints));
                        sortReturn.Add(NotDivThree(ints));
                    }
                    else
                    {
                        var i = ++index;
                        sortReturn.AddRange(GetSorted(DivThree(ints), conditions, i));
                        sortReturn.AddRange(GetSorted(NotDivThree(ints), conditions, i));
                    }
                    break;
                }
            case "div5":
            case "notdiv5":
                {
                    if (index == conditions.Length - 1)
                    {
                        sortReturn.Add(DivFive(ints));
                        sortReturn.Add(NotDivFive(ints));
                    }
                    else
                    {
                        var i = ++index;
                        sortReturn.AddRange(GetSorted(DivFive(ints), conditions, i));
                        sortReturn.AddRange(GetSorted(NotDivFive(ints), conditions, i));
                    }
                    break;
                }
        }
        return sortReturn;
    }
}

0
我还创建了一个树类,但是我使用一个类来存储每个条件,并使用条件数组来处理分组。每个条件都应该返回一个int来创建分组,然后树类可以通过条件逐级进行分组。为了使树形结构统一化,我保留了每个级别的成员列表,并将其拆分到下一个级别。
public class Condition<T> {
    public string[] Values;
    public Func<T, int> Test;

    public Condition(string[] values, Func<T, int> test) {
        Values = values;
        Test = test;
    }
}

public class Level {
    public static Level<T> MakeTree<T>(IEnumerable<T> src, Condition<T>[] conditions) => new Level<T>(src, conditions);
    public static IEnumerable<int> MakeKey<T>(Condition<T>[] conditions, params string[] values) {
        for (int depth = 0; depth < values.Length; ++depth)
            yield return conditions[depth].Values.IndexOf(values[depth]);
    }
}

public class Level<T> {
    public string Value;
    public Level<T>[] NextLevels;
    public List<T> Members;

    public Level(string value, List<T> members) {
        Value = value;
        Members = members;
        NextLevels = null;
    }

    public Level(IEnumerable<T> src, Condition<T>[] conditions) : this("ALL", src.ToList()) => GroupOneLevel(this, 0, conditions);

    public void GroupOneLevel(Level<T> parent, int depth, Condition<T>[] conditions) {
        var condition = conditions[depth];
        var nextLevels = new Level<T>[condition.Values.Length];
        for (int j2 = 0; j2 < condition.Values.Length; ++j2) {
            nextLevels[j2] = new Level<T>(condition.Values[j2], new List<T>());
        }

        for (int j2 = 0; j2 < parent.Members.Count; ++j2) {
            var member = parent.Members[j2];
            nextLevels[condition.Test(member)].Members.Add(member);
        }
        parent.NextLevels = nextLevels;
        if (depth + 1 < conditions.Length)
            for (int j3 = 0; j3 < condition.Values.Length; ++j3)
                GroupOneLevel(nextLevels[j3], depth + 1, conditions);
    }

    public List<T> MembersForKey(IEnumerable<int> values) {
        var curLevel = this;
        foreach (var value in values)
            curLevel = curLevel.NextLevels[value];

        return curLevel.Members;
    }
}

对于你的例子,你可以这样使用:

var conditions = new[] {
        new Condition<int>(new[] { "Even", "Odd" }, n => n & 1),
        new Condition<int>(new[] { "Div3", "NOTDiv3" }, n => n % 3 == 0 ? 0 : 1),
        new Condition<int>(new[] { "Div5", "NOTDiv5" }, n => n % 5 == 0 ? 0 : 1)
    };

var ans = Level.MakeTree(ints, conditions);

你可以使用以下代码查找树的特定部分:

var evenDiv3 = ans.MembersForKey(Level.MakeKey(conditions, "Even", "Div3"));

0
我的建议是创建一个集合类,可以过滤您的对象,并返回自身的实例,以便过滤可以继续深入。例如,假设您的对象是类型为MyObject的:

class MyObject
{
    public int Number { get; }
    public MyObject(int number) => this.Number = number;
    public override string ToString() => this.Number.ToString();
}

这是一个过滤集合 MyCollection 的示例,支持对 OddEvenMultiple3NonMultiple3 进行过滤。所需的 查找惰性地 创建的,以避免为永远不会被请求的搜索分配内存:
class MyCollection : IEnumerable<MyObject>
{
    private readonly IEnumerable<MyObject> _source;

    private readonly Lazy<ILookup<bool, MyObject>> _multiple2Lookup;
    private readonly Lazy<MyCollection> _even;
    private readonly Lazy<MyCollection> _odd;

    private readonly Lazy<ILookup<bool, MyObject>> _multiple3Lookup;
    private readonly Lazy<MyCollection> _multiple3;
    private readonly Lazy<MyCollection> _nonMultiple3;

    public MyCollection Even => _even.Value;
    public MyCollection Odd => _odd.Value;

    public MyCollection Multiple3 => _multiple3.Value;
    public MyCollection NonMultiple3 => _nonMultiple3.Value;

    public MyCollection(IEnumerable<MyObject> source)
    {
        _source = source;

        _multiple2Lookup = new Lazy<ILookup<bool, MyObject>>(
            () => _source.ToLookup(o => o.Number % 2 == 0));
        _even = new Lazy<MyCollection>(
            () => new MyCollection(_multiple2Lookup.Value[true]));
        _odd = new Lazy<MyCollection>(
            () => new MyCollection(_multiple2Lookup.Value[false]));

        _multiple3Lookup = new Lazy<ILookup<bool, MyObject>>(
            () => _source.ToLookup(o => o.Number % 3 == 0));
        _multiple3 = new Lazy<MyCollection>(
            () => new MyCollection(_multiple3Lookup.Value[true]));
        _nonMultiple3 = new Lazy<MyCollection>(
            () => new MyCollection(_multiple3Lookup.Value[false]));
    }

    public IEnumerator<MyObject> GetEnumerator() => _source.GetEnumerator();
    IEnumerator IEnumerable.GetEnumerator() => GetEnumerator();
}

使用示例:

var source = Enumerable.Range(1, 20).Select(i => new MyObject(i));
var myObjects = new MyCollection(source);
var filtered = myObjects.Even.NonMultiple3;
Console.WriteLine(String.Join(", ", filtered));

输出:

2、4、8、10、14、16、20

这种方法的一个可能的缺点是它允许调用 myObjects.Even.NonMultiple3myObjects.NonMultiple3.Even。两个查询都返回相同的结果,但会导致冗余查找的创建。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接