使用LINQ从List<T>中删除元素

772

假设我有一个LINQ查询,例如:

var authors = from x in authorsList
              where x.firstname == "Bob"
              select x;

假设authorsList是类型为List<Author>的列表,如何从authorsList中删除查询到的authors返回的Author元素?

或者换一种方式,如何从authorsList中删除所有名为Bob的人的名字?

注意:这只是一个简化的例子。

14个回答

1318

其实,在一开始就将它们排除会更容易:

authorsList = authorsList.Where(x => x.FirstName != "Bob").ToList();

然而,那只会改变authorsList 的值,而不是从先前的集合中删除作者。 或者,您可以使用RemoveAll

authorsList.RemoveAll(x => x.FirstName == "Bob");
如果你真的需要根据另一个集合来完成操作,我建议使用 HashSet、RemoveAll 和 Contains。
var setToRemove = new HashSet<Author>(authors);
authorsList.RemoveAll(x => setToRemove.Contains(x));

17
为什么要使用 HashSet 作为另一个集合的原因是什么? - 123 456 789 0
67
它使“包含”检查更快,并确保您仅评估序列一次。 - Jon Skeet
3
是的,从序列构建一个 HashSet 只会计算一次。不确定你所说的“weak collection set”是什么意思。 - Jon Skeet
3
“过时”是什么意思?它仍然可以使用。如果你有一个List<T>,那么使用它也是可以的。 - Jon Skeet
5
建议使用authorsList = authorsList.Where(x => x.FirstName != "Bob")更好。 - Jon Skeet
显示剩余10条评论

163

最好使用List<T>.RemoveAll来完成这个任务。

authorsList.RemoveAll((x) => x.firstname == "Bob");

9
@Reed Copsey:你例子中的lambda参数被括在圆括号中,即(x)。这是否有技术原因?这被认为是良好的惯例吗? - Matt Davis
31
不。需要使用超过1个参数。使用单个参数是可选的,但有助于保持一致性。 - Reed Copsey

57

如果你真的需要删除项目,那么Excpet()怎么样?
你可以基于一个新列表进行删除,或者在Linq中嵌套操作实现即时删除。

var authorsList = new List<Author>()
{
    new Author{ Firstname = "Bob", Lastname = "Smith" },
    new Author{ Firstname = "Fred", Lastname = "Jones" },
    new Author{ Firstname = "Brian", Lastname = "Brains" },
    new Author{ Firstname = "Billy", Lastname = "TheKid" }
};

var authors = authorsList.Where(a => a.Firstname == "Bob");
authorsList = authorsList.Except(authors).ToList();
authorsList = authorsList.Except(authorsList.Where(a=>a.Firstname=="Billy")).ToList();

2
Except() 是在 LINQ 语句中间的唯一选择。 IEnumerable 没有 Remove()RemoveAll() 方法。 - Jari Turkia

34

使用标准的LINQ操作符是无法实现这一点的,因为LINQ只提供查询而不支持更新操作。

但是你可以生成一个新的列表并替换旧的列表。

var authorsList = GetAuthorList();

authorsList = authorsList.Where(a => a.FirstName != "Bob").ToList();

或者你可以在第二次遍历中删除所有authors中的项目。

var authorsList = GetAuthorList();

var authors = authorsList.Where(a => a.FirstName == "Bob").ToList();

foreach (var author in authors)
{
    authorList.Remove(author);
}

19
RemoveAll() 不是一个 LINQ 运算符。 - Daniel Brückner
1
非常抱歉。您是100%正确的。不幸的是,我似乎无法取消我的负评。对此感到抱歉。 - Shai Cohen
1
RemoveList<T>的方法,而不是System.Linq.Enumerable的方法。 - DavidRR
1
@Daniel, 如果我错了,请纠正我,我们可以避免在第二个选项的Where条件中使用.ToList()。 也就是说,下面的代码将起作用。var authorsList = GetAuthorList();var authors = authorsList.Where(a => a.FirstName == "Bob");foreach (var author in authors) { authorList.Remove(author); } - Sai
1
是的,这将有效。只有在您需要将其作为列表传递给某些方法或者如果以后想要添加或删除更多内容时,才需要将其转换为列表。如果您必须多次枚举序列,则将其转换为列表也可能很有用,因为那么您只需一次评估潜在昂贵的where条件,或者如果结果可能在两个枚举之间发生更改,例如因为该条件取决于当前时间。如果您只想在一个循环中使用它,则绝对没有必要先将结果存储在列表中。 - Daniel Brückner
1
不是完全正确的。如果您从模型中提取数据,则可能需要将其转换为列表,如果您有任何未映射字段,则无法访问它们以执行Linq查询。 - John Lord

24

简单解决方案:

static void Main()
{
    List<string> myList = new List<string> { "Jason", "Bob", "Frank", "Bob" };
    myList.RemoveAll(x => x == "Bob");

    foreach (string s in myList)
    {
        //
    }
}

如何从字符串列表中删除“Bob”和“Jason”,即多个? - Neo
@Neo 你可以使用 myList.RemoveAll(x => x == "Bob" || x == "Jason"); - Thanos Kyprianos

23

我在想,RemoveAllExcept有什么区别以及使用HashSet的优点,所以我进行了快速性能检查 :)

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;
using System.Text;

namespace ListRemoveTest
{
    class Program
    {
        private static Random random = new Random( (int)DateTime.Now.Ticks );

        static void Main( string[] args )
        {
            Console.WriteLine( "Be patient, generating data..." );

            List<string> list = new List<string>();
            List<string> toRemove = new List<string>();
            for( int x=0; x < 1000000; x++ )
            {
                string randString = RandomString( random.Next( 100 ) );
                list.Add( randString );
                if( random.Next( 1000 ) == 0 )
                    toRemove.Insert( 0, randString );
            }

            List<string> l1 = new List<string>( list );
            List<string> l2 = new List<string>( list );
            List<string> l3 = new List<string>( list );
            List<string> l4 = new List<string>( list );

            Console.WriteLine( "Be patient, testing..." );

            Stopwatch sw1 = Stopwatch.StartNew();
            l1.RemoveAll( toRemove.Contains );
            sw1.Stop();

            Stopwatch sw2 = Stopwatch.StartNew();
            l2.RemoveAll( new HashSet<string>( toRemove ).Contains );
            sw2.Stop();

            Stopwatch sw3 = Stopwatch.StartNew();
            l3 = l3.Except( toRemove ).ToList();
            sw3.Stop();

            Stopwatch sw4 = Stopwatch.StartNew();
            l4 = l4.Except( new HashSet<string>( toRemove ) ).ToList();
            sw3.Stop();


            Console.WriteLine( "L1.Len = {0}, Time taken: {1}ms", l1.Count, sw1.Elapsed.TotalMilliseconds );
            Console.WriteLine( "L2.Len = {0}, Time taken: {1}ms", l1.Count, sw2.Elapsed.TotalMilliseconds );
            Console.WriteLine( "L3.Len = {0}, Time taken: {1}ms", l1.Count, sw3.Elapsed.TotalMilliseconds );
            Console.WriteLine( "L4.Len = {0}, Time taken: {1}ms", l1.Count, sw3.Elapsed.TotalMilliseconds );

            Console.ReadKey();
        }


        private static string RandomString( int size )
        {
            StringBuilder builder = new StringBuilder();
            char ch;
            for( int i = 0; i < size; i++ )
            {
                ch = Convert.ToChar( Convert.ToInt32( Math.Floor( 26 * random.NextDouble() + 65 ) ) );
                builder.Append( ch );
            }

            return builder.ToString();
        }
    }
}

以下是结果:

Be patient, generating data...
Be patient, testing...
L1.Len = 985263, Time taken: 13411.8648ms
L2.Len = 985263, Time taken: 76.4042ms
L3.Len = 985263, Time taken: 340.6933ms
L4.Len = 985263, Time taken: 340.6933ms

我们可以看到,在这种情况下最好的选择是使用RemoveAll(HashSet)方法。


这段代码:"l2.RemoveAll( new HashSet<string>( toRemove ).Contains );" 不应该编译通过... 如果你的测试是正确的,那么它们只是证实了Jon Skeet已经建议的内容。 - Pascal
2
l2.RemoveAll( new HashSet<string>( toRemove ).Contains ); 编译正常,仅供参考。 - AzNjoE

12

这是一个非常老的问题,但我发现有一个非常简单的方法可以解决:

authorsList = authorsList.Except(authors).ToList();

请注意,由于返回变量authorsListList<T>类型,因此Except()方法返回的IEnumerable<T>必须转换为List<T>类型。


8
你可以通过两种方式进行删除。
var output = from x in authorsList
             where x.firstname != "Bob"
             select x;

或者

var authors = from x in authorsList
              where x.firstname == "Bob"
              select x;

var output = from x in authorsList
             where !authors.Contains(x) 
             select x;

我有同样的问题,如果你想根据你的where条件得到简单的输出,那么第一个解决方案更好。


我该如何检查是否存在“Bob”或“Billy”? - Si8

7
LINQ起源于函数式编程,强调对象的不可变性,因此它没有提供内置的方法来原地更新原始列表。
关于不可变性的说明(摘自另一个SO答案):
以下是维基百科Wikipedia中对不可变性的定义:
在面向对象和函数式编程中,不可变对象是指创建后其状态无法修改的对象。

7
假设authorsToRemove是包含你想要从authorsList中删除的元素的IEnumerable<T>,那么这里有另一种非常简单的方法可以完成OP所需的删除任务:
authorsList.RemoveAll(authorsToRemove.Contains);

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接