如何检查我的数组中是否有重复的值?

29

这是我的数组。

double[] testArray = new double[10];
// will generate a random numbers from 1-20, too lazy to write the code

我想制作一个搜索循环来检查是否有任何值被重复。我该如何做?

因为这是一个小数组,所以我更倾向于不使用任何特殊的内置方法。

8个回答

71

使用一点 Linq 就可以做到这一点:

if (testArray.Length != testArray.Distinct().Count())
{
    Console.WriteLine("Contains duplicates");
}

Distinct 扩展方法可移除任何重复项,Count 获取结果集的大小。如果它们不同,则列表中存在一些重复项。

或者,这里有一个更复杂的查询,但可能更有效:

if (testArray.GroupBy(x => x).Any(g => g.Count() > 1))
{
    Console.WriteLine("Contains duplicates");
}

GroupBy 方法可以将相同的元素分组,而 Any 返回 true,如果任何一组中有多个元素。

上述两种解决方案都利用了HashSet<T>,但是你也可以像这样直接使用 HashSet:

if (!testArray.All(new HashSet<double>().Add))
{
    Console.WriteLine("Contains duplicates");
}

或者,如果您更喜欢不依赖于 Linq 的解决方案:

var hashSet = new HashSet<double>();
foreach(var x in testArray) 
{
    if (!hashSet.Add(x)) 
    {
        Console.WriteLine("Contains duplicates");
        break;
    }
}

哦,好的,谢谢。Distinct().Count() 通常是用来做什么的? - puretppc
哦,我明白了。那么如果我只想检查重复项,我就可以删除Distinct()吗?而Count()方法表示它被重复多少次,例如结果集的大小? - puretppc
1
@Mike,Count 不会返回集合中的项目数量,即 testArray.Length == testArray.Count()。要获取重复项的数量,只需将两者相减,即 testArray.Length - testArray.Distinct().Count() - p.s.w.g
好的,谢谢。第二个方法足以检查是否有重复。 - puretppc

2

请看我的实现,它是通用高效的。

public static bool HasDuplicates<T>(IList<T> items)
    {
        Dictionary<T, bool> map = new Dictionary<T, bool>();
        for (int i = 0; i < items.Count; i++)
        {
            if (map.ContainsKey(items[i]))
            {
                return true; // has duplicates
            }
            map.Add(items[i], true);
        }
        return false; // no duplicates
    }

这里是一些调用。
string[] strings = new[] { "1", "2", "3" };
Utility.HasDuplicates(strings)// this will return false

int[] items=new []{1,2,3,1};
Utility.HasDuplicates(items)// this will return true

谢谢,我稍微修改了一下,使用了IEnumerable而不是IList。我还将其转换为扩展方法。 - torsan

2

使用(OP)生成10个随机双精度浮点数非常快。 重复的概率:约为0.000002%。

static bool repeat(double[] a)
{
    return
        a[0] == a[1] || a[0] == a[2] || a[0] == a[3] || a[0] == a[4] ||
        a[0] == a[5] || a[0] == a[6] || a[0] == a[7] || a[0] == a[8] ||
        a[0] == a[9] || a[1] == a[2] || a[1] == a[3] || a[1] == a[4] ||
        a[1] == a[5] || a[1] == a[6] || a[1] == a[7] || a[1] == a[8] ||
        a[1] == a[9] || a[2] == a[3] || a[2] == a[4] || a[2] == a[5] ||
        a[2] == a[6] || a[2] == a[7] || a[2] == a[8] || a[2] == a[9] ||
        a[3] == a[4] || a[3] == a[5] || a[3] == a[6] || a[3] == a[7] ||
        a[3] == a[8] || a[3] == a[9] || a[4] == a[5] || a[4] == a[6] ||
        a[4] == a[7] || a[4] == a[8] || a[4] == a[9] || a[5] == a[6] ||
        a[5] == a[7] || a[5] == a[8] || a[5] == a[9] || a[6] == a[7] ||
        a[6] == a[8] || a[6] == a[9] || a[7] == a[8] || a[7] == a[9] ||
        a[8] == a[9];
}

更通俗易懂地说,使用10个数字的情况下,速度比上述方法慢大约2倍,但比哈希集合方法快大约7倍。
static bool repeat(double[] a)
{
    int k = a.Length - 1;
    if (k < 70)
    {
        double aj;
        for (int i = 0, j; i < k; )
        {
            for (aj = a[k--], j = k; j >= i; j--)
                if (aj == a[j]) return true;
            for (aj = a[i++], j = i; j <= k; j++)
                if (aj == a[j]) return true;
        }
        return false;
    }
    var h = new HashSet<double>();
    while (k >= 0) if (!h.Add(a[k--])) return false;
    return true;
}

两行(慢速重复;)

static bool repeat(double[] a)
{ return (new HashSet<double>(a).Count < a.Length); }

2
使用哈希集合来添加成员,然后检查当前成员是否有先前出现过的情况。
public bool ContainsDuplicate(double[] nums) 
{
            int size = nums.Length;
            HashSet<double> set1 = new HashSet<double>();

            for (int i = 0; i < size; i++)
            {
                if (set1.Contains(nums[i]))
                {
                    return true;
                }
                else
                {
                    set1.Add(nums[i]);
                }
            }
            return false;
}

1
我们必须在第一个循环中从i初始化j并加一(i+1),因为我们想将第一个循环值与同一数组的下一个值进行比较。
int[] arr = new int[]{1,2,3,1,4,2,5,4};

//create one loop for arr values
for (int i = 0;  i < arr.Length; i++)
{
    //create nested loop for compare current values with actual value of arr
    for (int j = i+1; j < arr.Length; j++)
    {

        //and here we put our condition
        if (arr[i] == arr[j])
        {
            Console.WriteLine(arr[i]);
        }
    }
}

这个方法的时间复杂度是O(n^2),太慢了,不是高效的方法。 - M.Kasaei

1
请使用此代码:
bool CheckUniqueness(double[] values)
{
    var uniqueValues = new HashSet<double>();
    foreach (double d in values)
    {
        if(uniqueValues.Contains(d))
        {
            return false;
        }
        uniqueValues.Add(d);
    }
    return true;
}

0

通用扩展方法:

public static bool HasDuplicate<T>(this IEnumerable<T> source, IEqualityComparer<T> comparer)
{
    if (source == null)
        throw new ArgumentException(nameof(source));

    HashSet<T> set = new HashSet<T>(comparer);
    foreach (var item in source)
        if (!set.Add(item))
            return true;

    return false;
}

-1
        int[] nums = new int[] { 1, 2, 3, 4, 5};



        Console.WriteLine(AnyDuplicate(nums));
    }
    /// <summary>
    /// Returns true if there is at least a duplicate in the array.
    /// </summary>
    /// <returns></returns>
    static bool AnyDuplicate(int[] numbers)
    {            
        for (int i = 0; i < numbers.Length; i++)
        {
            for (int j = i + 1; j < numbers.Length; j++)
            {
                if (numbers[i] == numbers[j])
                {
                    return true; 
                }
            }
        }
        return false;

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接