我正在寻找解决这个问题有用的算法或方法:
假设我有一个数据框:
假设我有一个数据框:
x y Bin1 Bin2 Bin3
153.0303 -27.17894 10 6 5
153.0303 -27.17916 8 7 8
153.0303 -27.17938 1 6 3
153.0300 -27.17960 10 1 8
这个数据集有大约10k行。每个Bin可以是1到10的整数。我想做的是选择一个随机子集,其中每个Bin只有唯一的值。例如,这个数据框是有效的,因为每个Bin都有10个不同的值。
x y Bin1 Bin2 Bin3
153.0303 -27.17894 1 6 4
153.0303 -27.17916 2 7 2
153.0303 -27.17938 3 5 3
153.0300 -27.17960 4 3 8
153.0303 -27.17938 5 4 1
153.0300 -27.17960 6 8 7
153.0303 -27.17938 7 1 6
153.0300 -27.17960 8 2 10
153.0303 -27.17938 9 10 5
153.0300 -27.17960 10 9 9
我目前的方法是反复随机选择行,直到找到一种组合。然而,我正在尝试找到一种更有效的方法。
提前感谢您!