如何使用numpy从列表中随机选择n个元素?

24

我有一个向量列表:

>>> import numpy as np
>>> num_dim, num_data = 10, 5
>>> data = np.random.rand(num_data, num_dim)
>>> data
array([[ 0.0498063 ,  0.18659463,  0.30563225,  0.99681495,  0.35692358,
         0.47759707,  0.85755606,  0.39373145,  0.54677259,  0.5168117 ],
       [ 0.18034536,  0.25935541,  0.79718771,  0.28604057,  0.17165293,
         0.90277904,  0.94016733,  0.15689765,  0.79758063,  0.41250143],
       [ 0.80716045,  0.84998745,  0.17893211,  0.36206016,  0.69604008,
         0.27249491,  0.92570247,  0.446499  ,  0.34424945,  0.08576628],
       [ 0.35311449,  0.67901964,  0.71023927,  0.03120829,  0.72864953,
         0.60717032,  0.8020118 ,  0.36047207,  0.46362718,  0.12441942],
       [ 0.1955419 ,  0.02702753,  0.76828842,  0.5438226 ,  0.69407709,
         0.20865243,  0.12783666,  0.81486189,  0.95583274,  0.30157658]])

data 中,我需要随机选择 3 个向量,可以使用以下方法:

>>> import random
>>> random.sample(data, 3)
[array([ 0.80716045,  0.84998745,  0.17893211,  0.36206016,  0.69604008,
        0.27249491,  0.92570247,  0.446499  ,  0.34424945,  0.08576628]), array([ 0.18034536,  0.25935541,  0.79718771,  0.28604057,  0.17165293,
        0.90277904,  0.94016733,  0.15689765,  0.79758063,  0.41250143]), array([ 0.35311449,  0.67901964,  0.71023927,  0.03120829,  0.72864953,
        0.60717032,  0.8020118 ,  0.36047207,  0.46362718,  0.12441942])]

我已经查看了http://docs.scipy.org/doc/numpy/reference/routines.random.html上的文档,但我无法确定在numpy中是否有random.sample()这样的功能。

numpy.random.sample()random.sample() 是否相同?

在numpy中是否有与random.sample()等效的功能?


3
我认为你正在寻找np.random.choice。尽管如此,你需要传递replace=False才能使其表现得像random.sample - ayhan
1
你想要做什么?numpy.random.sample 做了什么(或者没做)是你想要(或者不想要)它做的吗? - BrenBarn
@brenbarn 我需要从向量列表中随机选择n个元素。 - alvas
@ayhan,类似于这样:data[np.random.choice(range(len(data)), size=3, replace=False)] - alvas
1
没错。你不需要使用 range。你可以传递一个整数,然后它会从 np.arange(n) 中进行选择。 - ayhan
1个回答

33

正如@ayhan所确认的那样,可以这样做:

>>> data[np.random.choice(len(data), size=3, replace=False)]
array([[ 0.80716045,  0.84998745,  0.17893211,  0.36206016,  0.69604008,
         0.27249491,  0.92570247,  0.446499  ,  0.34424945,  0.08576628],
       [ 0.35311449,  0.67901964,  0.71023927,  0.03120829,  0.72864953,
         0.60717032,  0.8020118 ,  0.36047207,  0.46362718,  0.12441942],
       [ 0.1955419 ,  0.02702753,  0.76828842,  0.5438226 ,  0.69407709,
         0.20865243,  0.12783666,  0.81486189,  0.95583274,  0.30157658]])

来自文档

numpy.random.choice(a, size=None, replace=True, p=None)

从给定的一维数组中生成随机样本。

np.random.choice(data, size=3, replace=False) 从数据的索引列表中选择3个元素,且不重复。然后,data [...] 切片索引,并检索用np.random.choice选择的索引。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接