用Python生成分类数据集

3
假设我有一个包含十个城市的列表:
["paris", "barcelona", "kolkata", "new york"]

我该如何模拟 n 个随机数据集,每个数据集包含两个属性,每个属性从上述列表中选择了 2 个城市:
["paris", "barcelona"]
["barcelona", "kolata"]
["new york", "paris"]
["paris", "barcelona"]
["new york", "paris"]
1个回答

5
您可以这样使用 random.sample
data = ["paris", "barcelona", "kolkata", "new york"]
import random
print [random.sample(data, 2) for _ in xrange(5)]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接