我有一个Python中的DataFrame,长这样:
有100行标签为“1”,只有50行标签为“0”。我想要一个平衡的数据集,其中有50行标签为“0”和50行标签为“1”。不管哪些带有标签“1”的行被丢弃都无所谓。
在Python中是否有简洁的方法来实现这个目标?
Text Label
0 abc 0
1 def 1
2 ghi 1
3 . .
4 . .
5 . .
有100行标签为“1”,只有50行标签为“0”。我想要一个平衡的数据集,其中有50行标签为“0”和50行标签为“1”。不管哪些带有标签“1”的行被丢弃都无所谓。
在Python中是否有简洁的方法来实现这个目标?
.sample
提供一个解决方案,但这个更加简洁。 - wbadart