我一直在使用CSV数据来实现我的脚本,并希望将数据分成两个数据集进行抽样:
我希望这可以使用基本的Python来实现,而不需要使用任何其他外部模块,如NumPy、SciPy、Pandas或Scikitlearn。有人能帮我按百分比随机抽样数据吗?此外,我将提供包含随机观察数量的数据集。到目前为止,我只了解了Pandas和其他各种模块来按百分比抽样数据,并没有得到针对我的问题的具体解决方案。
此外,我希望在两个文件中保留CSV头。因为标题可以使每行可访问,并可用于进一步分析。
- 测试数据
- 训练数据
我希望这可以使用基本的Python来实现,而不需要使用任何其他外部模块,如NumPy、SciPy、Pandas或Scikitlearn。有人能帮我按百分比随机抽样数据吗?此外,我将提供包含随机观察数量的数据集。到目前为止,我只了解了Pandas和其他各种模块来按百分比抽样数据,并没有得到针对我的问题的具体解决方案。
此外,我希望在两个文件中保留CSV头。因为标题可以使每行可访问,并可用于进一步分析。
Test.csv
和Train.csv
来自主文件data.csv
。我希望85%的数据应该在test.csv
中,其余15%的数据在train.csv
中。 - desmond.carros