我很简单的问题。我有一个数据集(下面展示了一个小样本)。
22 85 203 174 9 0 362 40 0
21 87 186 165 5 0 379 32 0
30 107 405 306 25 0 756 99 0
6 5 19 6 2 0 160 9 0
21 47 168 148 7 0 352 29 0
28 38 161 114 10 3 375 40 0
27 218 1522 1328 114 0 1026 310 0
21 78 156 135 5 0 300 27 0
我需要解决的第一个问题是将每个空格替换为逗号,我用以下代码实现了这一点:
import fileinput
with open('Data_Sorted.txt', 'w') as f:
for line in fileinput.input('DATA.dat'):
line = line.split(None,8)
f.write(','.join(line))
以下是结果。
22,85,203,174,9,0,362,40,0
21,87,186,165,5,0,379,32,0
30,107,405,306,25,0,756,99,0
6,5,19,6,2,0,160,9,0
21,47,168,148,7,0,352,29,0
28,38,161,114,10,3,375,40,0
27,218,1522,1328,114,0,1026,310,0
21,78,156,135,5,0,300,27,0
我的下一步是获取最后一列的值,检查它们是否小于2,并用字符串“nfp”替换它。
我可以使用以下方法分离最后一列。
for line in open("Data_Sorted.txt"):
columns = line.split(',')
print columns[8]
我的问题是如何实现条件替换为字符串的值,然后我不确定如何将修改后的列放回原始数据集中。