我有一个带有4列的CSV文件,第一列是case id
(重复出现)。
========INPUT csv file=============
case_num, serial,binary,review
23,29983, 1, "lorem ipsum ,lorem ipsum"
23,298829, 1, "Hi there"
29, 20020, 0, "hickery dickery dock"
29,298829, 1, "Hello there"
29, 28220, 0, "dickery dock"
我正在尝试根据唯一案件编号的数量筛选所有行。
input=pandas.read_csv("inp.csv")
case_id=fl["case_num"]
case_id.sort
with open("out.csv","w") as fl:
for i in case_id.unique():
fl.write(([input['case_num']==i].iloc[0].values))
输出:
[23 '29983' 1
'lorem ipsum ,lorem ipsum'] #<type 'numpy.ndarray'>
[29 '20220' 0
'hickery dickery dock'] #<type 'numpy.ndarray'>
正如您所看到的,输出结果被写成不同的行,但是我希望它们能够以逗号分隔的一行输出。
=====期望的输出结果=======
23, '29983', 1, 'lorem ipsum ,lorem ipsum'
29 ,'20220', 0, 'hickery dickery dock'
简而言之,如果我从一个数据框(使用csv文件生成)中读取了一些行,那么我如何将所选择的子集以与输入csv文件相同的格式精确地写入输出csv文件中。