我正在尝试将两个Excel文档进行比较,它们由大约6000行和4列组成,第一列是域名,其余三列是注释。其中一个文档在某些列中有更新的注释,最终我希望这个脚本能够像批量更新一样,替换旧的过时注释。
到目前为止,我编写的代码打开了这些文档并将它们添加到两个不同的列表中:
import csv
newlist = csv.reader(open('newcomments.csv','rU'), dialect='excel')
export = csv.reader(open('oldcomments.csv', 'rU'), dialect='excel')
for row in newlist:
olddomain=[]
domain = row[0:]
olddomain.append(domain)
for item in olddomain:
print item
for row in export:
newdomain=[]
domain= row[0:]
newdomain.append(domain)
for item in newdomain:
print item
列表的输出结果看起来像这样(第二列通常为空):
['example.com', '', 'excomment', 'Parked Page']
尝试比较列表时,我尝试了以下方法:
if item in olddomain != item in newdomain:
print "no match"
else:
print "match"
但是发现这种方法似乎不起作用,例如,在两个文件中的第一行包含完全相同的数据,但代码返回“无匹配项”,在两个文件中的第二行也包含相同的数据,但代码返回“匹配”。
问题是我将行保存到列表的方式有问题吗,还是我还缺少其他东西? 我假设有更好的方法来解决这个问题,但我正在利用它来学习更多的Python!
感谢您的时间。