我正在将数据写入CSV文件,然后一旦完成,就将文件复制到另一个目录。
这都是在循环中进行的,因此当第二次迭代开始时,它会从已复制的文件中读取数据。
问题在于,在第二次迭代开始时,文件仍在被复制,这会导致明显的问题。
我应该如何等待循环中整个函数完成,然后再开始第二次迭代?它应该能够继续进行任意数量的迭代。
for rule in substring_rules:
substring(rule)
这个函数:
def substring(rule, remove_rows=[]):
writer = csv.writer(open("%s%s" % (DZINE_DIR, f), "wb"))
from_column = rule.from_column
to_column = rule.to_column
reader = csv.reader(open("%s%s" % (OUTPUT_DIR, f)))
headers = reader.next()
index = 0
from_column_index = None
for head in headers:
if head == from_column:
from_column_index = index
index += 1
if to_column not in headers:
headers.append(to_column)
writer.writerow(headers)
row_index = 0
for row in reader:
if rule.get_rule_type_display() == "substring":
try:
string = rule.string.split(",")
new_value = string[0] + row[from_column_index] + string[1]
if from_column == to_column:
row[from_column_index] = new_value
else:
row.append(new_value)
except Exception, e:
print e
if row_index not in remove_rows:
writer.writerow(row)
row_index += 1
shutil.copyfile("%s%s" % (DZINE_DIR,f), "%s%s" % (OUTPUT_DIR, f))
for row in reader: for rule in substring_rules: ...
这样的方式来避免复制。 - Janne Karila