我有一个程序,逐个单词地读取文件,并将单词重新写入另一个文件,但不包括第一个文件中的非ASCII字符。
import unicodedata
import codecs
infile = codecs.open('d.txt','r',encoding='utf-8',errors='ignore')
outfile = codecs.open('d_parsed.txt','w',encoding='utf-8',errors='ignore')
for line in infile.readlines():
for word in line.split():
outfile.write(word+" ")
outfile.write("\n")
infile.close()
outfile.close()
我遇到的唯一问题是,在这段代码中它没有将新行打印到第二个文件(d_parsed)中。有什么线索吗?