我有一本大书存储在一个纯文本文件中,想解析它以创建每个章节的单独文件。我使用了一些简单的正则表达式来找到每个章节标题,但是我在捕获标题之间的所有文本方面遇到了困难。
import re
txt = open('book.txt', 'r')
for line in txt :
if re.match("^[A-Z]+$", line):
print line,
我知道这很基础,但我对Python还不太熟悉,所以卡住了。目前我的思路是逐行进行以下操作:
- 如果这一行是章节标题:新建一个文件 'chapter_title.txt'
- 如果下一行不是章节标题:把这一行写入 'chapter_title.txt'
for line in txt :
if re.match("^[A-Z]+$", line):
f = open(line + '.txt', 'w')
else f.write(line + "\n")
作为我的一般方法,但这样写不会起作用。希望能得到关于循环结构的帮助。谢谢。