我有一个包含以下数据的txt文件:
chrI
ATGCCTTGGGCAACGGT...(多行)
chrII
AGGTTGGCCAAGGTT...(多行)
我想先找到“chrI”,然后迭代ATGC的多行,直到找到第x个字符。然后我想打印第x个字符到第y个字符。我一直在使用正则表达式,但是一旦我定位到包含chrI的行,我不知道如何继续迭代以找到第x个字符。
这是我的代码:
chrI
ATGCCTTGGGCAACGGT...(多行)
chrII
AGGTTGGCCAAGGTT...(多行)
我想先找到“chrI”,然后迭代ATGC的多行,直到找到第x个字符。然后我想打印第x个字符到第y个字符。我一直在使用正则表达式,但是一旦我定位到包含chrI的行,我不知道如何继续迭代以找到第x个字符。
这是我的代码:
for i, line in enumerate(sacc_gff):
for match in re.finditer(chromo_val, line):
print(line)
for match in re.finditer(r"[ATGC]{%d},{%d}\Z" % (int(amino_start), int(amino_end)), line):
print(match.group())
变量含义:
chromo_val
= chrI
amino_start
= (我的程序找到的一些起始点)
amino_end
= (我的程序找到的一些终止点)
注意:amino_start
和amino_end
需要以变量形式存在。
如果您还有疑问,请告诉我。谢谢。