假设我有一个DNA字符串“GAAGGAGCGGCGCCCAAGCTGAGATAGCGGCTAGAGGCGGGTAACCGGCA”。
考虑前5个字母:GAAGG
我想用一些数字替换每个重叠的二元组'GA','AA','AG','GG',这些数字对应于它们出现的可能性,并将它们相加。例如,“GA”=1,“AA”=2,“AG”=0.7,“GG”=0.5。因此,对于GAAGG,我的sumAnswer = 1 + 2 + 0.7 + 0.5。
所以在伪代码中,我想要... -遍历DNA字符串中的每个重叠的二元组 -找到每个唯一二元组对应的值 -迭代地求和每个值
我不确定如何遍历每个二元组。我认为for循环会起作用,但是它没有考虑重叠:它会打印每个2个元素的组合(GAGC = GA,GC),而不是每个重叠的2个元素的组合(GAGC = GA,AG,GC)。
考虑前5个字母:GAAGG
我想用一些数字替换每个重叠的二元组'GA','AA','AG','GG',这些数字对应于它们出现的可能性,并将它们相加。例如,“GA”=1,“AA”=2,“AG”=0.7,“GG”=0.5。因此,对于GAAGG,我的sumAnswer = 1 + 2 + 0.7 + 0.5。
所以在伪代码中,我想要... -遍历DNA字符串中的每个重叠的二元组 -找到每个唯一二元组对应的值 -迭代地求和每个值
我不确定如何遍历每个二元组。我认为for循环会起作用,但是它没有考虑重叠:它会打印每个2个元素的组合(GAGC = GA,GC),而不是每个重叠的2个元素的组合(GAGC = GA,AG,GC)。
for i in range(0, len(input), 2):
print input[i:i+2]
有什么技巧吗?