我正在处理一些类似FASTA的序列(不是FASTA,但是我定义了一些与PISCES服务器中筛选出的PDB相似的内容)。
我有一个问题。我有一小组名为nCatSeq
的序列,其中有多个nBasinSeq
。我遍历一个大的PDB文件,并想提取每个nCatSeq
对应的nBasinSeq
,并在字典中去除冗余。以下是执行此操作的代码片段。
nCatSeq=item[1][n]+item[1][n+1]+item[1][n+2]+item[1][n+3]
nBasinSeq=item[2][n]+item[2][n+1]+item[2][n+2]+item[2][n+3]
if nCatSeq not in potBasin:
potBasin[nCatSeq]=nBasinSeq
else:
if nBasinSeq not in potBasin[nCatSeq]:
potBasin[nCatSeq]=potBasin[nCatSeq],nBasinSeq
else:
pass
我得到了以下结果作为一个nCatSeq的答案:
'4241': ((('VUVV', 'DDRV'), 'DDVG'), 'VUVV')
然而,我希望的是:
'4241': ('VUVV', 'DDRV', 'DDVG', 'VUVV')
由于以下命令,我不想要所有额外的括号。
potBasin[nCatSeq]=potBasin[nCatSeq],nBasinSeq
(见上面的代码片段)
有办法做到这一点吗?