Pythonic替换字符的方式

4
我希望你能使用python的方式替换字符串中的一些字符。
A -> T
C -> G
G -> C
T -> A

例子:

AAATCGATTGAT

将被转化为

TTTAGCTAACTA

我所做的:

def swap(string):
    string = re.sub('A', 'aux', string)
    string = re.sub('T', 'A', string)
    string = re.sub('aux', 'T', string)
    string = re.sub('C', 'aux', string)
    string = re.sub('G', 'C', string)
    string = re.sub('aux', 'G', string)

    return string

这个方法很好用,但我正在寻找更符合Python语言特点的解决方案。

2个回答

5
使用字典推导和 str.join 方法:
translateDict = {
  "A" : "T",
  "C" : "G",
  "G" : "C",
  "T" : "A"
}

s1 = "AAATCGATTGAT"
reconstructed = "".join(translateDict.get(s, s) for s in s1)

在这里,您可以找到实时示例

请注意dict.get的使用;如果字母不在字典中,我们只是让它保持原样。

正如@bravosierra99所建议的那样,您也可以简单地使用str.translate

reconstructed = s1.translate(string.maketrans(translateDict))

谢谢你的回答。这正是我所寻找的 <3 - lmalmeida
如果你要进行翻译,那么你应该做好充分的准备。https://www.programiz.com/python-programming/methods/string/translate - bravosierra99
@bravosierra99,你的链接在移动设备上无法阅读(有一个大广告,关闭按钮在屏幕外)。也许可以改为链接到官方文档或相关的Stack Overflow问题? - tripleee
@tripleee,你在答案中有官方文档的链接 ;) - Netwave

2
以下是关于Chepner删除的答案进行重构的翻译,它仅调用了一次maketrans函数。最初的回答为:

这里对Chepner删除的答案进行了重构,只调用了一次maketrans函数。

tt = str.maketrans({"A":"T", "C":"G", "G":"C", "T": "A"})
for s1 in "AGACAT", "TAGGAC", "ACTAGAA":
    print(s1.translate(tt))

也许还应该指出,您可以链接来自replace的结果,尽管这仍然很笨拙和低效: "最初的回答"
def acgtgca(s1):
    return s1.replace(
        "A", "\ue0fa").replace(
        "G", "\ue0fb").replace(
        "C", "G").replace(
        "T", "A").replace(
        "\ue0fb", "C").replace(
        "\ue0fa", "T")

避免使用"aux"作为特殊标记,而是选择两个Unicode专用区中的任意字符。但是,maketrans方法更加整洁和高效。最初的回答。

也许可以参考 https://dev59.com/MHE95IYBdhLWcg3wDpcG,其中有一个使用 reduce 的不错的替代方案。 - tripleee

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接