58得票11回答
如何在iPython笔记本中调用使用argparse编写的模块

我正在尝试将BioPython序列传递给iPython笔记本环境中Ilya Stepanov实现的Ukkonen后缀树算法。 我在argparse组件上遇到了困难。 我以前从未直接使用过argparse。 如何在不重写main()的情况下使用它? 顺便说一下,这篇关于Ukkonen算法的文...

17得票14回答
Biopython模块未找到Bio。

请注意:这不是重复内容! 在运行 Python 代码之前,我在命令提示符中安装了 Biopython:pip install biopython 在尝试在Python中导入它时,我收到一个错误,提示“没有名为Bio的模块”import Bio 相同的事情也会发生在import biopyth...

17得票3回答
SeqIO.parse在fasta.gz文件上的应用

我刚开始学编程,也是第一次上线提问。我该怎样打开一个压缩的fasta.gz文件,以便在我的函数里提取信息并执行计算呢?以下是我尝试做的简化示例(我已经尝试了不同的方法),以及错误提示。我使用的gzip命令似乎无法正常工作。with gzip.open("practicezip.fasta.gz...

15得票11回答
如何使用Python或R将三字母氨基酸代码转换为一字母代码?

我有一个fasta文件,如下所示。我想把三字母代码转换为一字母代码。我该如何使用python或R完成?>2ppo ARGHISLEULEULYS >3oot METHISARGARGMET 期望的输出>2ppo RHLLK >3oot MHRRM 欢迎提出您的建议!

13得票3回答
如何在Python中查找开放阅读框架

我正在使用Python和正则表达式来查找一个ORF(开放阅读框架)。 查找一个子字符串,它仅由字母ATGC(没有空格或换行符)组成,该子字符串应满足以下条件: 以ATG开头,以TAG、TAA或TGA结尾,并且应从第一个字符、第二个字符和第三个字符考虑序列:Seq= "CCTCAGCGAGG...

13得票10回答
使用Python进行DNA链的反向互补序列

我有一段DNA序列,想用Python获取其反向互补序列。它在CSV文件的一个列中,并且我想将反向互补序列写入同一文件的另一列中。棘手的部分是,有几个单元格包含除A、T、G和C以外的内容。我使用以下代码成功地获得了反向互补序列: def complement(seq): complem...

10得票3回答
为什么我在网页上运行CGI脚本时Python找不到一些模块?

我不知道这里可能出了什么问题: 我有一些来自Biopython的模块,当我使用交互式提示或通过命令行执行python脚本时,可以轻松导入这些模块。 问题是,当我尝试在Web可执行的cgi脚本中导入相同的biopython模块时,会出现“导入错误”: “没有名为Bio的模块。” 有任何想...

9得票1回答
史密斯-沃特曼算法中的回溯,带有仿射间隙惩罚

我正在尝试使用仿射间隙罚函数实现Smith-Waterman算法进行本地序列比对。我认为我理解如何初始化和计算计算比对分数所需的矩阵,但是不知道如何回溯以找到比对。为了生成所需的3个矩阵,我有以下代码 for j in range(1, len2): for i in range(1...

9得票2回答
Biopython SeqIO 转换为 Pandas 数据表格

我有一个FASTA文件,可以通过SeqIO.parse轻松解析。 我想提取序列ID和序列长度。我使用了以下代码来实现,但我觉得这太重了(两次迭代,转换等)。 from Bio import SeqIO import pandas as pd # parse sequence fasta...

8得票4回答
多重FASTA文件处理

我想知道是否有任何生物信息学工具可以处理multiFASTA文件,给我提供序列数量、长度、核苷酸/氨基酸含量等信息,并可能自动绘制描述性图表。一个R BIoconductor解决方案或BioPerl模块也可以,但我没有找到任何东西。你能帮忙吗?非常感谢 :-)