772得票14回答
在Go语言中,表示枚举类型的惯用方式是什么?

我正在尝试表示一个简化的染色体,其中包含N个碱基,每个碱基只能是{A,C,T,G}中的一个。 我想用枚举来规范约束条件,但我想知道在Go语言中模拟枚举最惯用的方式是什么。

110得票11回答
存储人类基因组需要多少存储空间?

我正在寻找存储单个人类基因组所需的存储容量,以字节(MB、GB、TB等)为单位。我读过维基百科上关于DNA、染色体、碱基对和基因的一些文章,并有一些大致猜测,但在透露任何信息之前,我想看看其他人如何处理这个问题。 另一个问题是人类DNA中有多少个原子,但那将不属于本站的主题。 我知道这将是...

16得票3回答
如何在染色体图上绘制位置

我想生成一个展示我工作的生物体的14个线性染色体的图,按比例缩放,并在每个染色体上指定位置绘制着色条。理想情况下,我想使用 R 语言完成,因为这是我唯一熟悉的编程语言。 我已经探索了各种方法,例如使用 GenomeGraphs,但我发现这比我想要的更加复杂/显示的数据比我拥有的数据更多(例如...

15得票3回答
如何在Python中使用Matplotlib创建曼哈顿图?

很遗憾,我自己没有找到解决方案。我该如何在Python中使用matplotlib/pandas创建林地图?问题在于这些图表的x轴是离散的。from pandas import DataFrame from scipy.stats import uniform from scipy.stats ...

11得票3回答
将SNP ID映射到基因组坐标

我有几个SNP ID(例如rs16828074,rs17232800等),我想从UCSC基因组网站中获取它们在Hg19基因组的坐标。 我希望使用R来实现这个目标。怎么做呢?

10得票7回答
补全DNA序列

假设我有一个DNA序列。我想得到它的互补序列。我使用了以下代码,但是我没有得到想要的结果。我做错了什么? s=readline() ATCTCGGCGCGCATCGCGTACGCTACTAGC p=unlist(strsplit(s,"")) h=rep("N",nchar(s)) unli...

9得票3回答
如何在R中读取vcf文件

我有一个名为VCF格式的文件,我希望在R中读取此文件。然而,该文件包含一些冗余行,我想跳过这些行。我想要的结果是以匹配#CHROM的行开头的结果。以下是我尝试过的内容: chromo1<-try(scan(myfile.vcf,what=character(),n=5000,sep="...