我有一个提取字符串部分的问题。比如说我有一个像这样的字符串:
a <- "DP=26;AN=2;DB=1;AC=1;MQ=56;MZ=0;ST=5:10,7:2;CQ=SYNONYMOUS_CODING;GN=NOC2L;PA=1^1:0.720&2^1:0"
我需要提取在GN=
和;
之间的所有内容,因此这里将是NOC2L
。
这是否可能?
注意:这是VCF文件格式中的INFO
列。 GN是基因名称,因此我们要从INFO
列中提取基因名。