我是Python的新手,这个问题困扰了我很长时间。 我有一个文件看起来像这样:
name seq
1 a1 bbb
2 a2 bbc
3 b1 fff
4 b2 fff
5 c1 aaa
6 c2 acg
其中name是字符串的名称,seq是字符串本身。我想要一个新的列或者一个新的数据框来表示每两行之间不重叠的差异数。例如,我想知道名称[a1-a2]、[b1-b2]和[c1-c2]之间序列的差异数。
因此,我需要像这样的东西:
name seq diff
1 a1 bbb NA
2 a2 bbc 1
3 b1 fff NA
4 b2 fff 0
5 c1 aaa NA
6 c2 acg 2
非常感谢您的帮助