我为计算字符二元组编写了以下代码,输出结果如下。我的问题是,如何获得一个不包括最后一个字符(即t)的输出?有没有更快、更有效的方法来计算字符 n-gram?
b='student'
>>> y=[]
>>> for x in range(len(b)):
n=b[x:x+2]
y.append(n)
>>> y
['st', 'tu', 'ud', 'de', 'en', 'nt', 't']
这里是我想要得到的结果:['st','tu','ud','de','nt]
谢谢您提前的建议。