我正在尝试使用Python按字母顺序对二元组列表进行排序。我的输出现在看起来像这样:
我希望输出结果按字母顺序排列,并且每个二元组只出现一次,最好还能附带频率计数。
我很乐意提供帮助,谢谢!
('hello', 'how')
('how', 'are')
('are', 'you')
('you', '?')
('Are', 'you')
('you', 'okay')
('okay', '?')
我希望输出结果按字母顺序排列,并且每个二元组只出现一次,最好还能附带频率计数。
('are', 'you'), 2
('hello', 'how'), 1
('how', 'are'), 1
('okay', '?'), 1
('you', 'okay'), 1
('you', '?'), 1
我的代码看起来像这样:
def bigram(x):
with open (x, 'r', encoding='utf-8') as f:
mylist = f.read()
n = 2
grams = ngrams(nltk.word_tokenize(mylist), n)
for bigrams in grams:
return bigrams
我很乐意提供帮助,谢谢!
sorted(list_of_tuples, key = lambda x: x[0])
。 - Arco Bast('you', '?')
之前打印('you', 'okay')
?这不符合 ASCII 码。 - Alfe