因此,我编写了以下代码来提取带有'#'的标签和带有'@'的标签,然后将它们附加到一个列表中并按降序排序。事实上,文本可能没有完美地格式化,每个单独的标签和接下来的标签之间可能没有空格,这可能会导致问题-可以通过for循环中的#print语句进行检查:
#socality#thisismycommunity#themoderndayexplorer#modernoutdoors#mountaincultureelevated
.split()方法不能处理这些。如何解决这个问题才是最佳实践?
这里是.txt文件。
感谢您的时间。
#socality#thisismycommunity#themoderndayexplorer#modernoutdoors#mountaincultureelevated
.split()方法不能处理这些。如何解决这个问题才是最佳实践?
这里是.txt文件。
感谢您的时间。
name = input("Enter file:")
if len(name) < 1 : name = "tags.txt"
handle = open(name)
tags = dict()
lst = list()
for line in handle :
hline = line.split()
for word in hline:
if word.startswith('@') : tags[word] = tags.get(word,0) + 1
else :
tags[word] = tags.get(word,0) + 1
#print(word)
for k,v in tags.items() :
tags_order = (v,k)
lst.append(tags_order)
lst = sorted(lst, reverse=True)[:34]
print('Final Dictionary: ' , '\n')
for v,k in lst :
print(k , v, '')