我看到了这个问题,它关注的是“Brittney Spears”问题。但我的问题略有不同。算法如何确定需要排名的单词或短语?例如,如果我发一条推文说“迈克尔·杰克逊去世了”,它如何知道要提取出“迈克尔·杰克逊”而不是“去世了”?
或者假设那一天艾利克·鲍德温和斯蒂芬·鲍德温都在新闻中出现,并因此在许多推文中被提及。它如何知道要区别对待两个名字,而不只是提取出“鲍德温”?
如果朴素地完成,我可以看出这个问题会成为NP完全问题(你必须将推文中所有可能的短语与其他人的推文中的所有可能的短语进行比较)。
或者假设那一天艾利克·鲍德温和斯蒂芬·鲍德温都在新闻中出现,并因此在许多推文中被提及。它如何知道要区别对待两个名字,而不只是提取出“鲍德温”?
如果朴素地完成,我可以看出这个问题会成为NP完全问题(你必须将推文中所有可能的短语与其他人的推文中的所有可能的短语进行比较)。