我正在尝试评估社交网络帖子之间的相似性,但并没有找到任何好的算法,您有什么想法吗?
我刚刚尝试过Levenshtein、JaroWinkler和其他算法,但这些算法更多地用于比较没有情感色彩的文本。在帖子中,我们可以得到一段文字说“我真的很喜欢狗”,而另一段则说“我真的很讨厌狗”,我们需要将其分类为完全不同的情况。
谢谢。
我刚刚尝试过Levenshtein、JaroWinkler和其他算法,但这些算法更多地用于比较没有情感色彩的文本。在帖子中,我们可以得到一段文字说“我真的很喜欢狗”,而另一段则说“我真的很讨厌狗”,我们需要将其分类为完全不同的情况。
谢谢。