在输入问题时,stackoverflow会向您呈现一个问题列表,这些问题可能涵盖相同的主题。我曾经在其他网站或程序中看到过类似的功能(例如Help文件系统),但我从未自己编写过此类功能。现在我很好奇想知道如何使用什么样的算法来实现这个功能。
我脑海中首先想到的方法是将短语分成单词并查找包含这些单词的短语。在执行此操作之前,您可能希望丢弃不重要的单词(例如“the”、“a”、“does”等),然后您将需要对结果进行排名。
嘿,等等 - 让我们为网页做这件事,然后我们就可以拥有一个什么什么...- 一个“搜索引擎”,然后我们就可以销售广告,然后...
不过,说真的,解决这个问题的常见方法有哪些?