首先,您需要检索两个网页。您可以使用wget,urlretrieve等工具: Python中的wget vs urlretrieve 其次,您需要“比较”这两个页面。您可以像Chinmay所说的那样使用“diff”工具。您还可以对这两个页面进行关键词分析: 从页面中解析出所有关键词。例如:如何提取文本中使用的关键字? 可选地,使用类似以下内容的“stem”来处理单词: http://pypi.python.org/pypi/stemming/1.0 使用一些数学方法来比较这两个页面的关键词,例如使用词项频率-逆文件频率:http://en.wikipedia.org/wiki/Tf%E2%80%93idf ,并使用一些Python工具,例如:http://wiki.python.org/moin/InformationRetrieval