我正在尝试爬取几个网站的内容。但是我注意到,对于一些网站,我得到的响应状态码是200。然而,对于其他一些网站,我得到的响应是404状态码。但是当我在浏览器中打开这些网站时,它们可以正常加载。我错过了什么吗?
例如:
例如:
import requests
url_1 = "https://www.transfermarkt.com/jumplist/startseite/wettbewerb/GB1"
url_2 = "https://dev59.com/LVoV5IYBdhLWcg3wPctv"
page_t = requests.get(url_2)
print(page_t.status_code) #Getting a Not Found page and 404 status
page = requests.get(url_1)
print(page.status_code) #Getting a Valid HTML page and 200 status