我希望提高我的数据科学技能。 我正在练习从运动网站进行url数据拉取,json文件具有多个嵌套字典。 我想能够拉取这些数据以在matplotlib中映射自己的领先者板,等等,但是很难使json成为可操作的df。
主要网站是:https://www.usopen.com/scoring.html
通过查看背景,我认为实时信息是从下面列出的链接中获取的。 我正在使用Jupyter笔记本工作。 我可以成功地获取数据。
但是,正如您所看到的,它正在提取多个嵌套字典,这使得获取简单的数据框架变得非常困难。
只是想获得球员,杆数得分,总杆数和回合成绩。 任何帮助都将不胜感激,谢谢!
import pandas as pd
import urllib as ul
import json
url = "https://gripapi-static-pd.usopen.com/gripapi/leaderboard.json"
response = ul.request.urlopen(url)
data = json.loads(response.read())
print(data)