我很好奇如何使用pandas来读取以下结构的嵌套JSON数据:
这里将数组保留为json格式。我更希望它能展开成列。
我的方法在这里似乎不够高效/不符合pandas的风格。
{
"number": "",
"date": "01.10.2016",
"name": "R 3932",
"locations": [
{
"depTimeDiffMin": "0",
"name": "Spital am Pyhrn Bahnhof",
"arrTime": "",
"depTime": "06:32",
"platform": "2",
"stationIdx": "0",
"arrTimeDiffMin": "",
"track": "R 3932"
},
{
"depTimeDiffMin": "0",
"name": "Windischgarsten Bahnhof",
"arrTime": "06:37",
"depTime": "06:40",
"platform": "2",
"stationIdx": "1",
"arrTimeDiffMin": "1",
"track": ""
},
{
"depTimeDiffMin": "",
"name": "Linz/Donau Hbf",
"arrTime": "08:24",
"depTime": "",
"platform": "1A-B",
"stationIdx": "22",
"arrTimeDiffMin": "1",
"track": ""
}
]
}
这里将数组保留为json格式。我更希望它能展开成列。
pd.read_json("/myJson.json", orient='records')
编辑
感谢第一次的回答。 我应该修改一下我的问题: 对数组中嵌套属性的展平并不是强制性的。 只需要将df.locations['name']连接起来,就可以得到[A, B, C]。
我的文件包含多个JSON对象(每行一个),我想保留number、date、name和locations列。然而,我需要将locations连接起来。
allLocations = ""
isFirst = True
for location in result.locations:
if isFirst:
isFirst = False
allLocations = location['name']
else:
allLocations += "; " + location['name']
allLocations
我的方法在这里似乎不够高效/不符合pandas的风格。