R语言中的tidyr::unnest
方法在pandas中有一个等效方法,称为explode
,详见这个非常详细的答案。我想知道是否有与tidyr::nest
方法相当的方法。
示例R代码:
library(tidyr)
iris_nested <- as_tibble(iris) %>% nest(data=-Species)
数据列是一个列表列,其中包含数据框(例如,在运行许多模型时,这非常有用)。
iris_nested
# A tibble: 3 x 2
Species data
<fct> <list<df[,4]>>
1 setosa [50 × 4]
2 versicolor [50 × 4]
3 virginica [50 × 4]
访问数据列中的一个元素:
iris_nested[1,'data'][[1]]
[...]
# A tibble: 50 x 4
Sepal.Length Sepal.Width Petal.Length Petal.Width
<dbl> <dbl> <dbl> <dbl>
1 5.1 3.5 1.4 0.2
2 4.9 3 1.4 0.2
3 4.7 3.2 1.3 0.2
4 4.6 3.1 1.5 0.2
5 5 3.6 1.4 0.2
6 5.4 3.9 1.7 0.4
7 4.6 3.4 1.4 0.3
8 5 3.4 1.5 0.2
9 4.4 2.9 1.4 0.2
10 4.9 3.1 1.5 0.1
# … with 40 more rows
library(tidyr)
iris_nested <- as_tibble(iris) %>% nest(data=-Species)
iris_nested
iris_nested[1,'data'][[1]]
示例Python代码:
import seaborn
iris = seaborn.load_dataset("iris")
如何在pandas中嵌套数据框:
- 首先以较简单的方式(与pandas explode功能相当)嵌套一个包含简单列表的数据列
- 其次,数据列包含如上例所示的数据框