我将尝试使用sparklyR执行两个不同数据框的简单绑定操作(这两个数据框具有相同的行数,并且行匹配)。
例如:
我收到的错误信息是:
我已经尝试了
例如:
library(sparklyr)
library(dplyr)
sc <- spark_connect(master = "local[*]")
iris_tbl <- copy_to(sc, iris, name="iris", overwrite=TRUE)
#check column names
colnames(iris_tbl)
#subset iris into two df's
subdf <- iris_tbl %>%
select(Sepal_Length,Sepal_Width)
subdf1 <- iris_tbl %>%
select(Petal_length,Petal_Width,Species)
#try to bind back together
dfCombine <- bind_cols(subdf,subdf1)
我收到的错误信息是:
#Error
Error in cbind_all(x) : basic_string::resize
我已经尝试了
combine()
、cbind_all
、cbind()
和c()
,但都没有起作用。
union_all
吗?请参考 https://github.com/rstudio/sparklyr/issues/76 - JanLauGeunion_all
用于绑定具有完全相同列的两个数据框(即类似于rbind
,类似于 SQL 中的UNION
)。 - schristelbind_cols
的讨论:https://github.com/rstudio/sparklyr/issues/556 - JanLauGe