87得票7回答
反向连接 Pandas

我有两个表格,希望将它们合并,只保留表格A中的所有数据,并且仅在表格B中的关键字是独特的时候添加数据(表格A和B中的关键字都是唯一的,但在某些情况下,一个关键字会同时出现在表格A和B中)。 我认为这可以通过某种过滤连接(反向连接)来实现,以获取表格B中不出现在表格A中的值,然后将两个表格合并...

87得票11回答
如何查找未连接的记录?

我有两个表格被连接在一起。 A 拥有许多 B 通常你会这样做: A has many B Normally you would do:select * from a,b where b.a_id = a.id 获取所有在b中有记录的a表记录。 如何获取a表中没有任何记录在b表中...

35得票4回答
检查一个项目是否不存在于另一个表中

我的表格设置大致如下:table name: process fields: name, id_string table name: value_seach fields: id_string, value 我想构造一个SELECT语句,以显示所有在value_search中没有条目的进程名...

8得票1回答
没有适用于“anti_join”的方法可以应用于“factor”类的对象。

我想要根据特定列,在dataframe1中确定不在dataframe2中的行。我已使用以下代码获取所需信息。 diffId <- anti_join(dat$ID,datwe$ID) 很遗憾,我遇到了一个错误: Error in UseMethod("anti_join") :...

8得票1回答
Spark数据集:何时使用Except与Left Anti Join

我想知道在调用 except (https://spark.apache.org/docs/2.1.0/api/java/org/apache/spark/sql/Dataset.html#except(org.apache.spark.sql.Dataset)) 与使用左反连接之间是否存在性...