56得票5回答
Python Pandas to_sql,如何创建带有主键的表?

我想使用Pandas的to_sql函数创建一个带有主键的MySQL表(通常在mysql表中拥有主键很不错):group_export.to_sql(con = db, name = config.table_group_export, if_exists = 'replace', flavor...

16得票2回答
没有聚合函数的分组

我看到一个像这样的 pandasql 查询:df = pd.DataFrame({'A': [1, 2, 2], 'B': [3, 4, 5]}) sqldf('select * from df group by A', locals()) 这将会得到: A B 0 1 3 1 2...

14得票2回答
属性错误:'str'对象没有'_execute_on_connection'属性。

我有一个关于以下代码的问题: from pandasql import sqldf import pandas as pd df = pd.DataFrame({'column1': [1, 2, 3], 'column2': [4, 5, 6]}) query = "SELECT * ...

11得票1回答
如何创建一个数据框,其中日期范围是值的一列?

我有三个变量 csiti - 23454 : (整数) units - [11,22,33,44,55,66,77] : (整数列表,长度始终为'n') begin_date - '2019-10-16' : (字符串) 我该如何从这些数据中创建一个数据框,类似于下面的形式 csit...

9得票1回答
Pandas根据列将两行合并为一行

我有两行数据看起来像这样: ------------------------------ DealName | Target | Acquirer | ----------------------------- ABC-XYZ | ABC | None | ---------...

9得票1回答
使用Pandas数据框进行查询以过滤出某一列不是NaN值的行。

我刚开始学习Python和使用Pandas。 我想查询数据框并筛选其中一列不是NaN的行。 我尝试过: a=dictionarydf.label.isnull() 但是a被填充了true或false。尝试过这个。 dictionarydf.query(dictionarydf.la...

8得票2回答
使用pandas将唯一数字转换为MD5哈希值

大家早上好。 我想将我的社会保障号码转换成MD5哈希十六进制数。结果应该是每个社会保障号码的唯一MD5哈希十六进制数。 我的数据格式如下: ob = onboard[['regions','lname','ssno']][:10] ob regions lname ssno...

7得票2回答
熊猫SQL非常慢。

我目前正在从R转向Python(anconda/Spyder Python 3)进行数据分析。在R中,我经常使用R sqldf。由于我擅长sql查询,我不想重新学习data.table语法。在使用R sqldf时,我从未遇到性能问题。 现在,在Python中,我尝试使用pandasql,但一...

7得票2回答
在多个条件下合并数据框-不一定是基于相等的值

首先,如果这篇文章有点长,请谅解,我想全面描述我的问题和已经尝试过的方法。 我想在多个条件下连接(合并)两个数据帧对象。如果要满足的条件都是“等于”运算符,我知道如何做到这一点,但是,我需要利用“小于”和“大于”。 数据框表示遗传信息:一个是基因组中突变的列表(称为SNP),另一个提供人类...