77得票9回答
使用pyODBC的fast_executemany加速pandas.DataFrame.to_sql

我想要将一个大型的pandas.DataFrame发送到运行MS SQL的远程服务器。目前我的做法是将data_frame对象转换为元组列表,然后使用pyODBC的executemany()函数发送数据。具体操作如下: import pyodbc as pdb list_of_tuples...

25得票1回答
使用to_sql将数据追加到已存在的pandas表中

我有以下数据框:ipdb> csv_data country sale date trans_factor 0 India 403171 12/01/2012 1 1 Bhutan 394096 12/01/2012 ...

22得票1回答
在写入MySQL时,调用to_sql()函数查询sqlite_master表时出现错误。

我想问如何将一个数据框保存到本地的mysql数据库中。import MySQLdb import pandas as pd conn=MySQLdb.connect(host="localhost",user='root',passwd="matt123",db="ada") df=pd.Da...

15得票3回答
重复的键值违反了唯一约束-在尝试从Dask数据帧创建SQL表时出现Postgres错误

继这个问题之后,当我尝试使用多个分区的dask.dataframe创建postgresql表时,会出现以下错误: IntegrityError: (psycopg2.IntegrityError) duplicate key value violates unique constraint ...

13得票3回答
如何使用to_sql将pandas数据帧写入Oracle数据库?

我是一名新的Oracle学习者,正在尝试将pandas数据框写入Oracle表中。经过在网上的研究,我发现代码本身非常简单,但我不知道为什么我的代码无法工作。 我已经从本地文件读取了pandas数据框:import cx_Oracle import pandas as pd import o...

12得票4回答
如何使用pandas.to_sql仅在行不存在时添加行

我对Python有些经验,但在SQL方面很新,尝试使用pandas.to_sql将表数据添加到我的数据库中。但是,当我加入数据时,我希望它 在附加之前检查数据是否存在 这是我的两个数据框:>>> df0.to_markdown() | | Col1 | Col...

12得票2回答
使用map_partitions和pd.df.to_sql从Dask DataFrame创建SQL表

Dask没有像pandas那样的df.to_sql(),因此我正在尝试使用map_partitions方法复制该功能并创建一个SQL表。这是我的代码:import dask.dataframe as dd import pandas as pd import sqlalchemy_utils ...

8得票2回答
将忽略重复行的 Pandas 数据帧插入到 MySQL 数据库中

我想要将整个pandas数据框插入到mysql中,使用"insert ignore"。有没有一种方法可以在不循环行的情况下完成此操作? 在dataframe.to_sql中,我只看到了'append'选项,但这是否仍会继续处理重复的唯一键?

8得票2回答
使用SQLAlchemy连接AWS Aurora Serverless MySQL的Python方法

有没有一种方法可以在没有Secrets Manager ARN的情况下指定我与AWS RDS Aurora Serverless MySQL数据库实例的SQLAlchemy连接? 我有数据库用户名,密码,端点,ARN等信息,理想情况下,我将初始化引擎,然后使用df.to_sql()将DataF...

7得票1回答
Pandas的to_sql()能否用于更新数据库中的唯一值?

我该如何使用 df.to_sql(if_exists = 'append') 仅将数据框和数据库之间的唯一值附加到数据库中。换句话说,在写入数据库之前,我想要评估DF和DB之间的重复项并删除这些重复项。是否有此参数? 我了解参数 if_exists = 'append' 和 if_exist...