我正在尝试使用Pandas和MySQL将数据(推文和其他Twitter文本信息)导入数据库。我收到了以下错误消息:
166: 警告:(1366,“列'text'中的值不正确:在第3行处的'xF0x9Fx92x9C xF0x9Fx...'”) result = self._query(query) 166: 警告:(1366,“列'text'中的值不正确:在第5行处的'xF0x9Fx98x8D tx...'”) result = self._query(query)
经过彻底搜索,似乎我的数据库列设置存在问题。我尝试将数据库字符集设置为UTF8,并将其与utf_unicode_ci匹配,但仍然收到相同的错误消息。
以下是导入数据到数据库的代码:
166: 警告:(1366,“列'text'中的值不正确:在第3行处的'xF0x9Fx92x9C xF0x9Fx...'”) result = self._query(query) 166: 警告:(1366,“列'text'中的值不正确:在第5行处的'xF0x9Fx98x8D tx...'”) result = self._query(query)
经过彻底搜索,似乎我的数据库列设置存在问题。我尝试将数据库字符集设置为UTF8,并将其与utf_unicode_ci匹配,但仍然收到相同的错误消息。
以下是导入数据到数据库的代码:
#To create connection and write table into MySQL
engine = create_engine("mysql+pymysql://{user}:{pw}@{lh}/{db}?charset=utf8"
.format(user="user",
pw="pass",
db="blahDB",
lh="bla.com/aald/"))
df.to_sql(con=engine, name='US_tweets', if_exists='replace')
我正在导入的数据包含以下数据类型:'int64'、'object' 和 'datetime64[ns]'。我通过将数据打印到控制台中找出了这些数据类型。
print(df['tweett']) >>> returns dtype 'object'
我很感激您的帮助,谢谢!