我有一些与sqlite相关的查询,我已经将它们转换为pandas数据框。我将这些数据框传递给一个函数来获取聚合信息。如何使用该函数的结果填充Excel工作表?也就是说,如何将函数输出转换为数据框?(注意-我正在使用openpyxl创建工作簿)
以下是数据框和函数的代码:
但是这会出现错误:“AttributeError: 'Series'对象没有属性'columns'”。
以下是数据框和函数的代码:
# Nationwide measure statistics
nationwide_measures = pd.read_sql_query("""select state,
measure_id,
measure_name,
score
from timely_and_effective_care___hospital;""", conn)
# Remove the non-numeric string values from 'score'
nationwide_measures1 = nationwide_measures[nationwide_measures['score'].astype(str).str.isdigit()]
# Change score to numeric
nationwide_measures1['score'] = pd.to_numeric(nationwide_measures1['score'])
# Function to grab measure values
def get_stats(group):
return {'Minimum': group.min(), 'Maximum': group.max(), 'Average': group.mean(), 'Standard Deviation': group.std()}
# Function output
nationwide_measures1['score'].groupby(nationwide_measures1['measure_id']).apply(get_stats).unstack()
我尝试了:
# Function to grab measure values
def get_stats(group):
return pd.DataFrame({'Minimum': group.min(), 'Maximum': group.max(), 'Average': group.mean(), 'Standard Deviation': group.std()})
但这返回了“值错误:如果使用所有标量值,则必须传递索引”
我还尝试了:
# Function to grab measure values
def get_stats(group):
df = pd.DataFrame({'Measure Name': group.columns['measure_name'],'Minimum': group.min(), 'Maximum': group.max(), 'Average': group.mean(), 'Standard Deviation': group.std()}, index = [0])
return df
但是这会出现错误:“AttributeError: 'Series'对象没有属性'columns'”。