我需要使用numpy和pandas模拟一些事务数据,类似于以下代码:
数据框需要有3个字段,其中两个字段的计算方式与上面类似,再加上另一个日期字段,该字段将两个字段的值相加:
import random
import numpy as np
import pandas as pd
n=1000
sample_df = pd.DataFrame({
'arrival_date':np.random.choice( pd.date_range('1/1/2015', periods=n,
freq='D'), n),
'days_stay': [random.randint(1,14) for x in range(n)]
})
数据框需要有3个字段,其中两个字段的计算方式与上面类似,再加上另一个日期字段,该字段将两个字段的值相加:
'departure_date': 'arrival_date' + 'days_stay'
问题在于,我更喜欢在pandas dataframe构造函数中定义所有三个字段,而不是定义一个函数来获取数据并在第二个dataframe步骤中引用它。
sample_df = pd.DataFrame({
'arrival_date':np.random.choice( pd.date_range('1/1/2015', periods=n,
freq='D'), n),
'days_stay': [random.randint(1,14) for x in range(n)],
'departure_date': 'arrival_date' + 'days_stay'
})
这个可能吗?
提前致谢。