我的问题是如何高效地扩展一个数组,通过多次复制自身。我正在尝试将我的调查样本扩展到完整的数据集大小,通过将每个样本复制N次。N是分配给样本的影响因素。
所以我写了两个循环来完成这个任务(脚本如下)。它可以工作,但速度很慢。我的样本大小为20,000,并尝试将其扩展到3百万个全尺寸。有没有什么函数可以尝试?谢谢您的帮助!
lines = np.asarray(person.read().split('\n'))
df_array = np.asarray(lines[0].split(' '))
for j in range(1,len(lines)-1):
subarray = np.asarray(lines[j].split(' '))
factor = int(round(float(subarray[-1]),0))
for i in range(1,factor):
df_array = np.vstack((df_array, subarray))
print len(df_array)