我希望能够检测并存储列表中的异常值,以下是我的操作:
代码:
这将产生以下结果:
有没有更好的方法,不是返回数组而是返回列表呢? 还请有人能解释一下为什么我们使用了 thresh=3.5 modified_z_score = 0.6745 * abs_dev / y_mad
代码:
def outliers(y,thresh=3.5):
m = np.median(y)
abs_dev = np.abs(y - m)
left_mad = np.median(abs_dev[y <= m])
right_mad = np.median(abs_dev[y >= m])
y_mad = left_mad * np.ones(len(y))
y_mad[y > m] = right_mad
modified_z_score = 0.6745 * abs_dev / y_mad
modified_z_score[y == m] = 0
return modified_z_score > thresh
bids = [5000,5500,4500,1000,15000,5200,4900]
z = outliers(bids)
bidd = np.array(bids)
out_liers = bidd[z]
这将产生以下结果:
out_liers = array([ 1000, 15000])
有没有更好的方法,不是返回数组而是返回列表呢? 还请有人能解释一下为什么我们使用了 thresh=3.5 modified_z_score = 0.6745 * abs_dev / y_mad
tolist
函数:out_liers.tolist()
。你其他的问题最好由代码的原作者回答。 - entropy