天天看点

异常检测-箱线图

箱线图法:

设有容量为n的样本观察值x1,x2,…,xn,将n个样本值按自小到大排序x(1)<=x(2)<=…<=x(n),样本p分位数(0< p<1)记为 xp ,则

f(x)={x([np]+1),1/2[x(np)+(np+1)],当np不是整数当np是整数

1、将n个样本自小到大排序x(1)<=x(2)<=…<=x(n)

2、取样本中的最小、第一、二(中位)、三分位数:Min,Q1,M,Q3,Max,

Q1 = x(n*0.25)

3、若样本中数据小于Q1-1.5(Q3-Q1)或大于Q3-1.5(Q3-Q1),则认为它是疑似异常值。

继续阅读