paddlets.transform.ksigma

class KSigma(cols: Union[str, List[str]], k: float = 3.0)[源代码]

基类:BaseTransform

利用ksima方法对数据完成异常值检测以及修正,计算规则包括:

  1. 计算指定列的平均值(mu)和标准差(std)

  2. 根据平均值(mu)和标准差(std)来确定正常数据的范围,如果数值不在[mu - k*std, mu + k*std]范围内,则判定为异常值,其中k是超参数,默认为3.0

  3. 将异常值用平均值(mu)替换

参数
  • cols (str|List[str]) – 需要进行检测和修正的列名(如果传入的是多列,每列单独进行fit和transform)

  • k (float) – ksigma中k的取值, 大于0,默认是3.0

返回

None

fit(dataset: TSDataset)[源代码]

ksigma异常检测过程,包括计算平均值、标准差以及正常值的范围

参数

dataset (TSDataset) – TSDataset

返回

self

transform(dataset: TSDataset, inplace: bool = False) TSDataset[源代码]

将异常值用平均值(mu)替换

参数
  • dataset (TSDataset) – TSDataset

  • inplace (bool) – 是否对数据原地转换,如果为False则对数据副本进行转换, 不修改原数据,默认为False

返回

TSDataset

fit_transform(dataset: TSDataset, inplace: bool = False) TSDataset[源代码]

顺序执行fit和transform

参数
  • dataset (TSDataset) – TSDataset

  • inplace (bool) – 是否对数据原地转换,如果为False则对数据副本进行转换, 不修改原数据,默认为False

返回

TSDataset