paddlets.transform.fill

class Fill(cols: Union[str, List[str]], method: str = 'pre', value: int = 0, window_size: int = 10, min_num_non_missing_values: int = 1)[源代码]

基类:BaseTransform

该类被设计为用来补全数据列中的缺失值。有三类补全数据的方法,包括

从滑动窗口中计算的统计数据替换缺失值,例如 最大值、最小值、平均值或中值;

相邻值替换缺失值,这些值可以是缺失值之前或之后的数值。

或使用用户指定的值替换缺失值。

参数
  • cols (str|List) – 选择被补全的数据列。

  • method (str) – 填充缺失值的方法。目前共支持8种方法: max:使用滑动窗口中的最大值; min:使用滑动窗口中的最小值; avg:使用滑动窗口中的平均值; median:使用中值; pre:使用上一个值; next:使用下一个值; zero:使用0值; miss_value:使用用户指定的值

  • value (int||float) – 仅在方法为默认值时有效,由用户指定的值替换缺失值。

  • window_size (int) – 滑动窗口大小

  • min_num_non_missing_values (int) – 滑动窗口中非缺失值的最小数量,如果小于参数min_num_non_missing_values,则统计为np.nan

返回

None

fit(dataset: TSDataset)[源代码]
参数

dataset (TSDataset) – 进行拟合的数据

返回

算子自身

transform(dataset: TSDataset, inplace: bool = False) TSDataset[源代码]

补全缺失值。

参数
  • dataset (TSDataset) – 时序数据TSDataset

  • inplace (bool) – 设置为True时,数据会在源输入数据上修改,避免复制新数据。

返回

转换后的时序数据集TSDataset.

返回类型

new_ts(TSDataset)

fit_transform(dataset: TSDataset, inplace: bool = False) TSDataset[源代码]

首先执行拟合方法,然后执行转换方法。

参数
  • dataset (TSDataset|List[TSDataset]) – 时序数据TSDataset

  • inplace (bool) – 设置为True时,数据会在源输入数据上修改,避免复制新数据。

返回

转换后的时序数据集TSDataset.

返回类型

TSDataset