paddlets.transform.fill
- class Fill(cols: Union[str, List[str]], method: str = 'pre', value: int = 0, window_size: int = 10, min_num_non_missing_values: int = 1)[源代码]
-
该类被设计为用来补全数据列中的缺失值。有三类补全数据的方法,包括
从滑动窗口中计算的统计数据替换缺失值,例如 最大值、最小值、平均值或中值;
相邻值替换缺失值,这些值可以是缺失值之前或之后的数值。
或使用用户指定的值替换缺失值。
- 参数
cols (str|List) – 选择被补全的数据列。
method (str) – 填充缺失值的方法。目前共支持8种方法: max:使用滑动窗口中的最大值; min:使用滑动窗口中的最小值; avg:使用滑动窗口中的平均值; median:使用中值; pre:使用上一个值; next:使用下一个值; zero:使用0值; miss_value:使用用户指定的值
value (int||float) – 仅在方法为默认值时有效,由用户指定的值替换缺失值。
window_size (int) – 滑动窗口大小
min_num_non_missing_values (int) – 滑动窗口中非缺失值的最小数量,如果小于参数min_num_non_missing_values,则统计为np.nan
- 返回
None