paddlets.transform.normalization

class MinMaxScaler(cols: Optional[Union[List[str], str]] = None, f_range: tuple = (0, 1), clip: bool = False)[源代码]

基类:BaseTransform

将需要归一化的列的值缩放到预期范围来转换数据集:[min, max]。

通过以下方式转换

X_std = (X - X.min) / (X.max - X.min)

X_scaled = X_std * (max - min) + min

参数
  • cols (str|List) – 归一化的数据列。

  • f_range (tuple) – tuple (min, max), default=(0, 1), 所需的转换数据范围。

  • clip (bool) – 该值为True时,保留数据的转换值裁剪到提供的特征范围。

返回

None

fit(dataset: TSDataset)[源代码]

计算归一化方法需要的MIN和MAX参数。

参数

dataset (TSDataset) – 用于计算参数的数据集

返回

算子自身

transform(dataset: TSDataset, inplace: bool = False) TSDataset[源代码]

根据参数转换数据集。

参数
  • dataset (TSDataset) – 要被转换的数据集。

  • inplace (bool) – 设置为True时,数据会在源输入数据上修改,避免复制新数据。

返回

转换后的数据

返回类型

new_ts(TSDataset)

inverse_transform(dataset: TSDataset, cols: Optional[Union[List[str], str]] = None, inplace: bool = False) TSDataset[源代码]

反归一化的数据集

参数
  • dataset (TSDataset) – 被反归一化的数据集

  • inplace (bool) – 设置为True时,数据会在源输入数据上修改,避免复制新数据。

返回

反归一化后的时序数据。

返回类型

TSDataset

fit_transform(dataset: TSDataset, inplace: bool = False) TSDataset[源代码]

依次执行数据缩放和数据归一化转换。

参数
  • tsdata (TSDataset) – 被处理的数据集

  • inplace (bool) – 设置为True时,数据会在源输入数据上修改,避免复制新数据。

返回

转换后的数据

返回类型

TSDataset

class StandardScaler(cols: Optional[Union[List[str], str]] = None, with_mean: bool = True, with_std: bool = True)[源代码]

基类:BaseTransform

将数据集转换到方差为1,均值为0的数据分布

转换公式为:z = (x - u) / s.

其中 u 是训练样本的平均值,如果 with_mean=False,则为 0,s 是训练样本的标准差,如果 with_std=False,则为 1。

参数
  • cols (str|List) – 需要归一化的列名

  • with_mean (bool) – 如果为 True,则在缩放之前将数据居中处理

  • with_std (bool) – 如果为 True,将数据归一化到单位方差。

返回

None

fit(dataset: TSDataset)[源代码]

计算归一化所需要的均值,方差参数。

参数

dataset (TSDataset) – 用于计算参数的数据集

返回

算子自身

transform(dataset: TSDataset, inplace: bool = False) TSDataset[源代码]

根据参数转换数据集。

参数
  • dataset (TSDataset) – 要被转换的数据集。

  • inplace (bool) – 设置为True时,数据会在源输入数据上修改,避免复制新数据。

返回

转换后的数据

返回类型

new_ts(TSDataset)

inverse_transform(dataset: TSDataset, inplace: bool = False) TSDataset[源代码]

反归一化的数据集

参数
  • dataset (TSDataset) – 被反归一化的数据集

  • inplace (bool) – 设置为True时,数据会在源输入数据上修改,避免复制新数据。

返回

反归一化后的时序数据。

返回类型

TSDataset

fit_transform(dataset: TSDataset, inplace: bool = False) TSDataset[源代码]

依次执行数据缩放和数据归一化转换。

参数
  • tsdata (TSDataset) – 被处理的数据集

  • inplace (bool) – 设置为True时,数据会在源输入数据上修改,避免复制新数据。

返回

转换后的数据

返回类型

TSDataset