paddlets.transform.normalization
- class MinMaxScaler(cols: Optional[Union[List[str], str]] = None, f_range: tuple = (0, 1), clip: bool = False)[源代码]
-
将需要归一化的列的值缩放到预期范围来转换数据集:[min, max]。
通过以下方式转换
X_std = (X - X.min) / (X.max - X.min)
X_scaled = X_std * (max - min) + min
- 参数
cols (str|List) – 归一化的数据列。
f_range (tuple) – tuple (min, max), default=(0, 1), 所需的转换数据范围。
clip (bool) – 该值为True时,保留数据的转换值裁剪到提供的特征范围。
- 返回
None
- class StandardScaler(cols: Optional[Union[List[str], str]] = None, with_mean: bool = True, with_std: bool = True)[源代码]
-
将数据集转换到方差为1,均值为0的数据分布
转换公式为:z = (x - u) / s.
其中 u 是训练样本的平均值,如果 with_mean=False,则为 0,s 是训练样本的标准差,如果 with_std=False,则为 1。
- 参数
cols (str|List) – 需要归一化的列名
with_mean (bool) – 如果为 True,则在缩放之前将数据居中处理
with_std (bool) – 如果为 True,将数据归一化到单位方差。
- 返回
None