天天看点

ALINK(十七):数据处理(三)缺失值处理(一)缺失值填充批预测

Java 类名:com.alibaba.alink.operator.batch.dataproc.ImputerPredictBatchOp

Python 类名:ImputerPredictBatchOp

数据缺失值填充处理

运行时需要指定缺失值模型,由ImputerTrainBatchOp产生。缺失值填充的4种策略,即最大值、最小值、均值、指定数值,在生成缺失值模型时指定。

名称

中文名称

描述

类型

是否必须?

默认值

outputCols

输出结果列列名数组

输出结果列列名数组,可选,默认null

String[]

null

numThreads

组件多线程线程个数

Integer

1

modelStreamFilePath

模型流的文件路径

String

modelStreamScanInterval

扫描模型路径的时间间隔

描模型路径的时间间隔,单位秒

10

modelStreamStartTime

模型流的起始时间

模型流的起始时间。默认从当前时刻开始读。使用yyyy-mm-dd hh:mm:ss.fffffffff格式,详见Timestamp.valueOf(String s)

col1

col2

col3

a

100

b

-2.500000

9

c

100.200000

d

-99.900000

1.400000

-2.200000

100.900000

15.414286

31