Java 类名:com.alibaba.alink.operator.batch.dataproc.ImputerPredictBatchOp
Python 类名:ImputerPredictBatchOp
数据缺失值填充处理
运行时需要指定缺失值模型,由ImputerTrainBatchOp产生。缺失值填充的4种策略,即最大值、最小值、均值、指定数值,在生成缺失值模型时指定。
名称
中文名称
描述
类型
是否必须?
默认值
outputCols
输出结果列列名数组
输出结果列列名数组,可选,默认null
String[]
null
numThreads
组件多线程线程个数
Integer
1
modelStreamFilePath
模型流的文件路径
String
modelStreamScanInterval
扫描模型路径的时间间隔
描模型路径的时间间隔,单位秒
10
modelStreamStartTime
模型流的起始时间
模型流的起始时间。默认从当前时刻开始读。使用yyyy-mm-dd hh:mm:ss.fffffffff格式,详见Timestamp.valueOf(String s)
col1
col2
col3
a
100
b
-2.500000
9
c
100.200000
d
-99.900000
1.400000
-2.200000
100.900000
15.414286
31