当前位置:   article > 正文

sklearn學習 使用 IterativeImputer 进行多重数据插补

iterativeimputer
最近在处理一些数据,缺失情况比较严重 但是又舍不得删掉,
决定试一下这个多重数据插补的包
  • 1
  • 2

首先导入我们需要的包

import numpy as np 
# 注意 此评估器目前仍处于实验阶段:预测和API可能会发生变化,而不会出现任何弃用周期。要使用它,你需要显式地导入enable_iterative_imputer:
from sklearn.experimental import enable_iterative_imputer
#  现在你可以正常导入 sklearn.impute包了
from sklearn.impute import IterativeImputer
  • 1
  • 2
  • 3
  • 4
  • 5

使用插补器对数据v中缺失的值进行插补

Iter= IterativeImputer(max_iter=10,random_state=1997)
Iter.fit(v)  
IteraList = Iter.transform(v)
IteraNp = np.array(IteraList)
  • 1
  • 2
  • 3
  • 4

简单介绍IterativeImputer的几个参数:

链接: sklearn.impute.IterativeImputer 的官方文档在此.

实战实例


def Multivariate_Interpolation(k,v):
    imp = IterativeImputer(estimator = BayesianRidge(),max_iter=10, random_state=1997)
    imp.fit(v)  
    IteraList = imp.transform(v)
    IteraNp = np.array(IteraList)
    IteraNp.shape
    
    IteraDict = {}
    count = 0
    for line in pdDict["九龍"].columns.values.tolist():
        IteraDict[line] = []
        for l in IteraList:
            IteraDict[line].append(l[count])

        count += 1
    
    data=pd.DataFrame(IteraDict)
    print(data.head())
    return data
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/喵喵爱编程/article/detail/987618
推荐阅读
相关标签
  

闽ICP备14008679号