赞
踩
spark-sklearn
是一个旨在将Apache Spark与流行的scikit-learn机器学习库集成的工具包。这个项目专注于在Spark计算框架上平行地训练和评估多个scikit-learn模型,特别适合数据量较小但需要并行处理的场景。
请注意,由于spark-sklearn
已被废弃,我们推荐使用scikit-learn
配合Joblib Apache Spark Backend
来在Spark集群上进行scikit-learn超参数调优任务。
核心功能:
GridSearchCV
和RandomizedSearchCV
。spark-sklearn
适用于以下场景:
spark-sklearn
提供了很好的示例。虽然spark-sklearn
已被弃用,但在其替代方案成熟之前,对于已经习惯于使用scikit-learn且希望利用Spark进行并行计算的团队来说,它仍是一个有价值的过渡工具。因此,如果你正面临上述应用场景,不妨尝试一下spark-sklearn
,体验分布式机器学习的魅力。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。