算法链与管道接口通用性探讨:如何构建高效通用管道?
- 内容介绍
- 相关推荐
本文共计701个文字,预计阅读时间需要3分钟。
1、通用的管道接口+Pipeline+类不仅可用于预处理和分类,实际上还可以将任意数量的估计器连接在一起。例如,你可以构建一个包含特征提取、特征选择、收缩和分类的管道。
1、通用的管道接口Pipeline 类不但可用于预处理和分类,实际上还可以将任意数量的估计器连接在一起。
- 例如,你可以构建一个包含特征提取、特征选择、缩放和分类的管道,总共有 4 个步骤。同样,最后一步可以用回归或聚类代替分类。
对于管道中估计器的唯一要求就是,除了最后一步之外的所有步骤都需要具有 transform 方法,这样它们可以生成新的数据表示,以供下一个步骤使用。
在调用 Pipeline.fit 的过程中,管道内部依次对每个步骤调用 fit 和 transform,其输入是前一个步骤中 transform 方法的输出。对于管道中的最后一步,则仅调用 fit。
#pipeline.steps 是由元组组成的列表, 所以 pipeline.steps[0][1] 是第一个估计器,pipeline.steps[1][1] 是第二个估计器。
本文共计701个文字,预计阅读时间需要3分钟。
1、通用的管道接口+Pipeline+类不仅可用于预处理和分类,实际上还可以将任意数量的估计器连接在一起。例如,你可以构建一个包含特征提取、特征选择、收缩和分类的管道。
1、通用的管道接口Pipeline 类不但可用于预处理和分类,实际上还可以将任意数量的估计器连接在一起。
- 例如,你可以构建一个包含特征提取、特征选择、缩放和分类的管道,总共有 4 个步骤。同样,最后一步可以用回归或聚类代替分类。
对于管道中估计器的唯一要求就是,除了最后一步之外的所有步骤都需要具有 transform 方法,这样它们可以生成新的数据表示,以供下一个步骤使用。
在调用 Pipeline.fit 的过程中,管道内部依次对每个步骤调用 fit 和 transform,其输入是前一个步骤中 transform 方法的输出。对于管道中的最后一步,则仅调用 fit。
#pipeline.steps 是由元组组成的列表, 所以 pipeline.steps[0][1] 是第一个估计器,pipeline.steps[1][1] 是第二个估计器。

