R语言如何通过主成分分析(PCA)与PCR回归进行汽车购买信息预测的可视化实现?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1379个文字,预计阅读时间需要6分钟。
在这个项目中,我探讨了如何利用主成分分析(PCA)进行简单的预测,并对其进行了初步说明。具体来说,我们将对一个包含3个不同价格组别、相关汽车数据进行详细分析。
在这个项目中,我讨论了如何使用主成分分析(PCA) 进行简单的预测。
出于说明目的,我们将对一个数据集进行分析,该数据集包含有关在 3 个不同价格组内进行的汽车购买信息以及影响其购买决定的一组特征。
首先,我们将导入数据集并探索其结构。
1.
2.
3. head(caref)
众所周知,PCA使用欧几里得距离来推导分量,因此输入变量需要是数字的。正如我们所看到的,除了“组”变量之外,所有数据都是数字格式,因此我们不必执行任何转换。
为了查看数字变量在 3 个价格组中的表现,我分别为每个数字变量生成箱线图。
1. ggplot(cr_e.m, aes(x = varle, y = vle, fill = Gup)) +
2. geom_boxplot()
通过观察上图,我们可以了解到每个价格组的消费者对所考虑的特征有不同的看法(即,给出不同的评分)。(“安全”特征的变化较小,在所有 3 个价格组中具有更高的排名/重要性)
现在为了更好地可视化这 3 个价格组集群如何在 3D 空间中出现,我使用 3 个特征变量构建了一个 3D 图,显示给定评级之间的显着差异。
本文共计1379个文字,预计阅读时间需要6分钟。
在这个项目中,我探讨了如何利用主成分分析(PCA)进行简单的预测,并对其进行了初步说明。具体来说,我们将对一个包含3个不同价格组别、相关汽车数据进行详细分析。
在这个项目中,我讨论了如何使用主成分分析(PCA) 进行简单的预测。
出于说明目的,我们将对一个数据集进行分析,该数据集包含有关在 3 个不同价格组内进行的汽车购买信息以及影响其购买决定的一组特征。
首先,我们将导入数据集并探索其结构。
1.
2.
3. head(caref)
众所周知,PCA使用欧几里得距离来推导分量,因此输入变量需要是数字的。正如我们所看到的,除了“组”变量之外,所有数据都是数字格式,因此我们不必执行任何转换。
为了查看数字变量在 3 个价格组中的表现,我分别为每个数字变量生成箱线图。
1. ggplot(cr_e.m, aes(x = varle, y = vle, fill = Gup)) +
2. geom_boxplot()
通过观察上图,我们可以了解到每个价格组的消费者对所考虑的特征有不同的看法(即,给出不同的评分)。(“安全”特征的变化较小,在所有 3 个价格组中具有更高的排名/重要性)
现在为了更好地可视化这 3 个价格组集群如何在 3D 空间中出现,我使用 3 个特征变量构建了一个 3D 图,显示给定评级之间的显着差异。

