用PCA对手写数字数据集降维

  |  

摘要: PCA 的一个应用:对手写数字数据集降维

【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:算法题刷刷
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


sklearn-特征工程-特征选择 中,有使用过手写数字数据集。

我们使用了各种方法对手写数据集进行特征选择, 10 棵树的随机森林的效果可以到 93.8%,100 棵树时候可以到 96.4%

虽然 KNN 效果更好(96.6%), 但由于数据量太大, KNN 计算太缓慢, 所以我们不得不选用随机森林。

在文章 sklearn-降维 中我们学习了降维算法,其中重点学习了 PCA 的使用,现在就来试着用 PCA 处理一下这个数据, 看看效果如何。


Jupyter 脚本链接


Share