分享

如何不用Pearson进行相关性分析

zeus_lhl 发表于 2017-5-16 12:06:30 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 3 9184
Pearson相关系数要求连续变量服从正太分布,如果是离散变量、不服从正态分布呢?
1. 回归问题中,如果出现这种情况怎么判断其相关性,判断出相关后怎么做处理?
2. 分类和聚类问题,分别需要相关性判断吗?怎么做?同样,判断出来相关,怎么处理相关的变量?
3.  逻辑回归本质上是一个线性分类器,那在满足正太分布的情况下,是不是可以使用Pearson相关系数来处理变量相关性
兄弟刚接触,请大哥们指点,最好详细点,谢谢


已有(3)人评论

跳转到指定楼层
muyannian 发表于 2017-5-16 15:25:18
本帖最后由 muyannian 于 2017-5-16 15:30 编辑

Pearson适合整台分布,离散的可以使用其它的。

回归问题,分为一元线性回归分析,多元线性回归分析.一元线性回归分析跟Pearson有点类似。他们的作用都是通过算法,发现两个或则多个元素之间的关系。

分类是事先已知的
聚类则是通过算法,自己形成分组。聚类技术及范围包括数据挖掘、统计学、机器学习、空间数据库技术、生物学以及市场营销等领域下面关于聚类的资料,仅供参考
聚类算法---以K-means算法实例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19752

逻辑回归涉及的因素可能多一些.二者是有区别的。Pearson相关系数适用于两变量


回复

使用道具 举报

zeus_lhl 发表于 2017-5-16 18:09:28
muyannian 发表于 2017-5-16 15:25
Pearson适合整台分布,离散的可以使用其它的。

回归问题,分为一元线性回归分析,多元线性回归分析.一元 ...

事先已知是什么意思
回复

使用道具 举报

muyannian 发表于 2017-5-16 19:13:32
zeus_lhl 发表于 2017-5-16 18:09
事先已知是什么意思

就是简单的分类。
比如我们手里有红铅笔,绿铅笔等。我们可以按照颜色分类。
对于聚类,是预测不到的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条