如果数据不是正态分布可以分析吗 非正态的数据怎么进行相关性分析?
非正态的数据怎么进行相关性分析?不是一个正常的数据分析。第一反应是求变换,常用的是Box-Cox变换。如果它不 不工作,直接去非参数。处理这个问题,一般需要先找出异常的原因。第一种情况:数据不正常。如

非正态的数据怎么进行相关性分析?不是一个正常的数据分析。第一反应是求变换,常用的是Box-Cox变换。如果它不 不工作,直接去非参数。
处理这个问题,一般需要先找出异常的原因。
第一种情况:数据不正常。
如果很清楚样本数据所代表的总体不是正态分布,可以考虑求变换,通常会找到合适的变换参数。但是有些数据可能转换不成功,所以可以用非参数检验进行分析。
第二种情况:有异常点。
如果确认是异常点,可以考虑去掉。然而,如果我们能 找不到异常点的原因,可能是正常数据。这时候可以考虑补充抽样,看看能不能用大部分数据中的空间来填补异常点。
第三种情况:(多峰)数据。
有可能每组数据都服从正态分布,但是混合在一起就不好了。正确的做法是尽可能根据不同的属性来分析数据。
第四种情况:平顶数据。
平顶数据意味着直方图上的图形相对平坦。这时候就要考虑把混合的数据尽可能按照属性分开,分别分析每个属性的数据。同时也可以考虑只取近期数据进行分析,历史数据目前可能不那么适用。
非正态数据如何分析?一般情况下,非正态数据的观测数据服从正态分布,其集中趋势和离散特征可以分别用观测值的均值和标准差来描述。
然而,在某些情况下,观测值并不遵循非正态数据,而是遵循其他类型的分布,如偏态分布。
与非正态数据相比,不符合非正态数据的其他类型分布统称为非正态数据。
1.实践中遇到的许多随机现象服从或近似服从正态分布。
当样本频率分布的直方图无限接近一条人口密度曲线时,人口密度曲线科学地反映了人口分布。
但是关于人口密度曲线的知识比较抽象,学生很难理解,所以我们选择正态分布作为人口分布研究的切入点。
正态分布是统计学中最基本也是最重要的分布。
2.正态分布可以用函数的形式表示。它的密度函数可以写成:
正态分布的密度函数,(σgt0,-∞ltxlt ∞)
因此,正态分布由其均值μ和标准差σ唯一确定。
3.从形态上看,正态分布是单峰钟形曲线,其对称轴为x=μ,x=μ时取最大值。
从x=μ点开始,曲线在正负两个方向上逐渐延伸,不断接近X轴,但从不与X轴相交。因此,曲线以X轴作为正负方向的渐近线。
4.通过三组正态分布的曲线可以知道,正态曲线具有两端低,中间高,左右对称的基本特征。
5.因为正态分布是它的平均值μ之和。标准差σ是唯一的,所以从某种意义上说,正态分布有很多,这给我们进一步的研究带来了一定的困难。
但是我们也发现,在很多正态分布中,N (0,1)是焦点,其他的正态分布都可以转化为N (0,1)。我们称N (0,1)为标准正态分布,其密度函数为,x∈(-∞,∞),从而简化了正态分布的研究。
6.结合正态曲线的图形特征,总结了正态曲线的性质。
正态曲线很难画,课本上没有要求。教学时,学生可以借助几何画板进行绘图。学生只需要了解大致情况。关键是引导学生通过正态曲线总结其性质。