26.4相关性和回归分析

 
: c = cov (x)
: c = cov (x, y)
: c = cov (…, opt)
: c = cov (…, nanflag)

计算协方差矩阵。

两个变量向量之间的协方差AB计算为:

cov (a,b) = 1/(N-1) * SUM_i (a(i) - mean (a)) * (b(i) - mean (b))

这里的N是向量ab的长度.

如果使用一个参数调用,如果x是一个向量,则计算cov (x, x)。如果x是一个矩阵,那么计算x的标量方差,x的每行被视为一个观测数,每列都被视为变量,并且第(i, j)个 cov (x)的分量是x的第i列和第j列之间的协方差。如果x具有尺寸n x m,输出c将是一个m x m协方差矩阵。

如果使用两个参数调用,则计算cov (x, y),两个随机变量xy之间的方差. xy必须具有相同数量的元素,并且将被视为向量,协方差计算为cov (x(:), y(:))输出将是2×2协方差矩阵。

可选参数opt确定规范化的类型。有效值为

0 [default]:

规范化为N-1。这提供了协方差的最佳无偏估计量。

1:

规范化为N。这提供了均值的二次矩。当N=1时,opt被设置为1。

广告

可选参数nanflag必须出现在参数列表的最后,并控制cov的NaN值的处理方式。三个有效值为:

includenan [default]:

保留xy的NaN值。输出将遵循在算术运算中处理NaN值的常规规则。

广告
omitrows:

在计算协方差之前修剪xy中的软件包含NaN值的行。只要一个变量中的某行包含NaN,就从xy两个变量中删除对应的行.

广告
partialrows:

对每个第i行和第j行的协方差计算,独立忽略xy的软件包含NaN值的行。这可能导致不同的观测数,N,用于计算协方差矩阵的每个元素。

广告

兼容性说明:在Octave v9.1.0之前,cov处理过的行xy作为多变量随机变量。此版本尝试与MATLAB保持完全兼容性,通过处理xy作为两个单变量分布,无论形状如何,都会返回2x2的输出矩阵。在运行此更新版本的时,需要修改依赖Octave先前定义的代码cov。可以使用NaN包的covm函数为covm (x, y, "D").

详见: corr.

广告
 
: r = corr (x)
: r = corr (x, y)

计算相关系数矩阵。

如果每行xy是一个观测数,并且每列都是变量,则第(i, j) 个corr (x, y)的分量是x中的第i个变量和y中的第j个变量之间的相关性. xy必须具有相同数量的行(观测数)。相关系数矩阵 用2个向量AB计算而来(具有xy的列数),例如:

corr (A,B) = cov (A,B) / (std (A) * std (B))

输出变量r将具有尺寸n x m,n和m是在xy中的变量(列)数。 注意,由于任何标量的标准差都为零,因此对于任何标量或单行输入的相关系数矩阵都将返回为 NaN。

如果使用一个参数调用,则计算corr (x, x),x的每2列之间的相关系数.

详见: cov, corrcoef.

广告
 
: r = corrcoef (x)
: r = corrcoef (x, y)
: r = corrcoef (…, param, value, …)
: [r, p] = corrcoef (…)
: [r, p, lci, hci] = corrcoef (…)

计算相关系数矩阵。

x是一个数组,其中每列包含一个变量,每行包含一个观测数。

如果给定第二个输入y(尺寸与x相同),那么计算xy之间的相关系数.

param, value是修改计算的可选键值对。有效参数包括:

"alpha"

用于置信区间的边界的置信水平,lcihci默认值为0.05,即95%置信区间。

广告
"rows"

确定NaN值的处理。可接受的值为"all","complete""pairwise"。默认为"all""complete"将只考虑没有NaN值的行。"pairwise"将为每对变量选择没有NaN的行。

广告

输出r是每对变量的皮尔逊乘积矩相关系数的矩阵。

输出p是检验相关系数为零的零假设的成对p值的矩阵。

输出lcihci是分别包含每个相关系数的95%置信区间的下界和上界的矩阵。

详见: corr, cov, std.

广告
 
: rho = spearman (x)
: rho = spearman (x, y)

计算斯皮尔曼相关系数rho.

对于两个数字向量xy,斯皮尔曼的rhoxy的排名的相关系数.

如果xy是从独立分布中提取的,rho的均值为零,方差为1 / (N - 1),这里的Nxy向量的长度,并且是正态分布的。

spearman (x)相当于spearman (x, x).

详见: ranks, kendall.

广告
 
: tau = kendall (x)
: tau = kendall (x, y)

计算Kendall的tau.

对于两个长度均为N的数字向量x, y,Kendall的tauxy的所有排名之差的符号的相关性; 即,如果xy两者的顺序不同,那么下面的代码结果不同:

         1
tau = -------   SUM sign (q(i) - q(j)) * sign (r(i) - r(j))
      N (N-1)   i,j

其中q(i) 和r(i) 是xy的排名

如果xy遵循独立分布,Kendall的tau是渐近正态的,均值为0,方差为(2 * (2N+5)) / (9 * N * (N-1)).

kendall (x)相当于kendall (x, x).

详见: ranks, spearman.

广告

版权所有 © 2024-2025 Octave中文网

ICP备案/许可证号:黑ICP备2024030411号-2