26.1描述性统计

描述性统计的一个主要目标是简明地表示大型数据集的本质。Octave提供了均值、中值和众数函数,所有这些函数都用一个对应于数据集中趋势的数字来总结数据集。

 
m = mean (x)
m = mean (x, dim)
m = mean (x, vecdim)
m = mean (x, "all")
m = mean (…, nanflag)
m = mean (…, outtype)
m = mean (…, 'Weights', w)

计算 x 中元素的均值。

均值的定义为

mean (x) = SUM_i x(i) / N

其中 Nx 中的元素个数。

加权平均数的定义为

weighted_mean (x) = SUM_i (w(i) * x(i)) / SUM_i (w(i))

其中 Nx 中的元素数量。

如果 x 是一个向量,那么 mean (x) 返回 x 中元素的平均值。

如果 x 是一个矩阵,那么 mean (x) 返回一个行向量,其中每个元素包含 x 中相应列的平均值。

如果 x 是一个数组,那么 mean (x) 沿着 x 的第一个非单一维度计算均值。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度,包括任何超过 ndims (x) 的维度,将返回 x

vecdim(一个不重复维度的向量)指定多个维度,将在 vecdim 定义的数组切片上操作。如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 mean 操作 x 的所有元素,相当于 mean (x(:))

可选输入 outtype 指定返回的数据类型。outtype 可以采用以下值:

'default'

输出是 double 类型,除非输入是 single 类型,在这种情况下输出为 single 类型。

'double'

输出是 double 类型。

'native'

输出是与输入相同的类型,如 class (x) 所报告的那样,除非输入是逻辑类型的,在这种情况下输出是 double 类型。

可选变量 nanflag 指定是使用前面指定的任何输入参数组合在计算中包括 NaN 值还是排除 NaN 值。nanflag 的默认值是 "includenan",它在计算中保留 NaN 值。若要排除 NaN 值,请将 nanflag 的值设置为 "omitnan"。如果 x 在操作维度中全部由 NaN 值组成,输出仍将包含 NaN 值。

可选参数对 "Weights", w 指定了一个权重方案 w, 它应用于输入 x,从而使 mean 计算加权平均数。沿着单个维度操作时,w 必须与操作维度的长度相同,或者与 x 的大小相同。 当通过由 vecdim 定义的数组切片进行操作时,w 必须与操作数组切片的大小相同, 即 size (w) == size (x)(vecdim),或者与 x 的大小相同。

另请参阅: median, mode, movmean.

 
m = median (x)
m = median (x, dim)
m = median (x, vecdim)
m = median (x, "all")
m = median (…, nanflag)
m = median (…, outtype)

计算 x 中元素的中值。

中值在排序数据 s (s = sort (x)) 上定义为

             |  s(ceil (N/2))          N odd
median (x) = |
              | (s(N/2) + s(N/2+1))/2   N even

如果 x 是一个向量,那么 median (x) 返回 x 中元素的中值。

如果 x 是一个矩阵,那么 median (x) 返回一个行向量,其中每个元素包含 x 中相应列的中值。

如果 x 是一个数组,那么 median (x) 沿着 x 的第一个非单一维度计算中值。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度,包括任何超过 ndims (x) 的维度,将返回 x

vecdim(一个不重复维度的向量)指定多个维度,将在 vecdim 定义的数组切片上操作。如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 median 操作 x 的所有元素,相当于 median (x(:))

median (…, outtype) 使用前面语法中的任何输入参数,返回具有指定数据类型的中值。outtype 可以采用以下值:

"default"

输出类型为 double,除非输入为 single,在这种情况下输出类型为 single。

"double"

输出类型为 double。

"native".

输出与输入类型相同(class (x)),除非输入是逻辑类型,在这种情况下输出类型为 double。

可选变量 nanflag 指定是使用前面指定的任何输入参数组合在计算中包括 NaN 值还是排除 NaN 值。nanflag 的默认值是 "includenan",它在计算中保留 NaN 值。若要排除 NaN 值,请将 nanflag 的值设置为 "omitnan"。如果 x 在操作维度中全部由 NaN 值组成,输出仍将包含 NaN 值。

另请参阅: mean, mode, movmedian.

 
m = mode (x)
m = mode (x, dim)
m = mode (x, vecdim)
m = mode (x, "all")
[m, f, c] = mode (…)

计算输入数据 x 中出现频率最高的值(众数)。

mode 沿着第一个非单一维度确定值的频率,并返回频率最高的值。如果两个或更多个值具有相同的频率,mode 返回最小值。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度,包括任何超过 ndims (x) 的维度,将返回 x

vecdim(一个不重复维度的向量)指定多个维度,将在 vecdim 定义的数组切片上操作。 如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。 如果 vecdim 中的所有维度都大于 ndims (x),则 mode 将返回 x

dim 指定为 "all" 将导致 mode 操作 x 的所有元素, 相当于 mode (x(:))

返回变量 f 是众数在数据集中的出现次数。

元胞数组 c 包含具有最大频率的所有元素。

另请参阅: mean, median.

仅使用一个数字(如均值)来表示整个数据集可能无法提供准确的数据画像。表征拟合的一种方法是测量数据的离散度。Octave 提供了几种测量离散度的函数。

 
[s, l] = bounds (x)
[s, l] = bounds (x, dim)
[s, l] = bounds (x, vecdim)
[s, l] = bounds (x, "all")
[s, l] = bounds (…, nanflag)

返回输入数据 x 的最小值和最大值。

如果 x 是一个向量,那么 bounds (x) 返回 x 中元素的最小值和最大值, 分别为 sl

如果 x 是一个矩阵,那么 bounds (x) 返回 x 中每列的最小值和最大值, 分别为行向量 sl

如果 x 是一个数组,那么 bounds (x) 沿着 x 的第一个非单一维度计算最小值和最大值。

x 中的数据必须是数值型的。默认情况下,任何 NaN 值都会被忽略。sl 的大小等于 x 的大小, 除了操作维度,该维度变为 1。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度, 包括任何超过 ndims (x) 的维度,将返回 x

用输入参数 vecdim(一个不重复维度的向量)指定多个维度,将沿着由 vecdim 定义的数组切片进行操作。 如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 bounds 操作 x 的所有元素, 相当于 bounds (x(:))

可选参数 nanflag 指定是使用任何先前指定的输入参数组合来包含或排除 NaN 值进行计算。 nanflag 的默认值是 "omitnan",此时结果中不包括 NaN 值。 如果给出了参数 "includenan",并且存在 NaN 值,那么最小值(s)和最大值(l)的结果将为 NaN。

使用注意:边界值是数据集离散度的快速计算度量,但如果存在异常数据点,则不如 iqr 准确。

另请参阅: range, iqr, mad, std.

 
y = range (x)
y = range (x, dim)
y = range (x, vecdim)
y = range (x, "all")
y = range (…, nanflag)

返回输入数据 x 的最大值和最小值的差。

如果 x 是一个向量,那么 range (x) 返回 x 中元素的最大值和最小值的差。

如果 x 是一个矩阵,那么 range (x) 返回行向量 y,值为 x 中每列的最大值和最小值的差。

如果 x 是一个数组,那么 range (x) 沿着 x 的第一个非单一维度计算最大值和最小值的差。

x 中的数据必须是数字。默认情况下,任何 NaN 值都会被忽略。 r 的大小等于 x 的大小,除了操作维度外,该维度变为 1。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度, 包括任何超过 ndims (x) 的维度,将返回 x

用输入参数 vecdim(一个不重复维度的向量)指定多个维度,将沿着由 vecdim 定义的数组切片进行操作。 如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 range 操作 x 的所有元素, 相当于 range (x(:))

可选参数 nanflag 指定是使用任何先前指定的输入参数组合来包含或排除 NaN 值进行计算。 nanflag 的默认值是 "omitnan",此时结果中不包括 NaN 值。 如果给出了参数 "includenan",并且存在 NaN 值,那么相应的结果将为 NaN。

使用注意:范围是数据集离散度的快速计算度量,但如果存在异常数据点,则不如 iqr 准确。

另请参阅: bounds, iqr, mad, std.

 
r = iqr (x)
r = iqr (x, dim)
r = iqr (x, vecdim)
r = iqr (x, "all")
[r, q] = iqr (…)

计算输入数据 x 的四分位距。

四分位距定义为 x 的第 75 百分位数和第 25 百分位数的差值,使用以下公式计算:

quantile (x, [0.25 , 0.75])

如果 x 是一个向量,那么 iqr (x) 返回 x 中元素的四分位距。

如果 x 是一个矩阵,那么 iqr (x) 返回一个行向量,其中每个元素包含 x 中相应列的四分位距。

如果 x 是一个数组,那么 iqr (x) 沿着 x 的第一个非单一维度计算四分位距。

x 中的数据必须是数字。默认情况下,任何 NaN 值都会被忽略。 r 的大小等于 x 的大小,除了操作维度外,该维度变为 1。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度, 包括任何超过 ndims (x) 的维度,将返回 zeros (size (x))

用输入参数 vecdim(一个不重复维度的向量)指定多个维度,将沿着由 vecdim 定义的数组切片进行操作。 如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 iqr 操作 x 的所有元素, 相当于 iqr (x(:))

可选输出参数 q 包含数据第 25 和 75 百分位的四分位数。

使用注意:在度量数据集离散度时,四分位距比 rangestd 更不易受异常值的影响。 标量的四分位距必然为 0。

另请参阅: bounds, mad, range, std, prctile, quantile.

 
m = mad (x)
m = mad (x, opt)
m = mad (x, opt, dim)
m = mad (x, opt, vecdim)
m = mad (x, opt, "all")

计算 x 中元素的平均绝对偏差或中值绝对偏差(MAD)。

平均绝对偏差定义为

mad = mean (abs (x - mean (x)))

中值绝对偏差定义为

mad = median (abs (x - median (x)))

mad 从计算中排除 NaN 值,类似于在 meanmedian 中使用 omitnan 参数。

如果 x 是一个向量,那么 mad (x) 返回 x 中元素的平均绝对偏差。

如果 x 是一个矩阵,那么 mad (x) 返回一个行向量, 其中每个元素包含 x 中相应列的平均绝对偏差。

如果 x 是一个数组,那么 mad (x) 沿着 x 的第一个非单一维度计算平均绝对偏差。

可选参数 opt 指定计算平均绝对偏差还是中值绝对偏差。默认值是 0,对应于平均绝对偏差; 值为 1 对应于中值绝对偏差。传递空输入 [] 默认为平均绝对偏差。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度, 包括任何超过 ndims (x) 的维度,将返回 zeros (size (x))

将维度指定为 vecdim(一个不重复维度的向量),将在由 vecdim 定义的数组切片上计算 mad。 如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 mad 操作 x 的所有元素,相当于 mad (x(:))

使用注意:在度量数据集离散度时,madstd 更不易受异常值的影响。

另请参阅: bounds, range, iqr, std, mean, median.

 
y = meansq (x)
y = meansq (x, dim)
y = meansq (x, vecdim)
y = meansq (x, "all")
y = meansq (…, nanflag)

计算输入数据 x 的均方。

均方定义为

meansq (x) = 1/N SUM_i x(i)^2

其中 N 是向量 x 的长度。

如果 x 是一个向量,那么 meansq (x) 返回 x 中元素的均方。

如果 x 是一个矩阵,那么 meansq (x) 返回一个行向量,其中每个元素包含 x 中相应列的均方。

如果 x 是一个数组,那么 meansq (x) 沿着 x 的第一个非单一维度计算均方。

x 中的数据必须是数字。y 的大小等于 x 的大小,除了操作维度外,该维度变为 1。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度, 包括任何超过 ndims (x) 的维度,将返回 zeros (size (x))

用输入参数 vecdim(一个不重复维度的向量)指定多个维度,将沿着由 vecdim 定义的数组切片进行计算。 如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 meansq 操作 x 的所有元素,相当于 meansq (x(:))

可选变量 nanflag 指定是包含还是排除计算中的 NaN 值。nanflag 的默认值是 "includenan",它在计算中保留 NaN 值。若要排除 NaN 值,请将 nanflag 的值设置为 "omitnan"

另请参阅: sum, prod.

 
v = var (x)
v = var (x, w)
v = var (x, w, dim)
v = var (x, w, vecdim)
v = var (x, w, "all")
v = var (x, w, …, nanflag)

计算 x 中元素的方差。

方差定义为

var (x) = 1/(N-1) SUM_i (x(i) - mean (x))^2

其中 Nx 中的元素个数。

如果 x 是一个向量,那么 var (x) 返回 x 中元素的方差。

如果 x 是一个矩阵,那么 var (x) 返回一个行向量,其中每个元素包含 x 中相应列的方差。

如果 x 是一个数组,那么 var (x) 沿着 x 的第一个非单一维度计算方差。

第二个参数 w 指定权重方案。有效的条目是:

0

使用 N-1 作为归一化因子(默认值),结果为每个数据元素提供平方偏差之和。

1

使用 N 作为归一化因子,结果为方差关于均值的二阶矩。

一个向量(非负元素)

计算加权方差。

如果 w 是向量,那么方差的计算公式为

var (x) = 1/(SUM_i w(i)) * (SUM_i w(i) * (x(i) - mean (x))^2)

可选的第三个输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度, 包括任何超过 ndims (x) 的维度,将返回 zeros (size (x))

用输入参数 vecdim(一个不重复维度的向量)指定多个维度,将沿着由 vecdim 定义的数组切片进行计算。 如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致在 x 的所有元素上操作,相当于 var (x(:))

可选变量 nanflag 指定是包含还是排除计算中的 NaN 值。在默认情况下,如果计算中包含 NaN 值,结果将为 NaN。 若要排除 NaN 值,请将 nanflag 的值设置为 "omitnan"

另请参阅: cov, mean, std, skewness, kurtosis, moment.

 
s = std (x)
s = std (x, w)
s = std (x, w, dim)
s = std (x, w, vecdim)
s = std (x, w, "all")
s = std (…, nanflag)
[s, m] = std (…)

计算 x 中元素的标准差。

标准差定义为

std (x) = sqrt ((1 / (N-1)) * SUM_i ((x(i) - mean(x))^2))

其中 Nx 中的元素个数。

如果 x 是一个向量,那么 std (x) 返回 x 中元素的标准差。

如果 x 是一个矩阵,那么 std (x) 返回一个行向量,其中每个元素包含 x 中相应列的标准差。

如果 x 是一个数组,那么 std (x) 沿着 x 的第一个非单一维度计算标准差。

可选参数 w 确定要使用的权重方案。有效的值有:

0 [默认值]:

使用 N-1 进行归一化(总体标准差)。这提供了标准差的最佳无偏估计量的平方根。

1:

使用 N 进行归一化(样本标准差)。这提供了关于均值的二阶矩的平方根。

一个向量:

使用非负权重计算加权标准差。w 的长度必须等于 x 在操作维度上的大小。w 中可以包含 NaN 值,这些值将与 x 中的关联值相乘,并且可以通过 nanflag 选项排除。

一个数组:

类似于向量权重,但 w 必须与 x 大小相同。如果操作维度指定为 vecdim"all"w 不是标量,则 w 必须是相同大小的数组。

注意:w 必须在指定任何以下维度选项之前指定。要使用 w 的默认值,可以传递空输入参数 []

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度,包括任何超过 ndims (x) 的维度,将返回 zeros (size (x))

用输入参数 vecdim(一个不重复维度的向量)指定多个维度,将沿着由 vecdim 定义的数组切片进行操作。如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 std 操作 x 的所有元素,相当于 std (x(:))

可选变量 nanflag 指定是使用前面指定的任何输入参数组合在计算中包括还是排除 NaN 值。nanflag 的默认值是 "includenan",它在计算中保留 NaN 值。要排除 NaN 值,请将 nanflag 的值设置为 "omitnan"。如果 x 在操作维度中全部由 NaN 值组成,输出仍将包含 NaN 值。

可选的第二个输出变量 m 包含用于计算标准差的 x 元素的均值。如果 v 是加权标准差,则 m 也是加权均值。

另请参阅: var, bounds, mad, range, iqr, mean, median.

除了知道离散度的大小之外,了解数据集的形状也很有用。例如,数据点是集中在均值的左侧还是右侧?Octave 提供了几种常用的度量来描述数据集的形状。Octave 还可以计算矩,从而可以开发任意形状度量。

 
s = skewness (x)
s = skewness (x, dim)
s = skewness (x, vecdim)
s = skewness (x, "all")
s = skewness (…, nanflag)

计算输入数据 x 的偏度。

如果 x 是一个向量,那么 skewness (x) 返回 x 中元素的偏度。

如果 x 是一个矩阵,那么 skewness (x) 返回一个行向量,其中每个元素包含 x 中相应列的偏度。

如果 x 是一个数组,那么 skewness (x) 沿着 x 的第一个非单一维度计算偏度。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度,包括任何超过 ndims (x) 的维度,将返回 NaN

用输入参数 vecdim(一个不重复维度的向量)指定多个维度,将沿着由 vecdim 定义的数组切片进行操作。如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 skewness 操作 x 的所有元素,相当于 skewness (x(:))

可选变量 nanflag 指定是使用前面指定的任何输入参数组合在计算中包括还是排除 NaN 值。nanflag 的默认值是 "includenan",它在计算中保留 NaN 值。要排除 NaN 值,请将 nanflag 的值设置为 "omitnan"。如果 x 在操作维度中全部由 NaN 值组成,输出仍将包含 NaN 值。

另请参阅: kurtosis, moment.

 
s = kurtosis (x)
s = kurtosis (x, dim)
s = kurtosis (x, vecdim)
s = kurtosis (x, "all")
s = kurtosis (…, nanflag)

计算输入数据 x 的峰度。

如果 x 是一个向量,那么 kurtosis (x) 返回 x 中元素的峰度。

如果 x 是一个矩阵,那么 kurtosis (x) 返回一个行向量,其中每个元素包含 x 中相应列的峰度。

如果 x 是一个数组,那么 kurtosis (x) 沿着 x 的第一个非单一维度计算峰度。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度,包括任何超过 ndims (x) 的维度,将返回 NaN

用输入参数 vecdim(一个不重复维度的向量)指定多个维度,将沿着由 vecdim 定义的数组切片进行操作。如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 kurtosis 操作 x 的所有元素,相当于 kurtosis (x(:))

可选变量 nanflag 指定是使用前面指定的任何输入参数组合在计算中包括还是排除 NaN 值。nanflag 的默认值是 "includenan",它在计算中保留 NaN 值。要排除 NaN 值,请将 nanflag 的值设置为 "omitnan"。如果 x 在操作维度中全部由 NaN 值组成,输出仍将包含 NaN 值。

另请参阅: skewness, moment.

 
m = moment (x, p)
m = moment (x, p, dim)
m = moment (x, p, vecdim)
m = moment (x, p, "all")
m = moment (x, p, …, nanflag)
m = moment (x, p, type, …)

计算输入数据 x 关于均值的 p 阶中心矩。

如果 x 是一个向量,那么 moment (x, p) 返回 x 中元素的 p 阶中心矩。

如果 x 是一个矩阵,那么 moment (x, p) 返回一个行向量,其中每个元素包含 x 中相应列的 p 阶中心矩。

如果 x 是一个数组,那么 moment (x, p) 沿着 x 的第一个非单一维度计算 p 阶中心矩。

可选输入参数 dim 指定要操作的维度,并且必须是正整数。指定 x 中的任何单一维度,包括任何超过 ndims (x) 的维度,将返回 NaN

用输入参数 vecdim(一个不重复维度的向量)指定多个维度,将沿着由 vecdim 定义的数组切片进行操作。如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 moment 操作 x 的所有元素,相当于 moment (x(:), p)

可选变量 nanflag 指定是使用前面指定的任何输入参数组合在计算中包括还是排除 NaN 值。nanflag 的默认值是 "includenan",它在计算中保留 NaN 值。要排除 NaN 值,请将 nanflag 的值设置为 "omitnan"。如果 x 在操作维度中全部由 NaN 值组成,输出仍将包含 NaN 值。

如果提供了可选参数 type,它指定要计算的矩的类型。有效的选项有:

"c"

中心矩(相对于均值)。这是默认值。

"a"

原始矩(相对于零)。

另请参阅: var, skewness, kurtosis.

Octave 还提供以下与描述性统计相关的函数:

 
c = cov (x)
c = cov (x, y)
[c, d] = cov (x)
[c, d] = cov (x, opt)

计算 x 的协方差矩阵。

如果 x 是一个向量,cov 计算 x 中元素的方差。

如果 x 是一个矩阵,cov 计算协方差矩阵 c,其中行对应观测值,列对应变量。

如果提供了额外的输入 ycov 计算协方差矩阵 c = [x(:) y(:)] 的协方差矩阵。

第二个输出参数 d 是协方差矩阵的对角线(即 x 的每个变量的方差)。

可选参数 opt 确定归一化因子。有效值为:

0

使用 N-1 进行归一化(默认值)。如果观测值少于 2 个,则输出 NaN。

1

使用 N 进行归一化。

另请参阅: corrcoef, var, std.

 
c = corrcoef (x)
c = corrcoef (x, y)

计算 x 的相关系数矩阵。

如果 x 是一个矩阵,corrcoef 计算相关系数矩阵 c,其中每对列之间进行相关。

如果提供了额外的输入 y,则 corrcoef 计算 [x(:) y(:)] 的相关系数。

另请参阅: cov.

 
r = spearman (x)
r = spearman (x, y)

计算 x 中每对变量的 Spearman 秩相关系数 r

如果 x 是一个矩阵,spearman 计算 Spearman 秩相关系数矩阵 r,其中每对列之间进行相关。

如果提供了额外的输入 y,则 spearman 计算 [x(:) y(:)] 的 Spearman 秩相关系数。

另请参阅: kendall, corrcoef, cov.

 
r = kendall (x)
r = kendall (x, y)

计算 x 中每对变量的 Kendall 秩相关系数 r

如果 x 是一个矩阵,kendall 计算 Kendall 秩相关系数矩阵 r,其中每对列之间进行相关。

如果提供了额外的输入 y,则 kendall 计算 [x(:) y(:)] 的 Kendall 秩相关系数。

另请参阅: spearman, corrcoef, cov.

 
stats = statistics (x)
stats = statistics (x, dim)
stats = statistics (x, vecdim)
stats = statistics (x, "all")
stats = statistics (…, nanflag)

返回输入数据 x 的统计参数向量。

statistics (x 沿着 x 的第一个非单一维度操作,并计算以下统计参数:

  1. 最小值
  2. 第一四分位数
  3. 中值
  4. 第三四分位数
  5. 最大值
  6. 均值
  7. 标准差
  8. 偏度
  9. 峰度

如果 x 是一个行向量,那么 statistics (x) 返回一个行向量,其中包含上述统计参数。如果 x 是一个列向量,那么它返回一个列向量。

如果 x 是一个矩阵,那么 statistics (x) 返回一个矩阵,其中每列包含在 x 的相应列上计算的统计参数。

如果 x 是一个数组,那么 statistics (x) 沿着 x 的第一个非单一维度计算统计参数。

x 中的数据必须是数值型的,默认情况下,在计算除了均值和标准差之外的统计参数时,任何 NaN 值都会被忽略。将可选参数 nanflag 设置为 "omitnan" 可以从均值和标准差参数的计算中排除 NaN 值。将 nanflag 设置为 "includenan" 将被忽略,相当于调用 statistics 函数而不带 nanflag 参数。

stats 的大小等于 x 的大小,除了操作维度外,操作维度的大小等于 9(即返回的统计参数的数量)。

可选输入参数 dim 指定要操作的维度,必须是正整数。指定 x 的任何单一维度,包括任何超过 ndims (x) 的维度,将返回 x

vecdim 指定多个维度(一个不重复维度的向量),将在 vecdim 定义的数组切片上操作。如果 vecdim 索引了 x 的所有维度,则相当于选项 "all"vecdim 中任何大于 ndims (x) 的维度将被忽略。

将维度指定为 "all" 将导致 statisticsx 的所有元素上操作,相当于 statistics (x(:))

另请参阅: min, max, median, mean, std, skewness, kurtosis.