Array ( [article_id] => 71 [article_title] => 样本方差检验 [article_keyword] => 样本方差检验 [article_description] => 样本方差检验 [article_detail] => 可通过样本的方差来推断总体方差是否等于指定的值 [article_content] => <div class="rightwrap collegeDetail"> <h1 class="algorithmName"> 样本方差检验 </h1> <div class="clearfix topcontent"> <p> 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作推断。 </p> <p> 假设检验又分为对已知分布的参数检验和对未知分布的非参数检验。参数检验要利用到总体的信息,如总体分布、总体的一些特征和方差;以总体分布和样本信息对总体参数作推断。 </p> <p> 参数检验可以分为:以单样本数据的均值推断总体的均值;单样本数据的方差推断总体的方差;以相互独立的双样本数据来推断样本是否来自于同均值或同方差的总体;样本数据的比例检验验证总体数据的比例。 </p> <p> 假设检验的基本思想:小概率原理。如果对总体的某种假设是真实的,那么不利于或者不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的,要是在一次试验中A发生了,就有理由怀疑该假设的真实性,拒绝这一假设。 </p> </div> <div class="lemma_catalog clearfix"> <h2 class="block_title"> 目录 </h2> <div class="lemma_list"> <a href="#a_2">1、算法描述</a><a href="#a_19">2、相关应用</a><a href="#a_21">3、参考资料</a><a href="#a_27">4、实例</a><a href="#a_40">5、输入输出</a><a href="#a_44">6、相关条目</a><a href="#a_46">7、优缺点</a> </div> </div> <a name="a_2"></a><a class="para_title"><span class="number">一</span>算法描述</a> <p> 1.1.算法摘要 </p> <p> 样本方差检验主要有单样本方差检验和双样本方差检验。在均值未知的情况下,可通过样本的方差来推断总体方差是否等于指定的值或两个样本值是否相等;但必须满足某些条件,首先样本必须服从正态分布;同时双样本必须来自相互独立的两个总体。 </p> <p> 1.2.算法原理 </p> <p> 1.2.1 参数检验的基本思想 </p> <p> 小概率原理:小概率事件在一次试验中是几乎不可能发生的,假若在一次试验中事件事实上发生了。那只能认为事件不是来自我们假设的总体,也就是认为我们对总体所做的假设不正确。 </p> <p> 1.2.2 总体方差为定值的方差检验 </p> <p> 总体方差的显著性检验可有双尾、左单尾、右单尾三种不同的情况。下面就总体分布为正态分布的情况,总体方差是否已知的不同情况以及样本大小的不同情况分别介绍检验统计量和检验规则。 </p> <p> (1)总体为正态分布,总体均值和方差未知 </p> <p> 对于假设:H0:<img src="/uploadfile/article/2016-12-9/basic/image041.png" />, H1:<img src="/uploadfile/article/2016-12-9/basic/image042.png" />的,有检验统计量 </p> <img src="/uploadfile/article/2016-12-9/basic/image043.png" /> <p> 如果规定显著性水平为在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为:① <img src="/uploadfile/article/2016-12-9/basic/image044.png" />和 <img src="/uploadfile/article/2016-12-9/basic/image045.png" />;②<img src="/uploadfile/article/2016-12-9/basic/image046.png" />;③ <img src="/uploadfile/article/2016-12-9/basic/image047.png" />。 </p> <p> (2)总体为正态分布,双样本的均值未知 </p> <p> 对于假设:H0:<img src="/uploadfile/article/2016-12-9/basic/image048.png" />, H1:<img src="/uploadfile/article/2016-12-9/basic/image049.png" />,有检验统计量为 </p> <img src="/uploadfile/article/2016-12-9/basic/image050.png" /> <p> 如果规定显著性水平为在双尾,左单尾,右单尾三种不同情况下,拒绝域分别为:① <img src="/uploadfile/article/2016-12-9/basic/image051.png" />和 <img src="/uploadfile/article/2016-12-9/basic/image052.png" />;②<img src="/uploadfile/article/2016-12-9/basic/image053.png" />;③ <img src="/uploadfile/article/2016-12-9/basic/image054.png" />。 </p> <a name="a_19"></a><a class="para_title"><span class="number">三</span>相关应用</a> <p> 样本方差检验用来推断总体的特征。可以对任何领域的数值型数据进行检验。 </p> <a name="a_21"></a><a class="para_title"><span class="number">四</span>参考资料</a> <p> 1维基百科 </p> <p> 2百度 </p> <p> 3马克威分析系统使用教程,www.tenly.com </p> <p> 4《应用多元分析(第三版)》,王学民编著,上海财经大学出版社 </p> <p> 5《多元统计分析》,张润楚,科学出版社2006年版 </p> <a name="a_27"></a><a class="para_title"><span class="number">五</span>实例</a> <p> 1、单样本方差检验 </p> <p> 示例为某商店10种品牌,经过对顾客的调查得到的品牌知名度和顾客满意度数据,分析知名度的方差是否为0.8? </p> <table class="college_table"> <tbody> <tr class="thead"> <td> 品牌 </td> <td> 知名度 </td> </tr> <tr> <td> A </td> <td> 0.9 </td> </tr> <tr> <td> B </td> <td> 0.68 </td> </tr> <tr> <td> C </td> <td> 0.44 </td> </tr> <tr> <td> D </td> <td> 0.18 </td> </tr> <tr> <td> E </td> <td> 0.58 </td> </tr> <tr> <td> F </td> <td> 0.38 </td> </tr> <tr> <td> G </td> <td> 0.5 </td> </tr> <tr> <td> H </td> <td> 0.53 </td> </tr> <tr> <td> I </td> <td> 0.75 </td> </tr> <tr class="lasttr"> <td> J </td> <td> 0.99 </td> </tr> </tbody> </table> <p> 原假设H0:Var = 0.8,备择假设为H1:Var<img src="/uploadfile/article/2016-12-9/basic/image055.png" />0.8,取置信水平为0.95,经过计算得到知名度的检验结果: </p> <table class="college_table"> <tbody> <tr class="thead"> <td> 卡方统计量 </td> <td> 自由度 </td> <td> P值 </td> <td> 方差的95%置信区间 </td> </tr> <tr> <td> 0.6703 </td> <td> 9 </td> <td> 0.0002 </td> <td> (0.0282,0.1986) </td> </tr> </tbody> </table> <p> 从置信P值0.0002远小于0.05,即拒绝原假设,认为知名度的方差不等于0.8. </p> <p> 2、双样本方差检验 </p> <p> 示例为某商店10种品牌,经过对顾客的调查得到的品牌知名度和顾客满意度数据,分析知名度与满意度之间方差是否相等? </p> <table class="college_table"> <tbody> <tr class="thead"> <td> 品牌 </td> <td> 知名度 </td> <td> 满意度 </td> </tr> <tr> <td> A </td> <td> 0.9 </td> <td> 0.9 </td> </tr> <tr> <td> B </td> <td> 0.68 </td> <td> 0.78 </td> </tr> <tr> <td> C </td> <td> 0.44 </td> <td> 0.35 </td> </tr> <tr> <td> D </td> <td> 0.18 </td> <td> 0.16 </td> </tr> <tr> <td> E </td> <td> 0.58 </td> <td> 0.49 </td> </tr> <tr> <td> F </td> <td> 0.38 </td> <td> 0.19 </td> </tr> <tr> <td> G </td> <td> 0.5 </td> <td> 0.64 </td> </tr> <tr> <td> H </td> <td> 0.53 </td> <td> 0.54 </td> </tr> <tr> <td> I </td> <td> 0.75 </td> <td> 0.83 </td> </tr> <tr class="lasttr"> <td> J </td> <td> 0.99 </td> <td> 0.9 </td> </tr> </tbody> </table> <p> 原假设H0:Var1 = Var2,备择假设为H1:Var1<img src="/uploadfile/article/2016-12-9/basic/image055.png" />Var2,取置信水平为0.95,经过计算得到知名度的检验结果: </p> <table class="college_table"> <tbody> <tr class="thead"> <td> F统计量 </td> <td> 自由度 </td> <td> P值 </td> <td> Var1/Var2的95%置信区间 </td> </tr> <tr class="lasttr"> <td> 0.7639 </td> <td> 9 </td> <td> 0.6948 </td> <td> (0.1897,3.0754) </td> </tr> </tbody> </table> <p> 从置信水平P值可以看出,接受原假设,认为知名度与满意度之间的方差是相等的。 </p> <a name="a_40"></a><a class="para_title"><span class="number">六</span>输入输出</a> <p> 输入变量类型:整型、浮点型 </p> <p> 输入数据尺度:标量型、名义型、有序型 </p> <p> 输出结果:方差假设检验结果表,计算出的显著性水平(P值)与0.05对比,若小于显著性水平则拒绝原假设。 </p> <a name="a_44"></a><a class="para_title"><span class="number">七</span>相关条目</a> <p> 假设检验、显著性水平、抽样、小概率事件 </p> <a name="a_46"></a><a class="para_title"><span class="number">八</span>优缺点</a> <p> 优点:检验效率高 </p> <p> 缺点:总体分布非正态,且无法通过适当的变量变换达到正态分布,或者分布类型未知,则不能使用;精确测量后才有可能计算参数统计量,不可精确测量的数据,如 &gt;50mg,&lt;10mg等;对于分类资料,作用有限。 </p> </div> [is_show] => 1 [cat_id] => 58 [article_img] => [article_order] => 1 [article_time] => 1478656444 [isdel] => 0 )

样本方差检验

假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作推断。

假设检验又分为对已知分布的参数检验和对未知分布的非参数检验。参数检验要利用到总体的信息,如总体分布、总体的一些特征和方差;以总体分布和样本信息对总体参数作推断。

参数检验可以分为:以单样本数据的均值推断总体的均值;单样本数据的方差推断总体的方差;以相互独立的双样本数据来推断样本是否来自于同均值或同方差的总体;样本数据的比例检验验证总体数据的比例。

假设检验的基本思想:小概率原理。如果对总体的某种假设是真实的,那么不利于或者不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的,要是在一次试验中A发生了,就有理由怀疑该假设的真实性,拒绝这一假设。

算法描述

1.1.算法摘要

样本方差检验主要有单样本方差检验和双样本方差检验。在均值未知的情况下,可通过样本的方差来推断总体方差是否等于指定的值或两个样本值是否相等;但必须满足某些条件,首先样本必须服从正态分布;同时双样本必须来自相互独立的两个总体。

1.2.算法原理

1.2.1 参数检验的基本思想

小概率原理:小概率事件在一次试验中是几乎不可能发生的,假若在一次试验中事件事实上发生了。那只能认为事件不是来自我们假设的总体,也就是认为我们对总体所做的假设不正确。

1.2.2 总体方差为定值的方差检验

总体方差的显著性检验可有双尾、左单尾、右单尾三种不同的情况。下面就总体分布为正态分布的情况,总体方差是否已知的不同情况以及样本大小的不同情况分别介绍检验统计量和检验规则。

(1)总体为正态分布,总体均值和方差未知

对于假设:H0:, H1:的,有检验统计量

如果规定显著性水平为在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为:① ;②;③

(2)总体为正态分布,双样本的均值未知

对于假设:H0:, H1:,有检验统计量为

如果规定显著性水平为在双尾,左单尾,右单尾三种不同情况下,拒绝域分别为:① ;②;③

相关应用

样本方差检验用来推断总体的特征。可以对任何领域的数值型数据进行检验。

参考资料

1维基百科

2百度

3马克威分析系统使用教程,www.tenly.com

4《应用多元分析(第三版)》,王学民编著,上海财经大学出版社

5《多元统计分析》,张润楚,科学出版社2006年版

实例

1、单样本方差检验

示例为某商店10种品牌,经过对顾客的调查得到的品牌知名度和顾客满意度数据,分析知名度的方差是否为0.8?

品牌 知名度
A 0.9
B 0.68
C 0.44
D 0.18
E 0.58
F 0.38
G 0.5
H 0.53
I 0.75
J 0.99

原假设H0:Var = 0.8,备择假设为H1:Var0.8,取置信水平为0.95,经过计算得到知名度的检验结果:

卡方统计量 自由度 P值 方差的95%置信区间
0.6703 9 0.0002 (0.0282,0.1986)

从置信P值0.0002远小于0.05,即拒绝原假设,认为知名度的方差不等于0.8.

2、双样本方差检验

示例为某商店10种品牌,经过对顾客的调查得到的品牌知名度和顾客满意度数据,分析知名度与满意度之间方差是否相等?

品牌 知名度 满意度
A 0.9 0.9
B 0.68 0.78
C 0.44 0.35
D 0.18 0.16
E 0.58 0.49
F 0.38 0.19
G 0.5 0.64
H 0.53 0.54
I 0.75 0.83
J 0.99 0.9

原假设H0:Var1 = Var2,备择假设为H1:Var1Var2,取置信水平为0.95,经过计算得到知名度的检验结果:

F统计量 自由度 P值 Var1/Var2的95%置信区间
0.7639 9 0.6948 (0.1897,3.0754)

从置信水平P值可以看出,接受原假设,认为知名度与满意度之间的方差是相等的。

输入输出

输入变量类型:整型、浮点型

输入数据尺度:标量型、名义型、有序型

输出结果:方差假设检验结果表,计算出的显著性水平(P值)与0.05对比,若小于显著性水平则拒绝原假设。

相关条目

假设检验、显著性水平、抽样、小概率事件

优缺点

优点:检验效率高

缺点:总体分布非正态,且无法通过适当的变量变换达到正态分布,或者分布类型未知,则不能使用;精确测量后才有可能计算参数统计量,不可精确测量的数据,如 >50mg,<10mg等;对于分类资料,作用有限。