马克威误差图

马克威操作说明

(1)以数据文件“马克威通用数据1.mkw”为例,演示误差图中数据为变量描述模式的操作。

首先,在工作区内,打开建模分析工作流:“数据制图”→“误差图”,接着选择数据源,然后设置算法参数,最后双击运行按钮。

其中各类参数的含义为:

数据:定义数据组织表达方式。

观察量分类描述模式:即观测组汇总。

变量描述模式:即单独变量汇总。

观测量分类描述模式

变量:选入一个变量作为纵坐标。

类轴:选入一个变量作为横坐标。

描述:下拉列表用来选择置信区间、标准差、标准偏差。如果选择置信区间,则等级可用。如果选择标准差和标准偏差,则倍数可用。

等级:设置可信区间。

倍数:定义标准误或标准差的倍数。

变量描述模式

描述:下拉列表用来选择置信区间、标准差、标准偏差。如果选择置信区间,则等级可用。如果选择标准差和标准偏差,则倍数可用。

等级:设置可信区间。

倍数:定义标准误或标准差的倍数。

参数设置如下所示,数据选择“变量描述模式”,分析变量选择“浏览次数”、“购买数量”,置信区间等级为95%:

(2)输出结果

误差图:

(3)结果说明

本例中系统按每个变量汇总,并计算它们的误差及其置信区间,从图中可以看到两个变量浏览次数和购买数量,它们的数据都比较聚集。可以认为顾客的浏览次数和购买数量都控制在一定的误差范围之内,无明显的差异性存在。

数据要求

输入变量类型:数值型,如整型、浮点型、布尔型

算法用途

由误差图观察样本的离散程度

算法原理

误差图是一种描述数据总体离散的统计图形,利用它可以从视觉的角度观察样本的离散度情况。误差图表达平均数的置信区间、标准差和标准误。在误差图中小方块表示平均数,图形的两端为置信区间、标准差或标准误。

结果与解释

输出结果:

输出符合用户要求的误差图;根据误差图可以看到数据的集散程度