马克威误差图
马克威操作说明
(1)以数据文件“马克威通用数据1.mkw”为例,演示误差图中数据为变量描述模式的操作。
首先,在工作区内,打开建模分析工作流:“数据制图”→“误差图”,接着选择数据源,然后设置算法参数,最后双击运行按钮。
其中各类参数的含义为:
数据:定义数据组织表达方式。
观察量分类描述模式:即观测组汇总。
变量描述模式:即单独变量汇总。
观测量分类描述模式
变量:选入一个变量作为纵坐标。
类轴:选入一个变量作为横坐标。
描述:下拉列表用来选择置信区间、标准差、标准偏差。如果选择置信区间,则等级可用。如果选择标准差和标准偏差,则倍数可用。
等级:设置可信区间。
倍数:定义标准误或标准差的倍数。
变量描述模式
描述:下拉列表用来选择置信区间、标准差、标准偏差。如果选择置信区间,则等级可用。如果选择标准差和标准偏差,则倍数可用。
等级:设置可信区间。
倍数:定义标准误或标准差的倍数。
参数设置如下所示,数据选择“变量描述模式”,分析变量选择“浏览次数”、“购买数量”,置信区间等级为95%:



(2)输出结果
误差图:

(3)结果说明
本例中系统按每个变量汇总,并计算它们的误差及其置信区间,从图中可以看到两个变量浏览次数和购买数量,它们的数据都比较聚集。可以认为顾客的浏览次数和购买数量都控制在一定的误差范围之内,无明显的差异性存在。
数据要求
输入变量类型:数值型,如整型、浮点型、布尔型
算法用途
由误差图观察样本的离散程度
算法原理
误差图是一种描述数据总体离散的统计图形,利用它可以从视觉的角度观察样本的离散度情况。误差图表达平均数的置信区间、标准差和标准误。在误差图中小方块表示平均数,图形的两端为置信区间、标准差或标准误。
结果与解释
输出结果:
输出符合用户要求的误差图;根据误差图可以看到数据的集散程度