马克威频率分析

马克威操作说明

(1)以数据文件“马克威通用数据1.mkw”为例,演示频率分析算法的操作说明。首先,在工作区内,打开建模分析工作流:“基础统计”→“频率分析”,接着选择数据源,然后设置算法的参数,最后点击运行按钮。

其中各类参数的含义为:

区间选项:设置区间划分的方法,包括指定区间个数和区间长度两种方法:

从__到__:指定需要进行频率分析的变量值范围。

区间个数:按指定区间个数进行划分。

区间长度:按指定区间长度进行划分。

保存设置:若修改了区间选项,则必须保存选项设置,否则,区间设置不起作用。

统计量:指定需要输出的统计量。

对变量“购买总额”进行频率分析。具体的参数设置如下所示:

图 0-1 频率分析-属性设置

(2)输出结果

双击“运行”节点,输出分析结果。系统将根据区间选项的设置绘制频率表如下:

图 0-2 频率分析-树形结果列表 图 0-3 频率分析-购买总额统计量表 图 0-4 频率分析-购买总额频率表

(3)结果说明

第一列“变量值”:该变量不同水平值,按照从小到大的顺序自上而下排列。

第二列“频数”:变量不同水平值对应的记录数。

第三列“百分比”:变量不同水平值对应观察数占该变量总观察数的比重。

第四列“累计百分比”:累计百分比表示由小到大,累计到该行对应的变量水平值的观察数占该变量总观察数的比重。

数据要求

输入变量类型:整型、浮点型

输入数据尺度:标量型、有序型、名义型

算法用途

用于观测数据的分布状况和数量特征。

算法原理

频率分析对变量观测数据按组进行归纳整理,对变量的频率、百分比、累积百分比进行统计分析,得到变量取不同值时的频数分析表,形成对数据的数量特征和观测量分布状况的总体认识。

结果与解释

输出结果:

描述中心趋势的统计量:频率、均值、中值、众数、总和。

描述离中趋势的统计量:最大值、最小值、标准差、方差、极差、均值标准误。

描述分布的统计量:偏度、峰度。其中,偏度描述核密度曲线相对于平均值不对称程度的特征数;峰度描述分布形态的陡缓程度。