数据合并
数据处理是指对数据(包含数值和非数值类型)进行分析和加工的技术过程;也就是对数据的采集、检索、加工、变换和传输,将数据转换为信息的过程。
数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
计算机的数据处理是使用计算机收集、记录数据,并经过一个或若干个处理方式组合,最后输出的是各种文字和数字的表格和报表。数据处理主要包含11种处理方式:数据查询、数据计算、数据排序、缺失值填充、数据抽样、变量处理、数据合并、重新编码、数据重构、数据汇总、随机数生成。
数据合并,顾名思义就是将两个或两个以上的数据进行合并。合并的方式有变量合并,记录合并,数据合并。按变量合并可以增加数据的字段属性,按记录合并可以在原始数据集中增加记录的长度,而数据合并是按指定的一个或多个变量进行分组,根据指定的合并函数对各组数据进行描述。
三相关应用数据合并主要应用于数据的整合,可以把多个数据表中的数据或变量进行合并,变成一个大的新数据表,或者对表中的数据先分组,然后根据合并函数对分组变量进行数据汇总计算。
合并函数的方法:最大值、最小值、求和、第一个值、平均值、最后一个值、变量个数、大于输入数据的百分比、小于输入数据的百分比、在输入数据范围内的百分比、在输入数据范围外的百分比。
四参考资料1 数据合并—百度百科
2 马克威分析系统使用教程,http://www.tenly.com
五实例示例数据为某小学三年级部分学生的体重和身高数据(单位为:千克,厘米)
编号 | 体重 |
1 | 52 |
2 | 42 |
3 | 31 |
体重数据1
编号 | 体重 |
4 | 36 |
5 | 33 |
6 | 35 |
7 | 46 |
体重数据2
编号 | 身高 |
1 | 134 |
2 | 142 |
3 | 131 |
身高数据1
1)将“体重数据1”与“身高数据1”按变量合并数据的结果为:
编号 | 体重 | 身高 |
1 | 52 | 134 |
2 | 42 | 142 |
3 | 31 | 131 |
变量合并1
2)将“体重数据1”与“体重数据2”按记录合并数据的结果为:
编号 | 体重 |
1 | 52 |
2 | 42 |
3 | 31 |
4 | 36 |
5 | 33 |
6 | 35 |
7 | 46 |
输入变量类型:数值型、字符型。
输出结果:给出经过变量合并处理后的显示结果。
七相关条目变量合并、数据合并
八优缺点优点:数据合并充分地整合了表的资源信息,方便数据解读与数据计算。