如何像Excel一样使用SPSS对数据进行排序操作

原创 学习认人进步  2019-05-29 09:37  阅读 105 次

对数据进行排序是个厉害的操作。排序在发现最大和最小两个极值方面是最直接快速的。除此之外,排序在发现重复值、缺失值、排名等问题上同样非常出色。

SPSS如何做排序

有15名学生的语文、英语2门课程成绩,现在需要通过SPSS排序操作初步了解这些学生各科成绩的排名情况。

按单个变量排序

(1)按照单列排序,找最大最小值

和excel一样,spss排序也有快捷操作,首先右键选中要排序的列“语文”,选择“降序排列”,梁山众好汉的语文成绩排名结果上图,玉麒麟满分获得第一名,李逵和花和尚两个同学语文成绩较差,还不够及格的。

(2)排序后总体观察有无异常值

SPSS的菜单操作很出色,在“数据”菜单中选择“排序个案”,按照“英语”成绩进行降序排列,结果如下图:

神马?小李广同学外语成绩551分!100百分制怎么可能会出现551分呢,这一定是异常值了,在数据录入过程中经常出现类似的情况,经检测核对,小李广实际成绩为55分。通过排序,发现了一例异常,另外发现有3位同学英语不及格,分别是武松、霹雳火、小旋风。

按多个变量排序

(1)多变量排序,关键点是抓住主要和次要变量。

我们更希望先掌握好自家本事,再学习别人的优点。语文是母语课程,评价学生的学习情况,我们首先看其语文成绩如何,这是主要依据,外语作为次要依据。

首先选择排序的主要依据“语文”,再选择次要依据“英语”,采用降序排列。结果见下图:

总体而言,语文和英语成绩有一定的相关性,有待其他方法验证。入云龙和及时雨对自家本领和外国经验都掌握的很好,李逵兄弟的2门课程都比较差。

名次秩(rank)

排名或名次在学科成绩中比较敏感,总是让读者能够印象深刻,作为数据分析或展示,我们都希望观者能够敏锐的观察和记忆比较重要的数字。排序之后如果再加上一列名次,记忆效果会更好。

在excel中,可以新增一列,然后通过自动填充按顺序完成排行。在SPSS中,则可以使用“个案求秩”来完成,我们可以把“秩”简单理解成顺序或名次。

在“转换”菜单中,选择“个案等级排序”,选择“语文”成绩做为排名的依据变量,第二步将语文成绩的最大值定义为第1名,第三步在“结”选项单中,选择“顺序等级到值”,由于翻译的小细节,导致第三步不易理解,大概意思是:如果遇到相同成绩,则赋予相同的名次。

SPSS自动生成和新增了一个变量“R语文”,就是按照语文排序的名次变量,可配合语文成绩一起观察。通过查看“R语文”,语文成绩的排行榜一目了然。

SPSS条件排序

对英语及格和低于60分的学生分别进行排名,或者我们只想对英语成绩达到及格标准的学生进行排名。

(1)按照60分标准对英语成绩进行分段

“转换”菜单中选择“可视化分箱”,选择“英语”作为要分段的变量。新增变量“是否及格”,60分以下划分为不及格,60分及以上为及格,生成相应的表情,最后会自动生成一个分段的变量。

(2)按照新增的“是否及格”变量将15名学生的数据拆分为两部分。

在“数据”菜单中选择“拆分变量”功能,用“是否及格”作为拆分的依据,将原数据拆分为两个组,即不及格组和及格组进行对比,接下来选择“按分组变量排序文件”,则自动为拆分后的两个组进行排序操作。

上图是条件排序后的最终结果。

就如文章开头说得一样,排序在数据分析过程中只是一个小小的基础操作,但它是我们快速了解数据整体情况的方法之一,不容忽视。同时,排序也是众多高级数据分析方法的一个基础操作,拿到数据,养成良好的排序习惯,有助于快速了解数据和推进数据分析过程的整体效率。

本文地址:http://www.datasoldier.net/archives/1206
版权声明:本文为原创文章,版权归 学习认人进步 所有,欢迎分享本文,转载请保留出处!
NEXT:已经是最新一篇了

评论已关闭!