博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
spss中如何处理极端值、错误值
阅读量:5371 次
发布时间:2019-06-15

本文共 637 字,大约阅读时间需要 2 分钟。

中录入数据以后,第一步不是去,而是要检验数据是不是有录入错误的,是不是有不合常理的数据,今天我们要做一个描述性统计,进而查看哪些数据是不合理的。下面是具体的步骤:

工具/原料
    spss20.0
方法/步骤
    1
    先准备好数据,然后打开描述性统计对话框,如图所示,执行菜单:analyse--descriptive statistic--descriptive
    2
    将你要检验的变量放入variables对话框,点击箭头可以添加或者删除变量
    3
    勾选如图所示的选项,他的意思是输出Z分数,并作为一个变量列出来。因为检查数据有效性的时候会用到Z分数
  
    4

点击options按钮,设置需要输出的描述性统计量,我们需要的统计量主要是最大值和最小值,所以,你看到下面第二幅图,勾选最大值和最小值

    5
    点击continue按钮,点击ok,开始处理数据,并输出处理结果
    6
    我们看到有一个表格,输出了最大值和最小值,根据这个值我们可以判断,这个变量中的数据是不是超出了合理的范围,比如,这个变量的意思是身高,你的数据的最大值为5米,这时侯你就可以想到,有数据录入错误了。
    7

接下来切换到视图中,我们看到生成了一个新的变量,他是x8这个变量的Z分数,我们知道,如果数据是正太分布的,那么数据应当分布在正负三个标准差之内,因此,从图中我们看到,Z分数大于3或小于-3的数据就是错误的数据.

转载于:https://www.cnblogs.com/amengduo/p/9587497.html

你可能感兴趣的文章
浅谈性能测试
查看>>
较快的maven的settings.xml文件
查看>>
随手练——HDU 5015 矩阵快速幂
查看>>
Python环境搭建(安装、验证与卸载)
查看>>
linux的子进程调用exec( )系列函数
查看>>
zju 2744 回文字符 hdu 1544
查看>>
【luogu P2298 Mzc和男家丁的游戏】 题解
查看>>
前端笔记-bom
查看>>
上海淮海中路上苹果旗舰店门口欲砸一台IMAC电脑维权
查看>>
给mysql数据库字段值拼接前缀或后缀。 concat()函数
查看>>
迷宫问题
查看>>
练习10-1 使用递归函数计算1到n之和(10 分
查看>>
Oracle MySQL yaSSL 不明细节缓冲区溢出漏洞2
查看>>
zoj 1232 Adventure of Super Mario
查看>>
组合数学 UVa 11538 Chess Queen
查看>>
Redis常用命令
查看>>
thinkphp如何实现伪静态
查看>>
BZOJ 1925: [Sdoi2010]地精部落( dp )
查看>>
一个控制台程序,模拟机器人对话
查看>>
我的PHP学习之路
查看>>