发布时间:2024-05-04 文章来源:深度系统下载 浏览:
SPSS由IBM公司出品,它提供了包括描述性统计、推断性统计、因子分析、聚类分析、回归分析等多种统计分析功能,并包括文本分析、机器学习算法、数据分析模型等。SPSS的界面友好,易于操作,能够快速从数据中提取有用的洞察和分析,广泛应用于教育、心理、医学、市场、人口、保险等多个研究领域,也用于产品质量控制、人事档案管理和日常统计报表等。 在很多时候将数据库导入SPSS时,里面有一两项数据是缺失的,但我们又需要全部的数据进行分析。这时候再回头找数据源,已经是不现实的了。为了保证数据分析的正常进行,我们可以在SPSS中用自带的功能进行SPSS缺失值补充。 IBM SPSS中有好几种不同的数学公式可以进行缺失值补充,而且可以一次补充多个缺失值。下文我将以一份银行的数据库,用几个步骤来展示这个功能。 1、数据库中缺失值展示 下图是模拟各银行存贷比的数据(图中均为公开数据,仅供本次案例演示),可以看到在北京银行的最后一栏存贷比中有一项数据是缺失的,接下来我们将数据导入IBM SPSS Statistics来进行缺失值补充。
图1:缺失值展示 2、数据导入SPSS 在SPSS的数据界面,点击‘文件’按钮再点击‘打开’按钮,最后点击‘数据’按钮进入到数据打开界面。
图2:进入打开数据界面按钮展示 进入打开数据界面之后,第一步点击‘下拉’按钮,第二步选择自己的数据库类型(图中选择的是Excel),第三步选择文件名,第四步点击‘打开’按钮。
图3:打开数据步骤展示 最终打开后的数据如图4所示。
图4:打开后的数据展示 3、缺失值补充 点击上方菜单栏的‘转换’按钮,再点击下级菜单的‘替换缺失值’。
图5:替换缺失值按钮展示 进入替换缺失值界面后,我们先选中有缺失值的那一栏变量加入到新变量框中。如果有多栏变量有缺失值,我们可以选中多栏变量一起加入新变量框。
图6:缺失变量选择 变量加入之后,我们选择补充缺失值的方法,可以看到有五种数学方法。这里展开说明一下,序列平均值和临近点的平均值还有中间值都类似于数学上的平均值,线性插值和邻近点线性趋势则是将数据进行函数作图,然后用缺失点的函数值进行补充。
图7:缺失值补充方法展示 4、最后结果展示 可以看到在缺失值的右侧生成了一个完全相同的变量栏,并且将缺失的数据补充完整了。
图8:结果展示 数据分析中缺失值的出现是不可避免的,比如一些问卷调查中有些人漏填某一项。再去找到具体的人重新填写也不现实,通过SPSS软件中的缺失值补充这个功能就可以很好的解决这个问题。 世界上许多有影响的报刊杂志就SPSS给予了高度的评价。 |