数据管理入门
1.信息的录入和保存
2.数据的整理/清理
3.数据的排列格式变换
4.数据文件的拼接、拆分
5.数据的预处理
变量级别的数据管理——Transform菜单
实例
- 转换-计算变量-目标变量(TS3)-数字表达式(1)
COMPUTE TS3=1.
EXECUTE.
新增TS3变量,令TS3=1
- 转换-计算变量-目标变量(TS3)-数字表达式(2)-如果-在个案满足条件时包括(s3 >= 35 & s3 < 55)
IF (s3 >= 35 & s3 < 55) TS3=2.
EXECUTE.
TS3=2
- 把命令粘贴到语法编辑器-改程序-选中-运行
IF (s3 >= 55) TS3=3.
EXECUTE.
TS3=3
-
验证是否数据正确:分析-描述统计-交叉表
交叉表
RECORD过程
- 转换-重新编码为不同变量-数字变量(S3)-输出变量(TS3a)-变化量-旧值和新值
- 旧值-范围,从最低到值(34.999)-新值(1)-添加
- 旧值-范围(35)到(54.999)-添加
- 旧值-范围,从值到最高(55)-新值(3)
- 所有其他值-系统缺失值-添加
TS3a
RECODE s3 (Lowest thru 34.999=1) (35 thru 54.999=2) (55 thru Highest=3) (ELSE=SYSMIS) INTO TS3a.
EXECUTE.
可视化离散变量
-
转换-可视分箱-要分箱的变量(S3)-继续(fig.1)
fig.1 -
生成分割点-第一个分割点位置(15)-宽度(5)-应用(fig.2)
fig.2 -
生成分割点-基于所扫描个案的相等百分位数-分割点数(9)-应用(fig.3)
fig.3 -
分箱化变量(S3n)
S3n
最优离散化
-
转换-最优分箱-要分箱的变量(S3)-根据下列各项优化分箱(O1)-确定
S3最优分箱
变量的自动重编码
-
转换-自-动重新编码-变量(S3)-新名称(S3n1)-添加新名称
结果输出
S3n1