数据录入三部曲:
1)定义各变量名称:即给每个变量指标起一个名字;
2)指定每个变量的各种属性:即对每个变量的一些统计特性做出指定;
3)录入数据:把每个变量的取值录入其中。
变量的存储类型
(1)数值型
数值型数据是由0~9阿拉伯数字和其他特殊符号,如美元,逗号,圆点等组成。
(2)字符串
字符型数据默认显示宽度为8个字符位,区分大小写字母,并且不能进行数学运算
(3)日期型
用来表示日期或时间的。可选择不同的显示格式,如yy-mm-dd
可用的数据类型如下:
数值。 值为数字的变量。值以标准数值格式显示。数据编辑器接受以标准格式或科学记数法表示的数值。
逗号。 变量值显示为每三位用逗号分隔,并用句点作为小数分隔符的数值变量。数据编辑器为逗号变量接受带或不带逗号的数值,或以科学记数法表示的数值。值的小数指示符右侧不能包含逗号。
点。 变量值显示为每三位用句点分隔,并带有逗号作为小数分隔符的数值变量。数据编辑器为点变量接受带或不带点的数值,或以科学记数法表示的数值。值的小数指示符右侧不能包含句点。
科学记数法。 一个数值变量,它的值以嵌入的 E 以及带符号的 10 次幂指数形式显示。数据编辑器为此类变量接受带或不带指数的数值。指数前面可以加上带符号(可选)的 E 或 D,或只加上符号 -- 例如,123、1.23E2、1.23D2、1.23E+2 以及 1.23+2。
日期。 一种数值变量,其值以若干种日历-日期或时钟-时间格式中的一种显示。从列表中选择一种格式。输入日期时可以用斜杠、连字符、句号、逗号或空格作为分隔符。两位数年份值的世纪范围由您的“选项”设置确定(从“编辑”菜单中,选择选项然后单击数据选项卡)。
美元。 数值变量,显示时前面带美元符号 ($),每三位用逗号分隔,并用句点作为小数分隔符。可以输入带有或不带有前导美元符号的数据值。
自定义货币。 一种数值变量,其值以自定义货币格式中的一种显示,自定义货币格式是在“选项”对话框的“货币”选项卡中定义的。定义的自定义货币字符不能用于数据输入,但显示在数据编辑器中。
字符串。 字符串变量的值不是数值,因此不用在计算中。字符串值可以包含任何字符,可包含的最大字符数不超过定义的长度。字符串变量区分大小写字母。此类型又称为字母数值变量。
受限数值。 值限于非负整数的变量。在显示值时,填充先导 0 以达到最大变量宽度。可以以科学记数法输入值。
变量的测量尺度
(1)定类尺度
定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。
定类变量的特点是其值仅代表了事物的类别和属性,仅能测定类别差,不能比较各类之间的大小,没有顺序或等级,
如0代表城市,1代表农村
(2)定序变量
定序变量是对事物之间等级或书序差别的一种测度,可以比较优劣或排序,其测量值不代表绝对的数量大小,只能进行排序,不能进行数学运算。
如“学历”分为“硕士、本科、专科…”
(3)定距尺度
定距尺度是对事物类别或次序之间间距的测度。特点是不仅能将事物区分为不同类型并进行排序,还能准确支持类别之间的差距是多少。
如“温度”
(4)定比尺度
定比尺度是能够顾测算两个测度值之间的比值的一种计量尺度。
如“收入”“企业销售额”
变量名和变量值标签
如:1代表男,2代表女,3代表gay
缺失值
缺失属性是一个重要的且容易被忽视的变量属性,它用于定于变量缺失值。
SPSS的缺失值有两种:
1)系统缺失值
如数据漏填了,
对于数值型变量的数据,漏填了用圆点“.”表示,对于字符型的数据,漏填了默认就是空字符串。
2)用户自定义缺失值
如对于选项“不知道/拒绝回答”等用9或99表示
第一个:没有缺失值
第二个:可以自定义三个数值为缺失值
第三个:可以定义一个范围内和一个具体的值为缺失值
注意事项:
1)除非您将其明显定义为缺失,否则所有字符串值包括“零”或空白值都被视为有效。
2)字符串变量的缺失值不得超过八个字节。(字符串变量的宽度定义没有限制,但定义的缺失值不得超过八个字节。)
3)若想将“零”或空白值定义为字符串变量的缺失,则在离散缺失值选项下的字段之一输入一个单空格。
角色
输入。变量将用作输入(例如,预测变量、自变量)。
目标。变量将用作输出或目标(例如,因变量)。
两者。 变量将同时用作输入和输出。
无。变量没有角色分配。
分区。变量将用于将数据划分为单独的训练、检验和验证样本。
拆分。暂不了解
默认情况下,SPSS将为所有变量分配输入角色