进行聚类分析时,可使用的方法有很多,而这些方法的选择往往与变量的类型是有关系的,由于数据的来源及测量方法的不同,变量大致可以分为两类。
(1)定量变量。也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。
(2)定性变量,这些量并非真有数量上的变化,而只有性质上的差异。这些量还可以分为两种,一种是有序变量,它没有数量关系,只有次序关系,如某种产品分为一等品、二等品、三等品等,矿石的质量分为贫矿和富矿,另一种是名义变量,这种变量即无等级关系,也无数量关系,如天气(阴、晴),性别(男、女)、职业(工人、农民、教师、干部)和产品的型号等。