树状图显示每步通过聚类观测值形成的组及其相似性水平。相似性水平沿垂直轴测量(或者,可以显示距离水平),而不同的观测值沿水平轴列出。

解释

使用树状图可查看这些聚类在各步如何形成,并且评估所形成聚类的相似性(或距离)水平。

要查看相似性(或距离)水平,请将鼠标指针放在树状图中的水平线上。相似性或距离值随步骤变化的模式可以帮助您选择数据的最终分组。值发生突变的步骤可能是定义最终分组的合适点。

有关最终分组的决定又称为切割树状图。切割树状图类似于在树状图中画线以指定最终分组。还可以比较不同最终分组的树状图,确定对数据最有意义的最终分组。

此树状图使用 4 个聚类的最终分割而创建,最终分割发生在大约 40 相似性水平处。第一个聚类(最左侧)由 7 个观测值(工作表的行 1、3、6、9、10、11 和 15 中的观测值)组成。第二个聚类(正右方)由 3 个观测值(工作表的行 4、12、19 中的观测值)组成。第三个聚类由 7 个观测值(行 2、14、17、20、18、5 和 8 中的观测值)组成。第四个聚类(最右侧)由 3 个观测值(行 7、13 和 16 中的观测值)组成。如果您切割树状图的高度越高,最终聚类将越少,但相似性水平将降低。如果您切割树状图的高度越低,相似性水平将越高,但最终聚类将越多。

注意

对于一些数据集,平均法、质心法、中位数法和 Ward 法可能不会生成分层树状图。也就是说,合并距离并非总在每步增加。在树状图中,这一步产生的联结向下而不是向上。