11.07.2015 Views

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

变 量 标 准 化 是 以 变 量 的 平 均 值 和 标 准 差 等 统 计 量 作 为 参 照 来 进 行 的 。 而 如 果 选 择 了 以 记 录 的 平均 数 和 标 准 差 等 统 计 量 作 为 参 照 来 进 行 并 进 行 聚 类 , 就 会 得 到 按 照 数 据 的 取 值 模 式 而 得 到 的 聚类 结 果 。 具 体 在 操 作 上 , 除 对 数 据 进 行 行 列 转 置 外 , 还 可 以 通 过 将 变 量 标 准 化 的 方 法 改 为 按 照 记录 来 进 行 ( 即 在 Transform Values 下 拉 列 表 中 选 择 标 化 方 法 后 , 在 下 方 的 单 选 杠 组 中 选 择 ByCase , 而 不 是 默 认 的 By Variable) , 读 者 朋 友 可 使 用 该 方 法 自 行 对 例 12. 1 进 行 分 析 , 并 比 较 两 种方 法 所 得 结 果 的 异 同 之 处 。2. 对 变 量 的 聚 类以 上 进 行 的 聚 类 过 程 都 是 针 对 记 录 来 进 行 的 聚 类 , 但 是 有 些 时 候 , 针 对 特 定 的 目 的 , 有 可 能也 需 要 对 变 量 进 行 聚 类 , 把 众 多 的 变 量 按 照 相 似 性 进 行 有 效 的 区 分 。 当 然 , 在 学 习 了 上 一 章 的 内容 以 后 , 大 家 应 当 己 经 明 白 , 对 变 量 进 行 相 似 性 区 分 的 方 法 以 因 子 分 析 和 主 成 分 分 析 更 为 合 适 ,而 聚 类 分 析 实 在 是 过 于 粗 糙 了 。 但 是 为 了 使 得 整 个 方 法 体 系 更 为 完 整 , 这 里 还 是 对 变 量 聚 类 的问 题 稍 加 讨 论 一 下 。在 变 量 聚 类 时 , 大 部 分 要 考 虑 的 问 题 是 和 记 录 聚 类 是 完 全 相 同 的 。 只 不 过 可 能 会 涉 及 变 量标 准 化 和 数 据 排 列 方 向 的 问 题 , SPSS 中 可 以 直 接 进 行 变 量 聚 类 , 而 无 须 进 行 数 据 的 转 置 。 在 主对 话 右 侧 有 一 个 Cluster 单 选 杠 组 , 只 要 将 其 切 换 为 Variables , 系 统 就 会 进 行 变 量 聚 类 。变 量 聚 类 中 需 要 专 门 注 意 的 问 题 有 两 点 , 首 先 , 变 量 问 距 离 的 定 义 习 惯 上 使 用 Pearson 相 关系 数 。 在 许 多 情 况 下 使 用 相 关 系 数 可 以 得 到 更 为 合 理 的 结 果 ; 其 次 , 如 果 要 进 行 变 量 的 标 化 , 则默 认 应 当 按 照 By Case 方 向 , 而 不 是 By Variable 方 向 , 当 然 , 如 果 使 用 相 关 系 数 作 为 距 离 测 量 , 则无 须 考 虑 标 化 问 题 。如 果 希 望 在 变 量 聚 类 时 有 尽 量 大 的 自 由 度 , 则 可 以 考 虑 先 进 行 数 据 的 行 列 转 置 , 然 后 按 照 记录 聚 类 的 方 法 来 进 行 分 析 。 毕 竟 相 对 而 言 , 记 录 聚 类 的 选 择 余 地 要 灵 活 得 多 。 而 只 要 操 作 正 确 ,两 者 的 分 析 结 果 是 完 全 相 同 的 。12.3 K- 均 值 聚 类 法12.3.1 方 法 原 理K 一 均 值 聚 类 法 (K - Means Cluster)又 叫 快 速 聚 类 法 , 可 以 用 于 大 量 数 据 进 行 聚 类 分 析 的 情形 。 正 如 在 本 章 开 始 介 绍 的 那 样 , K - Means 聚 类 法 是 一 种 非 分 层 的 聚 类 方 法 , 在 SPSS 中 它 是 按照 如 下 步 骤 来 进 行 的 :(1) 首 先 确 定 需 要 聚 类 的 类 别 数 量 , 这 个 是 由 分 析 者 自 己 指 定 ( 这 也 就 是 K - Means 中 K 的含 义 ) , 在 实 际 分 析 过 程 中 , 往 往 需 要 研 究 者 根 据 问 题 , 反 复 尝 试 把 数 据 分 成 不 同 的 类 别 数 , 并 进行 比 较 , 从 而 找 出 最 优 的 方 案 。(2) 根 据 分 析 者 自 己 指 定 的 聚 类 中 心 , 或 者 由 数 据 本 身 结 构 的 中 心 初 步 确 定 每 个 类 别 的 原始 中 心 点 。(3) 逐 一 计 算 每 一 记 录 到 各 个 类 别 中 心 点 的 距 离 , 把 各 个 记 录 按 照 距 离 最 近 的 原 则 归 入 各个 类 别 , 并 计 算 新 形 成 类 别 的 中 心 点 ( 用 平 均 数 表 示 , 这 也 就 是 K - Means 中 Means 的 含 义 )。(4) 按 照 新 的 中 心 位 置 , 重 新 计 算 每 一 记 录 距 离 新 的 类 别 中 心 点 的 距 离 , 并 重 新 进 行 归 类 ,• 247 •

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!