11.07.2015 Views

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

更 新 类 别 中 心 点 。(5) 重 复 步 骤 4 , 直 到 达 到 一 定 的 收 敛 标 准 , 或 者 达 到 分 析 者 事 先 指 定 的 迭 代 次 数 为 止 。由 于 事 先 指 定 了 类 别 数 , 并 且 类 别 数 远 远 小 于 记 录 个 数 , K - Means 聚 类 的 速 度 往 往 要 明 显的 快 于 层 次 聚 类 法 , 这 也 就 是 它 又 称 之 为 快 速 聚 类 法 的 由 来 。 和 层 次 聚 类 法 相 比 , 快 速 聚 类 法 的计 算 量 非 常 小 , 从 而 可 以 有 效 地 处 理 多 变 量 、 大 样 本 数 据 而 不 占 用 太 多 的 内 存 空 间 和 计 算 时 间 ;同 时 在 分 析 时 用 户 可 以 人 为 指 定 初 始 中 心 位 置 , 或 者 将 曾 做 过 的 聚 类 分 析 结 果 作 为 初 始 位 置 引入 分 析 , 这 在 有 前 人 工 作 可 借 鉴 时 是 非 常 有 用 的 。 但 是 , 该 方 法 的 应 用 范 围 比 较 有 限 : 要 求 用 户事 先 知 道 需 要 将 样 品 分 为 多 少 类 、 只 能 对 记 录 进 行 聚 类 而 不 能 对 变 量 聚 类 、 所 使 用 的 变 量 必 须 都是 连 续 性 变 量 。 并 且 对 变 量 的 多 元 正 态 性 、 方 差 齐 性 等 条 件 要 求 较 高 , 如 果 忽 视 这 些 问 题 就 可 能会 导 致 错 误 的 结 果 。12.3.2 分 析 实 例例 12.2 telco. sav 数 据 是 反 映 移 动 电 话 客 户 使 用 于 机 情 况 的 一 个 数 据 集 。 包 含 6 个 变 量 ,分 别 是 客 户 编 号 CCustomer ID) 、 工 作 日 上 班 时 期 电 话 时 长 CPeak mins) 、 工 作 日 下 班 时 期 电 话时 长 COffP eak mins) 、 周 末 电 话 时 长 CWeekend mins) 、 国 际 电 话 时 长 CInternational mins) 、 总通 话 时 长 CTotal mins) 和 平 均 每 次 通 话 时 长 CAverage _ mins) 。 现 希 望 对 移 动 用 户 进 行 细 分 , 以了 解 他 们 不 同 的 手 机 消 费 习 惯 。 根 据 前 期 的 调 研 , 研 究 者 认 为 移 动 用 户 应 当 被 分 为 5个 主 要 群体 , 现 希 望 得 到 相 应 的 定 量 聚 类 结 果 。1. 数 据 的 初 步 分 析这 里 仍 然 应 当 首 先 对 数 据 进 行 描 述 性 统 计 , 结 果 参 见 表 12.60表 12. 6 Descriptive StatisticsN Minimum Maximum Mean Std. Deviation工 作 日 上 班 时 期 电 话 时 长 3395 5.77 2846.40 708.3469 515.25799工 作 日 下 班 时 期 电 话 时 长 3395 3.20 1058.40 30 才 8049 195.33152周 末 电 话 时 长 3395 66 205.00 54.1649 35.26109国 际 电 话 时 长 3395 01 1014.82 172.3492 146.68342总 通 话 时 长 3395 54.81 3423.30 1064.3 才 68 560.80133平 均 每 次 遇 话 时 长 3395 .63 53.58 4.1267 3.80400Valid N (Iistwise) 3395从 表 12.6 中 可 以 看 出 , 尽 管 数 据 的 量 纲 是 一 样 的 , 都 是 反 映 通 话 时 长 的 数 据 , 但 是 数 据 取 值却 仍 然 有 很 大 的 差 异 。 平 均 数 据 从 最 小 的 4. 126 7 ~ 最 大 的 1 064.316 8 , 标 准 差 也 从 3. 804 ~560.801 , 分 布 差 异 较 大 。 为 了 消 除 这 种 差 异 的 影 响 , 仍 然 需 要 考 虑 对 数 据 进 行 标 准 化 处 理 。 在SPSS 中 , 快 速 聚 类 法 并 不 像 层 次 聚 类 法 那 样 , 可 以 自 动 对 数 据 进 行 标 准 化 , 需 要 事 先 对 数 据 进 行标 准 化 , 这 可 以 用 SPSS 中 的 Descriptive 过 程 来 实 现 。2. 操 作 说 明在 SPSS 中 , 实 现 快 速 聚 类 法 的 过 程 步 骤 如 下 :• 248 •

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!