11.07.2015 Views

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

在 K - Means 生 成 的 结 果 中 , 最 后 一 个 列 出 的 是 各 个 类 别 中 的 记 录 数 量 。 如 表 12.11 所 示 ,可 见 人 数 最 多 的 是 第 2 类 , 而 最 少 的 是 第 5 类 , 第 一 类 的 人 群 也 较 少 , 各 类 人 数 的 高 低 有 时 可 以为 最 终 类 别 特 性 的 确 定 起 到 辅 助 作 用 。 例 如 , 人 数 最 多 的 那 个 群 体 往 往 就 是 " 人 民 群 众 "。以 上 就 是 全 部 的 输 出 结 果 , 如 果 希 望 分 析 地 更 为 详 细 , 接 下 来 仍 然 可 以 对 标 化 前 的 原 始 变 量进 行 统 计 图 和 统 计 表 的 描 述 , 己 得 到 各 类 差 异 更 清 楚 的 印 象 , 这 些 工 作 读 者 可 自 行 练 习 , 此 处 不再 详 述 。4. 最 终 的 类 别 特 征 描 述结 合 以 上 的 所 有 分 析 结 果 , 最 终 可 以 对 各 个 聚 类 类 别 的 特 征 描 述 如 下 :第 1 类 : 总 通 话 时 间 长 , 工 作 日 上 班 时 间 通 话 比 例 高 用 户 。 此 类 用 户 数 量 为 443 人 。 i 豆 类 客户 的 总 通 话 平 均 时 间 是 各 类 客 户 中 最 高 的 , 并 且 工 作 日 上 班 时 间 通 话 占 总 通 话 比 例 很 高 ( 工 作日 上 班 通 话 平 均 与 全 部 通 话 平 均 之 比 达 到 了 77.69%) , 另 外 , l 豆 类 客 户 国 际 通 话 时 间 也 是 各 类中 最 高 的 。 可 以 叫 做 " 高 端 商 用 客 户 "。第 2 类 : 总 通 话 时 间 短 , 各 时 段 通 话 时 间 都 短 。 此 类 用 户 数 量 为 1239 人 。 i 豆 类 客 户 的 总 通话 平 均 时 间 是 各 类 客 户 中 最 低 的 , 并 且 在 各 个 时 段 通 话 时 间 普 遍 较 短 。 可 以 叫 做 " 少 使 用 低 端客 户 "。第 3 类 : 总 通 话 时 间 居 中 , 工 作 日 上 班 时 间 通 话 比 例 高 用 户 。 此 类 用 户 数 量 为 831 人 。 i 豆 类客 户 最 重 要 的 特 征 是 工 作 日 上 班 时 间 通 话 比 例 高 ( 工 作 日 上 班 通 话 平 均 与 全 部 通 话 平 均 之 比 达到 了 79.01% )。 可 以 叫 做 " 中 端 商 用 客 户 "。第 4 类 : 总 通 话 时 间 居 中 , 工 作 日 下 班 时 间 通 话 比 例 高 用 户 。 此 类 用 户 数 量 为 806 人 。 i 豆 类客 户 工 作 日 下 班 时 间 通 话 比 例 高 ( 工 作 日 下 班 通 话 平 均 与 全 部 通 话 平 均 之 比 达 到 了 47.57%) ,远 高 于 其 他 类 别 同 一 比 例 。 可 以 叫 做 " 中 端 日 常 用 客 户 "。第 5 类 : 每 次 通 话 时 间 长 客 户 。 i 豆 类 用 户 数 量 为 76 人 , 此 类 用 户 数 量 较 少 。 最 大 的 特 征 就是 平 均 每 次 通 话 时 间 特 别 长 , 每 次 通 话 时 长 平 均 达 到 了 其 他 类 别 每 次 通 话 时 长 平 均 的 5 倍 以 上 ,而 其 他 方 面 无 明 显 特 征 。 可 以 叫 做 " 长 聊 客 户 "。12.4 两 步 聚 类 法 简 介12.4.1 方 法 原 理如 前 所 述 , 两 步 聚 类 法 (TwoStep Cluster) 属 于 近 年 来 才 发 展 起 来 的 智 能 聚 类 方 法 的 一 种 , 用于 解 决 海 量 数 据 、 复 杂 类 别 结 构 时 的 聚 类 分 析 问 题 。 准 确 地 讲 , 两 步 聚 类 法 本 身 是 在 1996年 才被 明 确 的 提 出 , 和 前 面 介 绍 的 层 次 聚 类 法 和 快 速 聚 类 法 相 比 , 两 步 聚 类 法 有 着 鲜 明 的 特 点 。 首先 , 用 于 聚 类 的 变 量 可 以 是 连 续 变 量 也 可 以 是 离 散 变 量 , 而 不 必 需 要 像 其 他 算 法 那 样 , 在 进 行 聚类 之 前 对 离 散 变 量 首 先 要 进 行 连 续 化 ; 其 次 , 相 比 其 他 聚 类 算 法 , 两 步 聚 类 法 占 用 内 存 资 源 少 , 对于 大 数 据 量 , 运 算 速 度 较 快 。 而 这 些 特 性 都 是 由 两 步 聚 类 法 的 算 法 原 理 决 定 的 ; 第 二 , 它 是 真 正的 在 利 用 统 计 量 作 为 距 离 指 标 进 行 聚 类 , 同 时 又 可 以 根 据 一 定 的 统 计 标 准 来 " 自 动 地 " 建 议 甚 至于 确 定 最 佳 的 类 别 数 , 结 果 的 正 确 性 更 有 保 障 。 正 是 因 为 该 方 法 有 这 么 多 的 优 点 , 因 此 SPSS才在 1 1. 5 版 中 将 其 引 入 。 而 目 前 在 几 大 主 流 统 计 软 件 中 , 也 只 有 SPSS 能 够 实 现 该 方 法 。• 252 •

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!