11.07.2015 Views

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

图 1 1. 1 主 成 分 分 析 的 原 理 示 意 图新 变 量 , 达 到 了 降 维 的 目 的 。 显 然 , 椭 圆 的 长 短 轴 相 差 得 越 大 , 说 明 两 变 量 间 的 相 关 性 越 强 , 则 降维 也 就 越 有 道 理 。1. 主 成 分 分 析 的 数 学 模 型通 常 数 学 上 的 处 理 是 将 原 来 的 p 个 指 标 作 线 性 组 合 , 作 为 新 的 综 合 指 标 。 如 果 将 选 取 的 第一 个 线 性 组 合 即 第 一 个 综 合 指 标 记 为 F l, 一 般 自 然 希 望 Fl 中 尽 可 能 多 地 反 映 原 来 指 标 的 信 息 ,这 里 的 " 信 息 " 用 什 么 表 示 呢 ? 最 经 典 的 方 法 就 是 用 凹 的 方 差 来 表 达 , 即 Var (F l) 越 大 , 则 表 示Fl 包 含 的 信 息 越 多 。 因 此 在 所 有 的 线 性 组 合 中 所 选 取 的 第 1 主 成 分 应 该 是 方 差 最 大 的 。 如 果第 1 主 成 分 不 足 以 完 全 代 表 原 来 p 个 指 标 的 信 息 , 再 考 虑 选 第 2 个 线 性 组 合 凹 , 即 第 2 主 成 分 ,依 次 类 推 可 以 造 出 第 3 , 第 4 ,…, 第 p 个 主 成 分 。 这 些 主 成 分 间 互 不 相 关 , 且 方 差 递 减 。 在 实 际应 用 中 , 通 常 只 选 前 面 几 个 最 大 的 主 成 分 , 虽 然 这 样 损 失 了 部 分 信 息 , 但 抓 住 了 主 要 矛 盾 , 并 从 原始 变 量 中 进 一 步 提 取 了 某 些 信 息 , 从 而 既 减 少 了 变 量 的 数 目 又 抓 住 了 主 要 矛 盾 , 有 利 于 问 题 的 分析 和 处 理 。假 设 有 n 个 样 本 , 测 得 p 项 指 标 (p < n) 。 得 到 原 始 数 据 资 料 阵 :X= (X 1 ' 孔 ,… , Xp ) , 且 协差 阵 为 .l;, 令 协 差 阵 的 特 征 根 值 为 λl 王 三 九 三 三 … 主 礼 , 所 以 有 Var (F l) 王 三 Var (F2) 王 三 … 主 Var (Fp)王 三 0 , 向 量 1 1 , 1 2 ,… 4 为 相 应 的 单 位 特 征 向 量 , 则 X 的 第 i 个 主 成 分 为 :zz=l;XG=1 , 2,… ,p)实 际 问 题 中 往 往 协 差 阵 z 未 知 , 这 时 可 以 用 其 估 计 值 S( 样 本 协 差 阵 ) 来 代 替 。 同 时 由 于 指标 的 量 纲 不 同 , 所 以 在 计 算 前 往 往 要 消 除 量 纲 的 影 响 , 而 将 原 始 数 据 标 准 化 , 此 时 :S =R =lx'xn因 此 也 可 以 计 算 相 关 阵 , 从 而 得 到 特 征 值 并 进 行 主 成 分 分 析 。 原 则 上 如 果 有 n 个 变 量 , 则 最多 可 以 提 取 出 n 个 主 成 分 , 但 如 果 将 它 们 全 部 提 取 出 来 就 失 去 了 该 方 法 简 化 数 据 的 实 际 意 义 。一 般 是 按 累 计 贡 献 率 的 大 小 取 前 k 个 , 多 数 情 况 下 提 取 出 前 2 ~ 3 个 主 成 分 己 包 含 了 90% 以 上• 214 •

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!