11.07.2015 Views

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

读 者 可 自 行 练 习 在 例 5.2 数 据 库 中 保 存 强 影 响 点 统 计 量 , 并 判 断 哪 些 记 录 可 能 为 强 影 响 点 。当 检 测 到 数 据 库 中 存 在 强 影 响 点 时 , 可 以 通 过 以 下 途 径 予 以 解 决 :(1) 首 先 考 虑 该 条 记 录 是 否 在 数 据 记 录 、 录 入 时 产 生 的 错 误 。 如 果 是 , 应 予 以 改 正 。 查 不 到原 始 记 录 不 能 予 以 修 正 者 , 应 将 该 条 记 录 删 除 。(2) 考 虑 该 条 记 录 是 否 与 数 据 库 中 其 他 记 录 是 否 分 属 不 同 亚 群 , 如 果 该 条 记 录 与 其 他 记 录明 显 不 同 , 也 可 以 考 虑 将 该 条 记 录 删 除 。(3) 如 果 以 上 两 条 均 不 满 足 , 此 时 不 宜 武 断 地 将 该 条 记 录 删 除 , 而 应 再 次 审 核 散 点 图 矩 阵 ,考 察 所 拟 合 的 模 型 对 于 当 前 数 据 库 是 否 合 适 , 考 虑 拟 合 其 他 形 式 的 模 型 予 以 修 正 。(4) 进 行 稳 健 回 归 (Robust Regression) , 如 加 权 最 小 二 乘 法 。 可 先 应 用 最 小 二 乘 法 做 一 次 普通 最 小 二 乘 法 的 多 重 线 性 回 归 , 并 模 型 残 差 保 存 为 新 变 量 , 然 后 将 残 差 作 为 加 权 变 量 , 进 行 加 权最 小 二 乘 法 回 归 分 析 。(5) 实 际 情 况 允 许 时 可 考 虑 增 加 样 本 含 量 。(6) 进 行 非 参 数 回 归 (Nonparametric Regression) 。5.5.2 多 重 共 线 性 的 识 别 与 处 理多 重 共 线 性 指 自 变 量 问 存 在 线 性 相 关 关 系 , 即 一 个 自 变 量 可 以 用 其 他 一 个 或 几 个 自 变 量 的线 性 表 达 式 进 行 表 示 。 若 存 在 多 重 共 线 性 , 计 算 自 变 量 的 偏 回 归 系 数 B = (X I X) - 1 X IY 时 , 矩 阵(X'X) 不 可 逆 , 导 致 B 存 在 无 穷 多 个 解 或 无 解 。 实 际 运 用 中 多 重 共 线 性 主 要 有 以 下 几 种 类 型 表现 :(1) 整 个 模 型 的 方 差 分 析 检 验 结 果 为 P< α , 但 各 自 变 量 的 偏 回 归 系 数 的 统 计 学 检 验 结 果 却P> α 。(2) 专 业 上 认 为 应 该 有 统 计 学 意 义 的 自 变 量 检 验 结 果 却 无 统 计 学 意 义 。(3) 自 变 量 的 偏 回 归 系 数 取 值 大 小 甚 至 符 号 明 显 与 实 际 情 况 相 违 背 , 难 以 解 释 。(4) 增 加 或 删 除 一 个 自 变 量 或 一 条 记 录 , 自 变 量 偏 回 归 系 数 发 生 较 大 变 化 。以 上 情 况 最 终 使 得 所 得 到 的 线 性 回 归 模 型 , 特 别 是 其 中 的 偏 回 归 系 数 难 以 有 合 乎 专 业 知 识的 解 释 。 对 于 多 重 共 线 性 的 识 别 , 可 以 通 过 Statistics 子 对 话 杠 中 的 Collinearity Diagnostics 复 选杠 予 以 实 现 。 复 选 杠 Collinearity Diagnostics 提 供 以 下 统 计 量 :(1) 容 忍 度 (Tolerance) : 某 自 变 量 的 容 忍 度 等 于 1 减 去 以 该 自 变 量 为 反 应 变 量 , Independentω 杠 中 选 入 的 其 他 自 变 量 为 自 变 量 所 得 到 的 线 性 回 归 模 型 的 决 定 系 数 。 显 然 , 容 忍 度 越 小 , 多重 共 线 性 越 严 重 。 有 学 者 提 出 , 容 忍 度 小 于 0.1 时 , 存 在 严 重 的 多 重 共 线 性 。 从 表 5.14 看 , 可 以认 为 多 重 共 线 性 对 于 例 5. 2 不 是 个 严 重 的 问 题 。(2) 方 差 膨 胀 因 子 (Variance inflation factor, VIF): 等 于 容 忍 度 的 倒 数 。 显 然 , VIF 越 大 , 多重 共 线 性 问 题 越 大 。 一 般 认 为 VIF 不 应 大 于 5 , 对 应 容 忍 度 的 标 准 , 也 可 放 宽 至 不 大 于 10 。(3) 特 征 根 CEigenvalue) : 对 模 型 中 常 数 项 及 所 有 自 变 量 计 算 主 成 分 , 如 果 自 变 量 问 存 在 较强 的 线 性 相 关 关 系 , 则 前 面 的 几 个 主 成 分 数 值 较 大 , 而 后 面 的 几 个 主 成 分 较 小 , 甚 至 接 近 0 。(4) 条 件 指 数 (Condition Index) : 等 于 最 大 的 主 成 分 与 当 前 主 成 分 的 比 值 的 算 术 平 方 根 。 所以 第 一 个 主 成 分 相 对 应 的 条 件 指 数 总 为 1 。 同 样 , 如 果 几 个 条 件 指 数 较 大 ( 如 大 于 30) , 则 提 示存 在 多 重 共 线 性 。• 113 •

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!