11.07.2015 Views

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

【 苗C~,饵" .7. Il ,~ - 世界大学城

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

示 。 因 20.6 Ca) 为 回 归 算 法 估 计 出 的 缺 失 值 和 原 真 实 值 间 的 散 点 图 , 可 见 回 归 算 法 的 估 计 值 明显 偏 低 。 图 20.6 Cb) 为 估 计 值 、 其 余 实 测 值 和 胆 固 醇 间 的 散 点 图 , 可 见 本 例 由 于 样 本 量 很 小 , 填充 后 的 线 性 趋 势 受 到 了 左 下 方 少 数 几 个 离 群 值 的 明 显 影 响 , 导 致 效 果 不 是 太 好 。图 20.6回 归 算 法 的 散 点 图20.3.3 使 用 EM 算 法 进 行 填 充前 面 演 示 了 如 何 使 用 回 归 算 法 进 行 填 充 , 当 数 据 缺 失 比 较 少 , 缺 失 机 制 也 比 较 明 确 时 , 回 归算 法 的 效 果 尚 可 , 但 是 如 果 变 量 间 的 联 系 较 为 复 杂 , 可 能 呈 现 曲 线 联 系 时 , 显 然 使 用 线 性 关 联 的回 归 算 法 将 不 再 合 适 。 除 此 以 外 , 当 数 据 缺 失 较 多 时 , 回 归 算 法 的 效 果 一 般 也 不 佳 。 在 这 些 更 为复 杂 的 情 况 下 , EM 算 法 将 是 更 合 适 的 选 择 。EM 算 法 是 一 种 迭 代 算 法 , 最 初 由 Dempster 等 提 出 , 主 要 用 来 求 后 验 分 布 的 最 大 似 然 估 计值 , 该 算 法 在 缺 失 值 的 估 计 上 非 常 有 效 。 它 的 每 一 次 迭 代 由 两 步 组 成 :E 步 求 出 期 望 CExpectation), M 步 则 将 随 机 参 数 进 行 极 大 化 CMaximization) 。 简 单 地 说 , 未 知 某 个 随 机 变 量 的 值 , 需 要 在Y 和 当 前 模 型 参 数 条 件 下 求 出 其 期 望 值 。 在 运 算 时 就 首 先 给 该 变 量 一 个 初 始 值 , 然 后 求 出 模 型中 的 各 个 参 数 估 计 值 CM 步 )。 随 后 利 用 新 估 计 出 的 模 型 对该 随 机 变 量 值 进 行 估 计 CE 步 ) , 如 此 反 复 迭 代 , 直 至 收 敛 为止 。 根 据 大 量 的 实 践 , 人 们 发 现 EM 算 法 可 以 很 好 地 处 理 大多 数 缺 失 值 问 题 , 是 一 个 非 常 稳 健 的 缺 失 值 填 充 算 法 。图 20. 7 就 是 EM 子 对 话 框 , 用 于 对 EM 算 法 做 进 一 步的 设 置 。 主 要 可 供 选 择 的 是 Distribution 单 选 杠 组 , 用 于 设置 变 量 的 分 布 形 式 , 默 认 为 正 态 分 布 , 可 更 改 为 混 合 正 态分 布 , 或 者 t 分 布 , 后 两 种 情 况 需 要 进 一 步 设 定 相 应 参 数 ,如 混 合 正 态 分 布 中 的 混 合 比 例 、 标 准 差 比 , 以 及 t分 布 中 的自 由 度 。 图 20.7 EM 子 对 话 框• 419 •

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!