10.07.2015 Views

Peer to Peer (P2P,对等网络) 综述 - 计信学院网上教学

Peer to Peer (P2P,对等网络) 综述 - 计信学院网上教学

Peer to Peer (P2P,对等网络) 综述 - 计信学院网上教学

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Peer</strong> <strong>to</strong> <strong>Peer</strong> (<strong>P2P</strong>, 对 等 网 络 ) 综 述献 给 对 <strong>P2P</strong> 网 络 感 兴 趣 的 朋 友 们 :<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong> 综 述罗 杰 文中 科 院 计 算 技 术 研 究 所目 录1. <strong>Peer</strong>-To-<strong>Peer</strong> 网 络 介 绍2. <strong>P2P</strong> 网 络 的 拓 扑 结 构 分 类3. <strong>P2P</strong> 搜 索 技 术 研 究 与 挑 战4. <strong>P2P</strong> 应 用 研 究 与 前 景 展 望后 记http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/index.html2006-11-1 11:44:44


<strong>Peer</strong>-To-<strong>Peer</strong>介 绍上 一 页<strong>Peer</strong>-To-<strong>Peer</strong> 综 述下 一 页第 1 章 <strong>Peer</strong>-To-<strong>Peer</strong> 介 绍罗 杰 文中 科 院 计 算 技 术 研 究 所最 近 几 年 ,<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong> ( 对 等 计 算 , 简 称 <strong>P2P</strong>) 迅 速 成 为 计 算 机 界 关 注 的 热 门 话 题 之 一 , 财 富 杂 志 更 将 <strong>P2P</strong> 列 为 影 响 Internet 未 来 的 四 项 科 技 之一 。“<strong>Peer</strong>” 在 英 语 里 有 “ 对 等 者 ” 和 “ 伙 伴 ” 的 意 义 。 因 此 , 从 字 面 上 ,<strong>P2P</strong> 可 以 理 解 为 对 等 互 联 网 。 国 内 的 媒 体 一 般 将 <strong>P2P</strong> 翻 译 成 “ 点 对 点 ” 或 者 “ 端 对端 ”, 学 术 界 则 统 一 称 为 对 等 计 算 。<strong>P2P</strong> 可 以 定 义 为 : 网 络 的 参 与 者 共 享 他 们 所 拥 有 的 一 部 分 硬 件 资 源 ( 处 理 能 力 、 存 储 能 力 、 网 络 连 接 能 力 、打 印 机 等 ), 这 些 共 享 资 源 通 过 网 络 提 供 服 务 和 内 容 , 能 被 其 它 对 等 节 点 (<strong>Peer</strong>) 直 接 访 问 而 无 需 经 过 中 间 实 体 。 在 此 网 络 中 的 参 与 者 既 是 资 源( 服 务 和 内 容 ) 提 供 者 (Server), 又 是 资 源 获 取 者 (Client)。客 观 地 说 , 这 种 计 算 模 式 并 不 是 什 么 新 技 术 , 自 从 上 个 世 纪 70 年 代 网 络 产 生 以 来 就 存 在 了 , 只 不 过 当 时 的 网 络 带 宽 和 传 播 速 度 限 制 了 这 种 计 算 模式 的 发 展 。90 年 代 末 , 随 着 高 速 互 联 网 的 普 及 、 个 人 计 算 机 计 算 和 存 储 能 力 的 提 升 ,<strong>P2P</strong> 技 术 重 新 登 上 历 史 舞 台 并 且 带 来 了 一 场 技 术 上 的 革命 。 许 多 基 于 <strong>P2P</strong> 技 术 的 杀 手 级 应 用 应 运 而 生 , 给 人 们 的 生 活 带 来 了 极 大 的 便 利 。从 计 算 模 式 上 来 说 ,<strong>P2P</strong> 打 破 了 传 统 的 Client/Server (C/S) 模 式 , 在 网 络 中 的 每 个 结 点 的 地 位 都 是 对 等 的 。 每 个 结 点 既 充 当 服 务 器 , 为 其 他 结 点提 供 服 务 , 同 时 也 享 用 其 他 结 点 提 供 的 服 务 。<strong>P2P</strong> 与 C/S 模 式 的 对 比 如 下 图 所 示 :http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch01.html( 第 1/5 页 )2006-11-1 11:45:16


<strong>Peer</strong>-To-<strong>Peer</strong>介 绍图 1 Client/Server 模 式图 2 <strong>Peer</strong> <strong>to</strong> <strong>Peer</strong> 模 式http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch01.html( 第 2/5 页 )2006-11-1 11:45:16


<strong>Peer</strong>-To-<strong>Peer</strong>介 绍<strong>P2P</strong> 技 术 的 特 点 体 现 在 以 下 几 个 方 面 [1]:●非 中 心 化 : 网 络 中 的 资 源 和 服 务 分 散 在 所 有 结 点 上 , 信 息 的 传 输 和 服 务 的 实 现 都 直 接 在 结 点 之 间 进 行 , 可 以 无 需 中 间 环 节 和 服 务 器 的 介入 , 避 免 了 可 能 的 瓶 颈 。<strong>P2P</strong> 的 非 中 心 化 基 本 特 点 , 带 来 了 其 在 可 扩 展 性 、 健 壮 性 等 方 面 的 优 势 。●可 扩 展 性 : 在 <strong>P2P</strong> 网 络 中 , 随 着 用 户 的 加 入 , 不 仅 服 务 的 需 求 增 加 了 , 系 统 整 体 的 资 源 和 服 务 能 力 也 在 同 步 地 扩 充 , 始 终 能 比 较 容 易 地 满足 用 户 的 需 要 。 理 论 上 其 可 扩 展 性 几 乎 可 以 认 为 是 无 限 的 。 例 如 : 在 传 统 的 通 过 FTP 的 文 件 下 载 方 式 中 , 当 下 载 用 户 增 加 之 后 , 下 载 速 度会 变 得 越 来 越 慢 , 然 而 <strong>P2P</strong> 网 络 正 好 相 反 , 加 入 的 用 户 越 多 ,<strong>P2P</strong> 网 络 中 提 供 的 资 源 就 越 多 , 下 载 的 速 度 反 而 越 快 。●健 壮 性 :<strong>P2P</strong> 架 构 天 生 具 有 耐 攻 击 、 高 容 错 的 优 点 。 由 于 服 务 是 分 散 在 各 个 结 点 之 间 进 行 的 , 部 分 结 点 或 网 络 遭 到 破 坏 对 其 它 部 分 的 影 响很 小 。<strong>P2P</strong> 网 络 一 般 在 部 分 结 点 失 效 时 能 够 自 动 调 整 整 体 拓 扑 , 保 持 其 它 结 点 的 连 通 性 。<strong>P2P</strong> 网 络 通 常 都 是 以 自 组 织 的 方 式 建 立 起 来 的 ,并 允 许 结 点 自 由 地 加 入 和 离 开 。●高 性 价 比 : 性 能 优 势 是 <strong>P2P</strong> 被 广 泛 关 注 的 一 个 重 要 原 因 。 随 着 硬 件 技 术 的 发 展 , 个 人 计 算 机 的 计 算 和 存 储 能 力 以 及 网 络 带 宽 等 性 能 依 照 摩尔 定 理 高 速 增 长 。 采 用 <strong>P2P</strong> 架 构 可 以 有 效 地 利 用 互 联 网 中 散 布 的 大 量 普 通 结 点 , 将 计 算 任 务 或 存 储 资 料 分 布 到 所 有 结 点 上 。 利 用 其 中 闲 置的 计 算 能 力 或 存 储 空 间 , 达 到 高 性 能 计 算 和 海 量 存 储 的 目 的 。 目 前 ,<strong>P2P</strong> 在 这 方 面 的 应 用 多 在 学 术 研 究 方 面 , 一 旦 技 术 成 熟 , 能 够 在 工 业领 域 推 广 , 则 可 以 为 许 多 企 业 节 省 购 买 大 型 服 务 器 的 成 本 。●隐 私 保 护 : 在 <strong>P2P</strong> 网 络 中 , 由 于 信 息 的 传 输 分 散 在 各 节 点 之 间 进 行 而 无 需 经 过 某 个 集 中 环 节 , 用 户 的 隐 私 信 息 被 窃 听 和 泄 漏 的 可 能 性 大 大缩 小 。 此 外 , 目 前 解 决 Internet 隐 私 问 题 主 要 采 用 中 继 转 发 的 技 术 方 法 , 从 而 将 通 信 的 参 与 者 隐 藏 在 众 多 的 网 络 实 体 之 中 。 在 传 统 的 一 些匿 名 通 信 系 统 中 , 实 现 这 一 机 制 依 赖 于 某 些 中 继 服 务 器 节 点 。 而 在 <strong>P2P</strong> 中 , 所 有 参 与 者 都 可 以 提 供 中 继 转 发 的 功 能 , 因 而 大 大 提 高 了 匿 名通 讯 的 灵 活 性 和 可 靠 性 , 能 够 为 用 户 提 供 更 好 的 隐 私 保 护 。●负 载 均 衡 : <strong>P2P</strong> 网 络 环 境 下 由 于 每 个 节 点 既 是 服 务 器 又 是 客 户 机 , 减 少 了 对 传 统 C/S 结 构 服 务 器 计 算 能 力 、 存 储 能 力 的 要 求 , 同 时 因 为 资源 分 布 在 多 个 节 点 , 更 好 的 实 现 了 整 个 网 络 的 负 载 均 衡 。与 传 统 的 分 布 式 系 统 相 比 ,<strong>P2P</strong> 技 术 具 有 无 可 比 拟 的 优 势 。 同 时 ,<strong>P2P</strong> 技 术 具 有 广 阔 的 应 用 前 景 。 目 前 ,Internet 上 各 种 <strong>P2P</strong> 应 用 软 件 层 出 不穷 , 用 户 数 量 急 剧 增 加 。 据 统 计 , 自 2001 年 以 来 , 大 量 <strong>P2P</strong> 软 件 的 用 户 使 用 数 量 从 几 十 万 、 几 百 万 到 上 千 万 急 剧 增 加 , 给 Internet 带 宽 带 来 巨 大冲 击 。 如 图 3 所 示 , 在 全 球 最 大 的 开 源 网 站 Sourceforge[2] 的 下 载 排 名 中 , 前 十 名 中 有 七 个 项 目 是 基 于 <strong>P2P</strong> 技 术 。 其 中 eMule 的 下 载 量 超 过 2 亿次 ,Azureus 的 下 载 量 超 过 1 亿 次 。 这 个 网 站 上 的 工 程 项 目 下 载 量 , 往 往 反 映 当 今 软 件 技 术 的 前 沿 热 点 。 令 人 瞩 目 的 是 , 微 软 公 司 在 新 一 代 操 作http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch01.html( 第 3/5 页 )2006-11-1 11:45:16


<strong>Peer</strong>-To-<strong>Peer</strong>介 绍系 统 Windows Vista 中 也 加 入 了 <strong>P2P</strong> 技 术 以 用 来 加 强 协 作 和 应 用 程 序 之 间 的 通 讯 [3]。图 3 Sourceforge 的 工 程 下 载 排 名 ( 数 据 截 止 到 2006 年 8 月 23 日 )目 前 ,<strong>P2P</strong> 计 算 技 术 正 不 断 应 用 到 军 事 领 域 , 商 业 领 域 , 政 府 信 息 , 通 讯 等 领 域 。 根 据 具 体 应 用 不 同 , 可 以 把 <strong>P2P</strong> 分 为 大 致 以 下 这 些 类 型 :● 文 件 内 容 共 享 和 下 载 , 例 如 Napster、Gnutella、eDonkey、eMule、Maze、BT 等 ;● 计 算 能 力 和 存 储 共 享 , 例 如 SETI@home、Avaki、Popular Power 等 ;● 基 于 <strong>P2P</strong> 技 术 的 协 同 与 服 务 共 享 平 台 , 例 如 JXTA、Magi、Groove 等 ;● 即 时 通 讯 工 具 , 包 括 ICQ、QQ、Yahoo Messenger、MSN Messenger 等 ;● <strong>P2P</strong> 通 讯 与 信 息 共 享 , 例 如 Skype、Crowds、Onion Routing 等 ;● 基 于 <strong>P2P</strong> 技 术 的 网 络 电 视 : 沸 点 、PPStream、 PPLive、 QQLive、 SopCast 等 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch01.html( 第 4/5 页 )2006-11-1 11:45:16


<strong>P2P</strong> 网 络 的 拓 扑 结 构连 到 文 件 的 所 有 者 传 输 文 件 。Napster 首 先 实 现 了 文 件 查 询 与 文 件 传 输 的 分 离 , 有 效 地 节 省了 中 央 服 务 器 的 带 宽 消 耗 , 减 少 了 系 统 的 文 件 传 输 延 时 。图 1 Napster 的 拓 扑 结 构然 而 , 这 种 对 等 网 络 模 型 存 在 以 下 这 些 问 题 :● 中 央 索 引 服 务 器 的 瘫 痪 容 易 导 致 整 个 网 络 的 崩 溃 , 因 此 可 靠 性 和 安 全 性 较 低 。●随 着 网 络 规 模 的 扩 大 , 对 中 央 索 引 服 务 器 进 行 维 护 和 更 新 的 费 用 将 急 剧 增 加 , 所 需 成本 较 高 。● 中 央 索 引 服 务 器 的 存 在 常 引 起 版 权 问 题 上 的 纠 纷 , 服 务 提 供 商 容 易 被 追 究 法 律 责 任 。综 合 上 述 优 缺 点 , 对 小 型 网 络 而 言 , 中 心 化 拓 扑 模 型 在 管 理 和 控 制 方 面 占 一 定 优 势 。 但 鉴 于其 存 在 的 上 述 缺 陷 , 该 模 型 并 不 适 合 大 型 网 络 应 用 。全 分 布 式 非 结 构 化 拓 扑 的 <strong>P2P</strong> 网 络 是 在 重 叠 网 络 (Overlay Network)( 见 标 注 1) 采 用 了 随 机图 的 组 织 方 式 , 结 点 度 数 服 从 Power-law 规 律 ( 幂 次 法 则 )[2], 从 而 能 够 较 快 发 现 目 的 结点 , 面 对 网 络 的 动 态 变 化 体 现 了 较 好 的 容 错 能 力 , 因 此 具 有 较 好 的 可 用 性 。 同 时 可 以 支 持 复http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch02.html( 第 2/9 页 )2006-11-1 11:45


<strong>P2P</strong> 网 络 的 拓 扑 结 构杂 查 询 , 如 带 有 规 则 表 达 式 的 多 关 键 词 查 询 , 模 糊 查 询 等 , 采 用 这 种 拓 扑 结 构 最 典 型 的 案 例便 是 Gnutella( 音 译 : 纽 特 拉 )。 准 确 地 说 ,Gnutella 不 是 特 指 某 一 款 软 件 , 而 是 指 遵 守Gnutella 协 议 [3] 的 网 络 以 及 客 户 端 软 件 的 统 称 。 目 前 基 于 Gnutella 网 络 的 客 户 端 软 件 非 常多 , 著 名 的 有 Shareaza、LimeWire 和 BearShare 等 。图 2Gnutella 的 拓 扑 结 构 和 文 件 检 索 方 法Gnutella 和 Napster 最 大 的 区 别 在 于 Gnutella 是 更 加 纯 粹 的 <strong>P2P</strong> 系 统 , 因 为 它 没 有 中 央 索 引 服务 器 , 每 台 机 器 在 Gnutella 网 络 中 是 真 正 的 对 等 关 系 , 既 是 客 户 机 同 时 又 是 服 务 器 , 所 以 被称 为 对 等 机 (Servent,Server+Client 的 组 合 )。 在 文 件 检 索 方 面 , 它 与 Napster 也 不 相 同 。 在Gnutella 网 络 的 发 展 初 期 , 它 主 要 采 用 基 于 完 全 随 机 图 的 Flooding 搜 索 算 法 。 图 2 显 示 了Flooding 的 工 作 流 程 : 当 一 台 计 算 机 要 下 载 一 个 文 件 , 它 首 先 以 文 件 名 或 者 关 键 字 生 成 一 个查 询 , 并 把 这 个 查 询 发 送 给 与 它 相 连 的 所 有 计 算 机 , 这 些 计 算 机 如 果 存 在 这 个 文 件 , 则 与 查询 的 机 器 建 立 连 接 , 如 果 不 存 在 这 个 文 件 , 则 继 续 在 自 己 相 邻 的 计 算 机 之 间 转 发 这 个 查 询 ,直 到 找 到 文 件 为 止 。 为 了 控 制 搜 索 消 息 不 至 于 永 远 这 样 传 递 下 去 , 一 般 通 过 TTL (Time ToLive) 的 减 值 来 控 制 查 询 的 深 度 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch02.html( 第 3/9 页 )2006-11-1 11:45


<strong>P2P</strong> 网 络 的 拓 扑 结 构但 是 , 随 着 联 网 节 点 的 不 断 增 多 , 网 络 规 模 不 断 扩 大 , 通 过 这 种 Flooding 方 式 定 位 对 等 点 的方 法 将 造 成 网 络 流 量 急 剧 增 加 , 从 而 导 致 网 络 中 部 分 低 带 宽 节 点 因 网 络 资 源 过 载 而 失 效 。 所以 在 初 期 的 Gnutella 网 络 中 , 存 在 比 较 严 重 的 分 区 , 断 链 现 象 。 也 就 是 说 , 一 个 查 询 访 问 只能 在 网 络 的 很 小 一 部 分 进 行 , 因 此 网 络 的 可 扩 展 性 不 好 。 所 以 , 后 来 许 多 研 究 人 员 在Flooding 的 基 础 上 作 了 许 多 改 进 , 例 如 采 用 Random work [4]、Dynamic Query[5] 等 方 法 。由 于 非 结 构 化 网 络 将 重 叠 网 络 认 为 是 一 个 完 全 随 机 图 , 结 点 之 间 的 链 路 没 有 遵 循 某 些 预 先 定义 的 拓 扑 来 构 建 。 这 些 系 统 一 般 不 提 供 性 能 保 证 , 但 容 错 性 好 , 支 持 复 杂 的 查 询 , 并 受 结 点频 繁 加 入 和 退 出 系 统 的 影 响 小 。 但 是 查 询 的 结 果 可 能 不 完 全 , 查 询 速 度 较 慢 , 采 用 Flooding查 询 的 系 统 对 网 络 带 宽 的 消 耗 非 常 大 , 并 由 此 带 来 可 扩 展 性 差 等 问 题 。全 分 布 式 结 构 化 拓 扑 的 <strong>P2P</strong> 网 络 主 要 是 采 用 分 布 式 散 列 表 (Distributed Hash Table, 简 写 成DHT) 技 术 来 组 织 网 络 中 的 结 点 。DHT 是 一 个 由 广 域 范 围 大 量 结 点 共 同 维 护 的 巨 大 散 列 表 。散 列 表 被 分 割 成 不 连 续 的 块 , 每 个 结 点 被 分 配 给 一 个 属 于 自 己 的 散 列 块 , 并 成 为 这 个 散 列 块的 管 理 者 。 通 过 加 密 散 列 函 数 , 一 个 对 象 的 名 字 或 关 键 词 被 映 射 为 128 位 或 160 位 的 散 列 值 。分 布 式 散 列 表 起 源 于 SDDS(Scalable Distribute Data Structures)[6] 研 究 ,Gribble 等 实 现了 一 个 高 度 可 扩 展 , 容 错 的 SDDS 集 群 。DHT 类 结 构 能 够 自 适 应 结 点 的 动 态 加 入 / 退 出 , 有 着良 好 的 可 扩 展 性 、 鲁 棒 性 、 结 点 ID 分 配 的 均 匀 性 和 自 组 织 能 力 。 由 于 重 叠 网 络 采 用 了 确 定 性拓 扑 结 构 ,DHT 可 以 提 供 精 确 的 发 现 。 只 要 目 的 结 点 存 在 于 网 络 中 DHT 总 能 发 现 它 , 发 现 的准 确 性 得 到 了 保 证 , 最 经 典 的 案 例 是 Tapestry,Pastry,Chord 和 CAN。Tapestry [7] 提 供 了 一 个 分 布 式 容 错 查 找 和 路 由 基 础 平 台 , 在 此 平 台 基 础 之 上 , 可 以 开 发 各种 <strong>P2P</strong> 应 用 (OceanS<strong>to</strong>re[8] 即 是 此 平 台 上 的 一 个 应 用 )。Tapestry 的 思 想 来 源 于 Plax<strong>to</strong>n。 在Plax<strong>to</strong>n 中 , 结 点 使 用 自 己 所 知 道 的 邻 近 结 点 表 , 按 照 目 的 ID 来 逐 步 传 递 消 息 。Tapestry 基 于Plax<strong>to</strong>n 的 思 想 , 加 入 了 容 错 机 制 , 从 而 可 适 应 <strong>P2P</strong> 的 动 态 变 化 的 特 点 。OceanS<strong>to</strong>re 是 以Tapestry 为 路 由 和 查 找 基 础 设 施 的 <strong>P2P</strong> 平 台 。 它 是 一 个 适 合 于 全 球 数 据 存 储 的 <strong>P2P</strong> 应 用 系统 。 任 何 用 户 均 可 以 加 入 OceanS<strong>to</strong>re 系 统 , 或 者 共 享 自 己 的 存 储 空 间 , 或 者 使 用 该 系 统 中 的资 源 。 通 过 使 用 复 制 和 缓 存 技 术 ,OceanS<strong>to</strong>re 可 提 高 查 找 的 效 率 。 最 近 ,Tapestry 为 适 应http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch02.html( 第 4/9 页 )2006-11-1 11:45


<strong>P2P</strong> 网 络 的 拓 扑 结 构<strong>P2P</strong> 网 络 的 动 态 特 性 , 作 了 很 多 改 进 , 增 加 了 额 外 的 机 制 实 现 了 网 络 的 软 状 态 (softstate), 并 提 供 了 自 组 织 、 鲁 棒 性 、 可 扩 展 性 和 动 态 适 应 性 , 当 网 络 高 负 载 且 有 失 效 结 点 时候 性 能 有 限 降 低 , 消 除 了 对 全 局 信 息 的 依 赖 、 根 结 点 易 失 效 和 弹 性 差 的 问 题 。Pastry 是 微 软 研 究 院 提 出 的 可 扩 展 的 分 布 式 对 象 定 位 和 路 由 协 议 , 可 用 于 构 建 大 规 模 的 <strong>P2P</strong>系 统 。 如 图 3 所 示 , 在 Pastry 中 , 每 个 结 点 分 配 一 个 128 位 的 结 点 标 识 符 号 (nodeID) , 所 有的 结 点 标 识 符 形 成 了 一 个 环 形 的 nodeID 空 间 , 范 围 从 0 到 2128 - 1 , 结 点 加 入 系 统 时 通 过 散列 结 点 IP 地 址 在 128 位 nodeID 空 间 中 随 机 分 配 。 网 络 结 点 的 加 入 与 退 出 , 资 源 查 询 的 过 程 可以 参 考 文 献 [9]。图 3Pastry 的 消 息 路 由Chord [10] 项 目 诞 生 于 美 国 的 麻 省 理 工 学 院 。 它 的 目 标 是 提 供 一 个 适 合 于 <strong>P2P</strong> 环 境 的 分 布 式资 源 发 现 服 务 , 它 通 过 使 用 DHT 技 术 使 得 发 现 指 定 对 象 只 需 要 维 护 O(logN) 长 度 的 路 由 表 。在 DHT 技 术 中 , 网 络 结 点 按 照 一 定 的 方 式 分 配 一 个 唯 一 结 点 标 识 符 (Node ID) , 资 源 对 象 通过 散 列 运 算 产 生 一 个 唯 一 的 资 源 标 识 符 (Object ID) , 且 该 资 源 将 存 储 在 结 点 ID 与 之 相 等 或 者相 近 的 结 点 上 。 需 要 查 找 该 资 源 时 , 采 用 同 样 的 方 法 可 定 位 到 存 储 该 资 源 的 结 点 。 因 此 ,http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch02.html( 第 5/9 页 )2006-11-1 11:45


<strong>P2P</strong> 网 络 的 拓 扑 结 构Chord 的 主 要 贡 献 是 提 出 了 一 个 分 布 式 查 找 协 议 , 该 协 议 可 将 指 定 的 关 键 字 (Key) 映 射 到 对 应的 结 点 (Node) 。 从 算 法 来 看 ,Chord 是 相 容 散 列 算 法 的 变 体 。图 4 Chord 的 拓 扑 形 状CAN(Content Addressable Networks)[11] 项 目 采 用 多 维 的 标 识 符 空 间 来 实 现 分 布 式 散 列 算法 。CAN 将 所 有 结 点 映 射 到 一 个 n 维 的 笛 卡 尔 空 间 中 , 并 为 每 个 结 点 尽 可 能 均 匀 的 分 配 一 块区 域 。CAN 采 用 的 散 列 函 数 通 过 对 (key, value) 对 中 的 key 进 行 散 列 运 算 , 得 到 笛 卡 尔 空 间 中的 一 个 点 , 并 将 (key, value) 对 存 储 在 拥 有 该 点 所 在 区 域 的 结 点 内 。CAN 采 用 的 路 由 算 法 相当 直 接 和 简 单 , 知 道 目 标 点 的 坐 标 后 , 就 将 请 求 传 给 当 前 结 点 四 邻 中 坐 标 最 接 近 目 标 点 的 结点 。CAN 是 一 个 具 有 良 好 可 扩 展 性 的 系 统 , 给 定 N 个 结 点 , 系 统 维 数 为 d, 则 路 由 路 径 长 度 为O(n1/d) , 每 结 点 维 护 的 路 由 表 信 息 和 网 络 规 模 无 关 为 O(d) 。上 述 四 种 基 于 DHT 的 <strong>P2P</strong> 系 统 的 性 能 比 较 可 以 参 照 [12]。DHT 这 类 结 构 最 大 的 问 题 是 DHT 的维 护 机 制 较 为 复 杂 , 尤 其 是 结 点 频 繁 加 入 退 出 造 成 的 网 络 波 动 (Churn) 会 极 大 增 加 DHT 的维 护 代 价 。DHT 所 面 临 的 另 外 一 个 问 题 是 DHT 仅 支 持 精 确 关 键 词 匹 配 查 询 , 无 法 支 持 内 容 / 语义 等 复 杂 查 询 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch02.html( 第 6/9 页 )2006-11-1 11:45


<strong>P2P</strong> 网 络 的 拓 扑 结 构半 分 布 式 拓 扑 结 构 ( 有 的 文 献 亦 称 作 混 杂 模 式 , 英 文 表 达 为 Hybrid Structure) 吸 取 了 中 心 化结 构 和 全 分 布 式 非 结 构 化 拓 扑 的 优 点 , 选 择 性 能 较 高 ( 处 理 、 存 储 、 带 宽 等 方 面 性 能 ) 的 结点 作 为 超 级 结 点 ( 英 文 表 达 为 SuperNodes 或 者 Hubs), 在 各 个 超 级 结 点 上 存 储 了 系 统 中 其他 部 分 结 点 的 信 息 , 发 现 算 法 仅 在 超 级 结 点 之 间 转 发 , 超 级 结 点 再 将 查 询 请 求 转 发 给 适 当 的叶 子 结 点 。 半 分 布 式 结 构 也 是 一 个 层 次 式 结 构 , 超 级 结 点 之 间 构 成 一 个 高 速 转 发 层 , 超 级 结点 和 所 负 责 的 普 通 结 点 构 成 若 干 层 次 。 采 用 这 种 结 构 的 最 典 型 的 案 例 就 是 KaZaa。图 5 半 分 布 式 拓 扑 结 构 ( 网 络 中 包 含 Super Node)KaZaa 是 当 前 世 界 最 流 行 的 几 款 <strong>P2P</strong> 文 件 共 享 软 件 之 一 。 根 据 CA 公 司 统 计 , 全 球 KaZaa 的 下载 量 超 过 2.5 亿 次 。 使 用 KaZaa 软 件 进 行 文 件 传 输 消 耗 了 互 联 网 40% 的 带 宽 。 之 所 以 它 如 此 的成 功 , 是 因 为 它 结 合 了 Napster 和 Gnutella 共 同 的 优 点 。 从 结 构 上 来 说 , 它 使 用 了 Gnutella 的全 分 布 式 的 结 构 , 这 样 可 以 是 系 统 更 好 的 扩 展 , 因 为 它 无 需 中 央 索 引 服 务 器 存 储 文 件 名 , 它是 自 动 的 把 性 能 好 的 机 器 成 为 SuperNode, 它 存 储 着 离 它 最 近 的 叶 子 节 点 的 文 件 信 息 , 这 些SuperNode, 再 连 通 起 来 形 成 一 个 Overlay Network. 由 于 SuperNode 的 索 引 功 能 , 使 搜 索 效 率大 大 提 高 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch02.html( 第 7/9 页 )2006-11-1 11:45


<strong>P2P</strong> 网 络 的 拓 扑 结 构图 6 KaZaa 的 软 件 界 面半 分 布 式 结 构 的 优 点 是 性 能 、 可 扩 展 性 较 好 , 较 容 易 管 理 , 但 对 超 级 点 依 赖 性 大 , 易 于 受 到攻 击 , 容 错 性 也 受 到 影 响 。在 实 际 应 用 中 , 每 种 拓 扑 结 构 的 <strong>P2P</strong> 网 络 都 有 其 优 缺 点 , 下 表 从 可 扩 展 性 、 可 靠 性 、 可 维 护性 、 发 现 算 法 的 效 率 、 复 杂 查 询 等 方 面 比 较 了 这 四 种 拓 扑 结 构 的 综 合 性 能 。比 较 标 准 / 拓 扑 结 构 中 心 化 拓 扑 全 分 布 式 非 结 构化 拓 扑全 分 布 式 结 构化 拓 扑半 分 布 式拓 扑可 扩 展 性 差 差 好 中可 靠 性 差 好 好 中可 维 护 性 最 好 最 好 好 中发 现 算 法 效 率 最 高 中 高 中复 杂 查 询 支 持 支 持 不 支 持 支 持参 考 文 献 :http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch02.html( 第 8/9 页 )2006-11-1 11:45


<strong>P2P</strong> 网 络 的 拓 扑 结 构●●Napster 官 方 网 站 http://www.napster.com/Matei Ripeanu et.al.Mapping the Gnutella Network: Properties of Large-Scale <strong>Peer</strong><strong>to</strong>-<strong>Peer</strong>Systems and Implications for System Design●Gnutella 协 议 http://www9.limewire.com/developer/gnutella_pro<strong>to</strong>col_0.4.pdf● C. Gkantsidis, et.al,Random Walks in <strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong> Networks, INFOCOM 2004●Dynamic Query 协 议 http://www.the-gdf.org/index.php?title=Dynamic_Querying●SDDS 介 绍 http://www.usenix.org/events/osdi00/full_papers/gribble/gribble_html/dds.html●Tapestry 工 程 http://p2p.cs.ucsb.edu/chimera/●OceanS<strong>to</strong>re 工 程 http://oceans<strong>to</strong>re.cs.berkeley.edu/info/overview.html●Pastry 工 程 http://research.microsoft.com/~antr/PAST/pastry.pdf●Chord 工 程 http://pdos.csail.mit.edu/chord/●●Sylvia Ratnasamy. 博 士 论 文 http://www.icir.org/sylvia/Fox Harrell et.al.Survey of Locating & Routing in <strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong> Systems( 标 注 1)Several connected hosts using the same communication pro<strong>to</strong>col are forming anoverlay network that uses an underlying physical network infrastructure.http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch02.html( 第 9/9 页 )2006-11-1 11:45


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战上 一 页<strong>Peer</strong>- <strong>to</strong>- <strong>Peer</strong> 综 述下 一 页第 3 章 <strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战随 着 <strong>P2P</strong> 应 用 的 蓬 勃 发 展 , 作 为 <strong>P2P</strong> 应 用 中 核 心 问 题 的 搜 索 技 术 备 受 关 注 。 本 文 将介 绍 主 要 的 <strong>P2P</strong> 搜 索 技 术 以 及 对 搜 索 技 术 产 生 影 响 的 一 些 因 素 和 挑 战 。一 、DHT 网 络 ( 结 构 化 <strong>P2P</strong> 网 络 ) 的 搜 索 技 术1. 网 络 链 路 长 度 与 度 的 关 系基 于 分 布 式 Hash 表 的 <strong>P2P</strong> 系 统 包 括 CAN, Pastry, Tapestry ,Chord 等 , 它 们 的 路 由 和查 询 方 法 前 面 已 经 作 介 绍 , 这 里 不 再 赘 述 。 这 些 系 统 建 立 在 确 定 性 拓 扑 结 构 的 基 础上 , 从 而 表 现 出 对 网 络 中 路 由 的 指 导 性 和 网 络 中 结 点 与 数 据 管 理 的 较 强 控 制 力 。 但是 , 对 确 定 性 结 构 的 认 识 又 限 制 了 搜 索 算 法 效 率 的 提 升 。 研 究 分 析 了 目 前 基 于 DHT的 搜 索 算 法 , 发 现 衡 量 搜 索 算 法 的 两 个 重 要 参 数 度 数 ( 表 示 节 点 的 邻 居 关 系 数 ) 和链 路 长 度 ( 搜 索 算 法 的 平 均 路 径 长 度 ) 之 间 存 在 渐 进 曲 线 的 关 系 , 如 图 1 所 示 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 1/10 页 )2006-11-


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战图 1 度 数 和 直 径 之 间 的 渐 进 曲 线 关 系在 N 个 结 点 网 络 中 , 图 中 直 观 显 示 出 当 度 数 为 N 时 , 搜 索 算 法 的 直 径 为 O(1); 当 每 个结 点 仅 维 护 一 个 邻 居 时 , 搜 索 算 法 的 直 径 为 O(N)。 这 是 度 数 和 直 径 关 系 的 两 种 极 端情 况 。 同 时 , 研 究 分 析 了 O(d) 的 度 和 O(d) 的 直 径 的 算 法 是 不 可 能 的 。从 渐 进 曲 线 关 系 可 以 看 出 , 如 果 想 获 得 更 短 的 路 径 长 度 , 必 然 导 致 度 数 的 增 加 ; 而网 络 实 际 连 接 状 态 的 变 化 造 成 大 度 数 邻 居 关 系 的 维 护 复 杂 程 度 增 加 。 另 外 , 研 究 者证 明 O(logN) 甚 至 O(logN/loglogN) 的 平 均 路 径 长 度 也 不 能 满 足 状 态 变 化 剧 烈 的 网 络应 用 的 需 求 。 新 的 搜 索 算 法 受 到 这 种 折 衷 关 系 制 约 的 根 本 原 因 在 于 DHT 对 网 络 拓 扑结 构 的 确 定 性 认 识 。2. 语 义 查 询 和 DHT 的 矛 盾现 有 DHT 算 法 由 于 采 用 分 布 式 散 列 函 数 , 所 以 只 适 合 于 准 确 的 查 找 , 如 果 要 支 持目 前 Web 上 搜 索 引 擎 具 有 的 多 关 键 字 查 找 的 功 能 , 还 要 引 入 新 的 方 法 。 主 要 的 原 因在 于 DHT 的 工 作 方 式 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 2/10 页 )2006-11-


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战基 于 DHT 的 <strong>P2P</strong> 系 统 采 用 相 容 散 列 函 数 根 据 精 确 关 键 词 进 行 对 象 的 定 位 与 发 现 。散 列 函 数 总 是 试 图 保 证 生 成 的 散 列 值 均 匀 随 机 分 布 , 结 果 两 个 内 容 相 似 度 很 高 但 不完 全 相 同 的 对 象 被 生 成 了 完 全 不 同 的 散 列 值 , 存 放 到 了 完 全 随 机 的 两 个 结 点 上 。 因此 ,DHT 可 以 提 供 精 确 匹 配 查 询 , 但 是 支 持 语 义 是 非 常 困 难 的 。目 前 在 DHT 基 础 上 开 展 带 有 语 义 的 资 源 管 理 技 术 的 研 究 还 非 常 少 。 由 于 DHT 的 精确 关 键 词 映 射 的 特 性 决 定 了 无 法 和 信 息 检 索 等 领 域 的 研 究 成 果 结 合 , 阻 碍 了 基 于DHT 的 <strong>P2P</strong> 系 统 的 大 规 模 应 用 。二 、 非 结 构 化 <strong>P2P</strong> 网 络 的 搜 索 技 术1. 小 世 界 模 型 (Small World) 对 <strong>P2P</strong> 搜 索 技 术 的 影 响非 结 构 化 <strong>P2P</strong> 搜 索 技 术 一 直 采 用 洪 泛 转 发 (Flooding) 的 方 式 , 与 DHT 的 启 发 式 搜 索算 法 相 比 , 可 靠 性 差 , 对 网 络 资 源 的 消 耗 较 大 。 最 新 的 研 究 从 提 高 搜 索 算 法 的 可 靠性 和 寻 找 随 机 图 中 的 最 短 路 径 两 个 方 面 展 开 。 也 就 是 对 重 叠 网 络 (Overlay Network)的 重 新 认 识 。 其 中 , 小 世 界 模 型 特 征 和 幂 规 律 证 明 实 际 网 络 的 拓 扑 结 构 既 不 是 非 结构 化 系 统 所 认 识 的 一 个 完 全 随 机 图 , 也 不 是 DHT 发 现 算 法 采 用 的 确 定 性 拓 扑 结 构 。实 际 网 络 体 现 的 幂 规 律 分 布 的 含 义 可 以 简 单 解 释 为 在 网 络 中 有 少 数 结 点 有 较 高的 “ 度 ”, 多 数 结 点 的 “ 度 ” 较 低 。 度 较 高 的 结 点 同 其 他 结 点 的 联 系 比 较 多 , 通 过 它 找 到待 查 信 息 的 概 率 较 高 。Small world 模 型 的 特 性 : 网 络 拓 扑 具 有 高 聚 集 度 和 短 链 的 特 性 。 在 符 合 SmallWorld 特 性 的 网 络 模 型 中 , 可 以 根 据 结 点 的 聚 集 度 将 结 点 划 分 为 若 干 簇 (Cluster), 在每 个 簇 中 至 少 存 在 一 个 度 最 高 的 结 点 为 中 心 结 点 。 大 量 研 究 证 明 了 以 Gnutella 为 代表 的 <strong>P2P</strong> 网 络 符 合 Small World 特 征 , 也 就 是 网 络 中 存 在 大 量 高 连 通 结 点 , 部 分 结 点之 间 存 在 “ 短 链 ” 现 象 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 3/10 页 )2006-11-


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战图 2 Gnutella 重 叠 网 络 的 Small World 现 象因 此 ,<strong>P2P</strong> 搜 索 算 法 中 如 何 缩 短 路 径 长 度 的 问 题 变 成 了 如 何 找 到 这 些 “ 短 链 ” 的 问题 。 尤 其 是 在 DHT 搜 索 算 法 中 , 如 何 产 生 和 找 到 “ 短 链 ” 是 搜 索 算 法 设 计 的 一 个 新 的思 路 。Small World 特 征 的 发 现 和 引 入 会 对 <strong>P2P</strong> 搜 索 算 法 产 生 重 大 影 响 。2. 非 结 构 化 <strong>P2P</strong> 搜 索 算 法按 照 搜 索 策 略 , 可 以 分 为 两 大 类 : 盲 目 搜 索 和 启 发 式 搜 索 。 盲 目 搜 索 通 过 在 网络 中 传 播 查 询 信 息 并 且 把 这 些 信 息 不 断 扩 散 给 每 个 节 点 。 通 过 这 种 洪 泛 方 式 来 搜 索想 要 的 资 源 。 而 启 发 式 搜 索 在 搜 索 的 过 程 中 利 用 一 些 已 有 的 信 息 来 辅 助 查 找 过 程 。由 于 信 息 搜 索 对 资 源 的 存 储 有 一 些 知 识 , 所 以 信 息 搜 索 能 够 比 较 快 的 找 到 资 源 。●Flooding 搜 索 方 法在 最 初 的 Gnutella 协 议 中 , 使 用 的 是 Flooding 方 法 , 在 网 络 中 , 每 个 节 点 都 不 知 道其 他 节 点 的 资 源 。 当 它 要 寻 找 某 个 文 件 , 把 这 个 查 询 信 息 传 递 给 它 的 相 邻 节 点 , 如http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 4/10 页 )2006-11-


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战果 相 邻 节 点 含 有 这 个 资 源 , 就 返 回 一 个 QueryHit 的 信 息 给 Requester。 如 果 它 相 邻的 节 点 都 没 有 命 中 这 个 被 查 询 文 件 , 就 把 这 条 消 息 转 发 给 自 己 的 相 邻 节 点 。 这 种 方式 像 洪 水 在 网 络 中 各 个 节 点 流 动 一 样 , 所 以 叫 做 Flooding 搜 索 。 由 于 这 种 搜 索 策 略是 首 先 遍 历 自 己 的 邻 接 点 , 然 后 再 向 下 传 播 , 所 以 又 称 为 宽 度 优 先 搜 索 方 法(BFS)。 如 图 所 示 : 搜 索 的 节 点 一 开 始 TTL=3, 它 每 传 播 一 次 TTL 减 1, 如 果 TTL减 到 0 还 没 有 搜 索 到 资 源 , 则 停 止 。 如 果 搜 索 到 资 源 则 返 回 目 标 机 器 的 信 息 以 用 来建 立 连 接 。 在 搜 索 过 程 中 可 能 出 现 循 环 , 但 是 由 于 有 TTL 控 制 , 所 以 这 个 循 环 不 会永 远 进 行 下 去 , 当 TTL=0 的 时 候 自 然 结 束 。图 3Flooding 方 法 示 意 图●Modified-BFS 方 法这 种 方 法 是 在 宽 度 优 先 方 法 Flooding 上 面 作 了 一 定 修 改 。 跟 Flooding 搜 索 方 法 不同 , 搜 索 源 只 是 随 机 的 选 取 一 定 比 例 的 相 邻 节 点 作 为 查 询 信 息 的 发 送 目 标 , 而 不 是发 送 给 所 有 相 邻 节 点 。 相 比 于 Flooding 方 法 来 说 , 是 以 时 间 换 取 空 间 的 有 效 尝 试 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 5/10 页 )2006-11-


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战●Iterative Deepening 搜 索 方 法迭 代 递 增 是 Flooding 方 法 的 改 进 , 策 略 循 环 递 增 TTL(Time <strong>to</strong> Live) 值 , 这 个 值 用来 控 制 Flooding 的 搜 索 深 度 。 跟 Flooding 搜 索 方 法 给 TTL 赋 一 个 较 大 的 值 不 同 , 这 种方 法 在 初 始 阶 段 , 给 TTL 一 个 很 小 的 值 , 如 果 在 TTL 减 为 0, 还 没 有 搜 索 到 资 源 , 则给 TTL 重 新 赋 更 高 的 值 。 这 种 策 略 可 以 减 少 搜 索 的 半 径 , 但 是 在 最 坏 的 情 况 下 , 延迟 很 大 , 如 果 <strong>P2P</strong> 网 络 内 重 复 资 源 丰 富 , 这 种 方 法 在 不 影 响 搜 索 质 量 的 基 础 上 将 减少 网 络 内 的 查 询 流 量 , 在 有 的 文 献 中 亦 称 为 Expanding Ring( 扩 展 环 搜 索 )。图 4 Iterative Deepening 过 程● Random Walk 搜 索 方 法 :在 随 机 漫 步 中 , 请 求 者 发 出 K 个 查 询 请 求 给 随 机 挑 选 的 K 个 相 邻 节 点 。 然 后 每 个 查 询信 息 在 以 后 的 漫 步 过 程 中 直 接 与 请 求 者 保 持 联 系 , 询 问 是 否 还 要 继 续 下 一 步 。 如 果请 求 者 同 意 继 续 漫 步 , 则 又 开 始 随 机 选 择 下 一 步 漫 步 的 节 点 , 否 则 中 止 搜 索 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 6/10 页 )2006-11-


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战图 5 Random Walk 效 果 图●Gnutella2 的 搜 索 方 法Gnutella2 建 立 Super-Node, 它 存 储 着 离 它 最 近 的 叶 子 节 点 的 文 件 信 息 , 这 些SuperNode, 再 连 通 起 来 形 成 一 个 Overlay Network. 当 叶 子 节 点 需 要 查 询 文 件 , 它 首先 从 它 连 接 的 SuperNode 的 索 引 中 寻 找 , 如 果 找 到 了 文 件 , 则 直 接 根 据 文 件 所 存 储的 机 器 的 IP 地 址 建 立 连 接 , 如 果 没 有 找 到 , 则 SuperNode 把 这 个 查 询 请 求 发 给 它 连接 的 其 他 超 级 节 点 , 直 到 得 到 想 要 的 资 源 ,KaZaa,POCO 等 都 是 基 于 这 种 超 级 节 点的 思 想 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 7/10 页 )2006-11-


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战图 6 Gnutella2 的 SuperNode 节 点 图●基 于 移 动 Agent 的 搜 索 方 法移 动 Agent 是 一 个 能 在 异 构 网 络 中 自 主 地 从 一 台 主 机 迁 移 到 另 一 台 主 机 , 并 可 与 其他 Agent 或 资 源 进 行 交 互 的 程 序 。Agent 非 常 适 合 在 网 络 环 境 中 来 帮 助 用 户 完 成 信 息检 索 的 任 务 。 现 在 意 大 利 的 一 些 研 究 人 员 在 移 动 Agent 结 合 <strong>P2P</strong> 方 面 做 了 一 些 前 沿的 研 究 , 其 中 的 一 些 想 法 , 就 是 通 过 在 <strong>P2P</strong> 软 件 中 嵌 入 Agent 的 运 行 时 环 境 。 当 有节 点 需 要 搜 索 的 时 候 , 它 发 送 一 个 移 动 Agent 给 它 相 邻 的 节 点 , 移 动 Agent 记 录 着它 的 一 些 搜 索 的 信 息 。 当 这 个 Agent 到 达 一 台 新 的 机 器 上 , 然 后 在 这 个 机 器 上 进 行资 源 搜 索 任 务 , 如 果 这 台 机 器 上 没 有 它 想 要 的 资 源 , 则 它 把 这 些 搜 索 的 信 息 传 给 它的 邻 节 点 , 如 果 找 到 资 源 , 则 返 回 给 请 求 的 机 器 。●Query Routing 方 法这 种 方 法 是 一 种 启 发 式 搜 索 方 法 。 首 先 每 个 <strong>Peer</strong> 给 本 节 点 的 资 源 做 索 引 , 并 且 纪 录相 邻 节 点 的 资 源 信 息 , 当 查 询 到 达 的 时 候 , 可 以 查 询 路 由 表 直 接 定 位 到 资 源 的 位置 , 而 不 需 要 再 次 转 发 查 询 信 息 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 8/10 页 )2006-11-


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战图 7Query Routing 方 法三 、<strong>P2P</strong> 搜 索 技 术 研 究 的 挑 战<strong>P2P</strong> 搜 索 技 术 中 最 重 要 的 研 究 成 果 应 该 是 基 于 Small World 理 论 的 非 结 构 化 搜 索 算 法和 基 于 DHT 的 结 构 化 搜 索 算 法 。 尤 其 是 DHT 及 其 搜 索 技 术 为 资 源 的 组 织 与 查 找 提 供了 一 种 新 的 方 法 , 在 近 年 来 的 <strong>P2P</strong> 研 究 领 域 成 为 热 点 。随 着 <strong>P2P</strong> 系 统 实 际 应 用 的 发 展 , 物 理 网 络 中 影 响 路 由 的 一 些 因 素 开 始 影 响 <strong>P2P</strong> 发 现算 法 的 效 率 。 一 方 面 , 实 际 网 络 中 结 点 之 间 体 现 出 较 大 的 差 异 , 即 异 质 性 。 由 于 客户 机 / 服 务 器 模 式 在 Internet 和 分 布 式 领 域 十 几 年 的 应 用 和 大 量 种 类 的 电 子 设 备 的 普及 , 如 手 提 电 脑 、 移 动 电 话 或 PDA。 这 些 设 备 在 计 算 能 力 、 存 储 空 间 和 电 池 容 量 上差 别 很 大 。 另 外 , 实 际 网 络 被 路 由 器 和 交 换 机 分 割 成 不 同 的 自 治 区 域 , 体 现 出 严 密的 层 次 性 。另 一 方 面 , 网 络 波 动 的 程 度 严 重 影 响 搜 索 算 法 的 效 率 。 网 络 波 动 (Churn) 包 括 结点 的 加 入 、 退 出 、 失 败 、 迁 移 、 并 发 加 入 过 程 、 网 络 分 割 等 。DHT 的 发 现 算 法 如Chord、CAN 等 都 是 考 虑 网 络 波 动 的 最 差 情 况 下 的 设 计 与 实 现 。 由 于 每 个 结 点 的 度数 尽 量 保 持 最 小 , 这 样 需 要 响 应 的 成 员 关 系 变 化 的 维 护 可 以 比 较 小 , 从 而 可 以 快 速http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 9/10 页 )2006-11-


<strong>P2P</strong> 搜 索 技 术 的 研 究 与 挑 战恢 复 网 络 波 动 造 成 的 影 响 。 但 是 每 个 结 点 仅 有 少 量 路 由 状 态 的 代 价 是 发 现 算 法 的 高延 时 , 因 为 每 一 次 查 找 需 要 联 系 多 个 结 点 , 在 稳 定 的 网 络 中 这 种 思 路 是 不 必 要 的 。同 时 , 作 为 一 种 资 源 组 织 与 发 现 技 术 必 然 要 支 持 复 杂 的 查 询 , 如 关 键 词 、 内 容 查 询等 。 尽 管 信 息 检 索 和 数 据 挖 掘 领 域 提 供 了 大 量 成 熟 的 语 义 查 询 技 术 , 由 于 DHT 精 确关 键 词 映 射 的 特 性 阻 碍 了 DHT 在 复 杂 查 询 方 面 的 应 用 。<strong>P2P</strong> 搜 索 方 法 一 直 是 研 究 的 热 点 。 一 些 新 的 搜 索 方 法 不 断 的 涌 现 , 但 是 , 在 资 源 搜索 效 率 和 准 确 定 位 方 面 还 有 很 大 的 改 善 空 间 , 以 及 基 于 <strong>P2P</strong> 技 术 的 搜 索 引 擎 要 达 到现 在 集 中 式 的 搜 索 引 擎 Google, 百 度 这 样 广 泛 使 用 还 需 要 一 段 长 时 间 的 努 力 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch03.html( 第 10/10 页 )2006-11


<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong>的 应 用 研 究 、 面 临 的 问 题 与 前 景 展 望上 一 页<strong>Peer</strong>- <strong>to</strong>- <strong>Peer</strong> 综 述下 一 页第 4 章 <strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong> 的 应 用 研 究 、 面 临 的 问 题 与 前 景 展 望一 、 国 外 公 司 与 研 究 机 构 研 究 情 况近 年 来 , 随 着 Napster、KaZaa、BT、eMule 这 样 的 基 于 <strong>P2P</strong> 技 术 的 文 件 共 享 软 件 在 Internet 上 迅 速 传 播 ,<strong>P2P</strong> 技术 在 国 际 国 内 都 引 发 了 研 究 的 新 热 潮 。 国 外 开 展 <strong>P2P</strong> 研 究 的 学 术 团 体 主 要 包 括 <strong>P2P</strong> 工 作 组 (<strong>P2P</strong>WG)、 全 球 网格 论 坛 (GGF) 以 及 各 高 校 的 研 究 小 组 。<strong>P2P</strong> 工 作 组 成 立 的 主 要 目 的 是 希 望 加 速 <strong>P2P</strong> 计 算 基 础 设 施 的 建 立 和 相 应 的标 准 化 工 作 。<strong>P2P</strong>WG 成 立 之 后 , 对 <strong>P2P</strong> 计 算 中 的 术 语 进 行 了 统 一 , 也 形 成 相 关 的 草 案 , 但 是 在 标 准 化 工 作 方 面工 作 进 展 缓 慢 。 目 前 <strong>P2P</strong>WG 已 经 和 GGF 合 并 , 由 该 论 坛 管 理 <strong>P2P</strong> 计 算 相 关 的 工 作 。GGF 负 责 网 格 计 算 和 <strong>P2P</strong> 计算 等 相 关 的 标 准 化 工 作 。从 国 外 公 司 对 <strong>P2P</strong> 计 算 的 支 持 力 度 来 看 ,Microsoft 公 司 、Sun 公 司 和 Intel 公 司 投 入 较 大 。Microsoft 公 司 成 立 了Pastry 项 目 组 , 主 要 负 责 <strong>P2P</strong> 计 算 技 术 的 研 究 工 作 , 目 前 开 发 了 基 于 Pastry 的 多 种 应 用 , 包 括 SCRIBE、PAST、SQUIRREL 等 。 在 新 一 代 的 Windows Vista 操 作 系 统 中 , 也 增 加 了 最 新 的 <strong>P2P</strong> 研 究 成 果 来 支 持 协 同 工 作 ( 标 注1)。 在 2000 年 8 月 ,Intel 公 司 宣 布 成 立 <strong>P2P</strong> 工 作 组 , 正 式 开 展 <strong>P2P</strong> 的 研 究 。 工 作 组 成 立 以 后 , 积 极 与 应 用 开 发 商合 作 , 开 发 <strong>P2P</strong> 应 用 平 台 。2002 年 Intel 发 布 了 . Net 基 础 架 构 之 上 的 Accelera<strong>to</strong>r Kit (<strong>P2P</strong> 加 速 工 具 包 ) 和 <strong>P2P</strong> 安 全API 软 件 包 , 从 而 使 得 微 软 . NET 开 发 人 员 能 够 迅 速 地 建 立 <strong>P2P</strong> 安 全 Web 应 用 程 序 。IBM 公 司 也 开 展 了 基 于 <strong>P2P</strong> 技术 的 研 究 , 提 出 了 Smart Networking, 另 外 IBM 公 司 大 力 支 持 的 网 格 计 算 (Grid Computing) 与 <strong>P2P</strong> 计 算 在 许 多 方面 研 究 类 似 。Sun 公 司 以 Java 技 术 为 背 景 , 开 展 了 JXTA 项 目 。JXTA 是 基 于 Java 的 开 源 <strong>P2P</strong> 平 台 , 任 何 个 人 和 组 织 均 可 以 加 入该 项 目 。 因 此 , 该 项 目 不 仅 吸 引 了 大 批 <strong>P2P</strong> 研 究 人 员 和 开 发 人 员 , 而 且 已 经 发 布 了 基 于 JXTA 的 即 时 聊 天 软 件 包和 搜 索 引 擎 。JXTA 定 义 了 一 组 核 心 业 务 : 认 证 、 资 源 发 现 和 管 理 。 在 安 全 方 面 ,JXTA 加 入 了 加 密 软 件 包 , 允 许使 用 该 加 密 包 进 行 数 据 加 密 , 从 而 保 证 消 息 的 隐 私 、 可 认 证 性 和 完 整 性 。 在 JXTA 核 心 之 上 , 还 定 义 了 包 括 内 容管 理 、 信 息 搜 索 以 及 服 务 管 理 在 内 的 各 种 其 它 可 选 JXTA 服 务 。 在 核 心 服 务 和 可 选 服 务 基 础 上 , 用 户 可 以 开 发 各种 JXTA 平 台 上 的 <strong>P2P</strong> 应 用 。二 、 应 用 研 究 的 分 类<strong>P2P</strong> 实 际 的 应 用 研 究 和 产 品 主 要 体 现 在 以 下 几 个 方 面 :http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch04.html( 第 1/9 页 )2006-11-1 11:46:22


<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong>的 应 用 研 究 、 面 临 的 问 题 与 前 景 展 望●<strong>P2P</strong> 分 布 式 存 储 系 统<strong>P2P</strong> 分 布 式 存 储 系 统 ( 文 件 共 享 与 下 载 ) 是 一 个 用 于 对 等 网 络 的 数 据 存 储 系 统 , 它 可 以 提 供 高 效 率 的 、 鲁 棒 的 和负 载 平 衡 的 文 件 存 取 功 能 。 对 于 存 储 系 统 , 用 户 关 心 数 据 的 定 位 、 搜 索 以 及 路 由 的 效 率 , 安 全 性 也 是 重 要 的 因素 。 集 中 方 式 在 很 多 情 况 下 不 再 适 用 这 种 大 规 模 数 据 存 储 的 要 求 , 这 就 需 要 一 个 新 的 体 系 来 管 理 系 统 中 的 数 据 。<strong>P2P</strong> 分 布 式 存 储 系 统 就 是 解 决 这 样 的 问 题 。 这 些 研 究 包 括 全 分 布 式 存 储 系 统 :Oceans<strong>to</strong>re,Past 和 FreeHaven等 。 其 中 , 基 于 超 级 点 结 构 的 半 分 布 式 <strong>P2P</strong> 应 用 如 KaZaa、Edonkey、Morpheus、Bit Torrent 等 也 属 于 <strong>P2P</strong> 共 享存 储 的 范 畴 , 并 且 用 户 数 量 急 剧 增 加 。Oceans<strong>to</strong>re 和 Past 都 提 供 了 一 种 有 效 的 广 域 网 存 储 模 型 。 它 们 的 底 层 都 建立 了 一 个 代 价 上 限 为 logN 的 路 由 策 略 。 Past 则 是 面 向 一 个 相 对 简 单 而 紧 凑 的 概 念 , 它 采 用 Pastry 提 供 的 路 由 机制 , 试 图 利 用 网 络 中 闲 置 的 存 储 节 点 建 立 一 个 更 为 完 善 的 存 储 语 义 。FreeHaven 则 建 立 了 一 个 详 细 的 匿 名 体 系 , 用来 防 止 潜 在 的 恶 意 攻 击 。●<strong>P2P</strong> 计 算 能 力 的 共 享加 入 对 等 网 络 的 结 点 除 了 可 以 共 享 存 储 能 力 之 外 , 还 可 以 共 享 CPU 处 理 能 力 。 目 前 已 经 有 了 一 些 基 于 对 等 网 络 的计 算 能 力 共 享 系 统 , 比 如 SETI@home。SETI@home 是 由 加 州 伯 克 利 大 学 开 展 的 寻 找 外 星 生 命 的 研 究 计 划 。 它 使用 <strong>P2P</strong> 技 术 串 联 所 有 参 与 研 究 计 划 的 闲 置 的 计 算 机 来 执 行 复 杂 的 运 算 , 用 来 分 析 行 星 的 无 线 电 讯 号 , 寻 找 宇 宙 可能 存 在 其 他 外 星 文 明 的 证 据 , 这 些 电 脑 每 天 平 均 发 挥 的 效 能 超 过 了 全 球 造 价 最 高 , 运 算 最 快 的 超 级 电 脑 。 这 种 计算 能 力 共 享 系 统 还 可 以 用 于 进 行 基 因 数 据 库 检 索 和 密 码 破 解 等 需 要 大 规 模 计 算 能 力 的 应 用 。●<strong>P2P</strong> 协 同 工 作 环 境协 同 工 作 是 指 多 用 户 之 间 利 用 网 络 中 的 协 同 计 算 平 台 互 相 协 同 来 共 同 完 成 计 算 任 务 , 共 享 信 息 资 源 等 。 通 过 采 用<strong>P2P</strong> 技 术 , 个 人 和 组 织 可 以 随 时 采 用 多 种 方 式 建 立 在 线 、 非 在 线 的 协 同 应 用 环 境 。 协 同 应 用 一 般 包 括 : 实 时 通信 、 聊 天 室 、 文 件 共 享 、 语 音 通 讯 等 基 本 功 能 , 除 了 这 些 基 本 功 能 , 用 户 之 间 还 可 以 共 享 白 板 、 协 同 写 作 、 视 频会 议 等 。 另 外 , 协 同 有 时 候 还 包 括 工 程 人 员 的 协 作 开 发 软 件 。 例 如 ,JBuilder2006 Java 集 成 开 发 环 境 就 增 加 了<strong>P2P</strong> 协 同 开 发 的 属 性 。 采 用 <strong>P2P</strong> 技 术 使 协 同 工 作 不 再 需 要 中 心 服 务 器 , 参 与 协 同 工 作 的 计 算 机 可 以 点 对 点 建 立 连接 。Groove 就 是 基 于 <strong>P2P</strong> 的 协 同 软 件 平 台 , 已 经 被 微 软 公 司 收 购 。●<strong>P2P</strong> 应 用 层 组 播组 播 技 术 (Multicast) 是 一 种 针 对 多 点 传 输 和 多 方 协 作 应 用 的 组 通 信 模 型 , 有 高 效 的 数 据 传 输 效 率 , 是 下 一 代Internet 应 用 的 重 要 支 撑 技 术 。 早 期 的 组 播 技 术 研 究 试 图 在 IP 层 提 供 组 播 通 信 功 能 , 但 IP 组 播 的 实 施 涉 及 到 对 现 有网 络 基 础 设 施 的 调 整 , 因 此 , 大 规 模 应 用 受 到 限 制 。 随 着 <strong>P2P</strong> 研 究 的 兴 起 , 基 于 应 用 层 的 组 播 技 术 逐 渐 受 到 广 泛 关注 。 应 用 层 组 播 协 议 将 组 成 员 节 点 自 组 织 成 重 叠 网 络 (Overlay network) , 在 主 机 节 点 实 现 组 播 功 能 , 为 数 据 多 点 并http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch04.html( 第 2/9 页 )2006-11-1 11:46:22


<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong>的 应 用 研 究 、 面 临 的 问 题 与 前 景 展 望发 传 输 提 供 服 务 。 应 用 层 组 播 是 在 应 用 层 实 现 组 播 功 能 而 不 需 要 网 络 层 的 支 持 , 这 样 就 可 以 避 免 出 现 由 于 网 络 层迟 迟 不 能 部 署 对 组 播 的 支 持 而 使 组 播 应 用 难 以 进 行 的 情 况 。 当 然 , 应 用 层 组 播 也 有 许 多 局 限 : 一 是 端 系 统 对 IP 网络 的 了 解 有 限 , 节 点 参 与 组 网 时 , 只 能 通 过 探 测 获 得 一 些 网 络 性 能 参 数 , 选 取 的 逻 辑 链 路 难 以 优 化 ; 二 是 主 机 不了 解 IP 网 络 的 拓 扑 结 构 , 只 能 通 过 带 宽 和 时 延 等 外 在 的 特 性 参 数 , 以 启 发 式 的 方 式 建 立 重 叠 网 络 , 逻 辑 链 路 不 能较 好 地 利 用 质 量 较 好 的 底 层 网 络 资 源 , 重 叠 网 络 的 多 条 链 路 可 能 经 过 同 一 条 物 理 链 路 。●Internet 间 接 访 问 基 础 结 构为 了 使 Internet 更 好 地 支 持 组 播 、 单 播 和 移 动 等 特 性 ,Internet 间 接 访 问 基 础 结 构 提 出 了 基 于 汇 聚 点 的 通 信 抽 象 。在 这 一 结 构 中 , 并 不 把 分 组 直 接 发 向 目 的 结 点 , 而 是 给 每 个 分 组 分 配 一 个 标 识 符 , 而 目 的 结 点 则 根 据 标 识 符 接 收相 应 的 分 组 。 标 识 符 实 际 上 表 示 的 是 信 息 的 汇 聚 点 。 目 的 结 点 把 自 己 想 接 收 的 分 组 的 标 识 符 预 先 通 过 一 个 触 发 器告 诉 汇 聚 点 , 当 汇 聚 点 收 到 分 组 时 , 将 会 根 据 触 发 器 把 分 组 转 发 该 相 应 的 目 的 结 点 。Internet 间 接 访 问 基 础 结 构实 际 上 在 Internet 上 构 成 了 一 个 重 叠 网 络 , 它 需 要 对 等 网 络 的 路 由 系 统 对 它 提 供 相 应 的 支 持 。●<strong>P2P</strong> 流 媒 体 技 术传 统 的 分 布 式 多 媒 体 系 统 一 般 是 基 于 客 户 / 服 务 器 模 式 , 服 务 器 以 单 播 的 方 式 和 每 个 用 户 建 立 连 接 , 由 于 流 媒 体服 务 具 有 高 宽 带 、 持 续 时 间 长 等 特 点 , 随 着 用 户 数 量 的 增 加 , 服 务 器 的 带 宽 很 快 被 消 耗 完 , 所 以 以 前 的 网 络 电 视经 常 出 现 断 断 续 续 , 需 要 不 断 地 进 行 数 据 缓 冲 。 为 了 解 决 系 统 的 可 扩 展 性 , 许 多 研 究 提 出 了 相 应 的 解 决 办 法 , 例如 IP 组 播 技 术 来 实 现 Internet 上 高 效 的 一 对 多 的 通 信 , 提 高 了 系 统 的 可 扩 展 性 。 然 而 由 于 IP 组 播 存 在 种 种 限 制 ,如 很 难 实 现 可 靠 性 组 播 和 拥 塞 控 制 等 ,IP 组 播 技 术 并 没 有 得 到 广 泛 的 应 用 。 由 于 <strong>P2P</strong> 网 络 本 身 的 可 扩 展 性 , 基 于<strong>P2P</strong> 方 式 的 流 媒 体 技 术 很 好 的 解 决 了 传 统 流 媒 体 带 宽 不 足 的 问 题 。 单 源 的 <strong>P2P</strong> 流 媒 体 系 统 建 立 在 应 用 层 组 播 技 术的 基 础 之 上 , 由 一 个 发 送 者 向 多 个 接 收 者 发 送 数 据 , 接 收 者 有 且 只 有 一 个 数 据 源 。 服 务 器 和 所 有 客 户 节 点 组 织 成组 播 树 , 组 播 树 的 中 间 节 点 接 受 来 自 父 节 点 组 播 的 媒 体 数 据 , 同 时 将 数 据 以 组 播 的 方 式 传 送 给 子 节 点 。 而 多 源 的<strong>P2P</strong> 流 媒 体 传 输 系 统 , 则 是 由 多 个 发 送 者 以 单 播 的 方 式 同 时 向 一 个 接 收 者 发 送 媒 体 数 据 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch04.html( 第 3/9 页 )2006-11-1 11:46:22


<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong>的 应 用 研 究 、 面 临 的 问 题 与 前 景 展 望●<strong>P2P</strong> 搜 索 技 术<strong>P2P</strong> 搜 索 技 术 使 用 户 能 够 深 度 搜 索 文 档 。 而 且 这 种 搜 索 无 需 通 过 Web 服 务 器 , 也 可 以 不 受 信 息 文 档 格 式 和 宿 主 设备 的 限 制 , 可 达 到 传 统 目 录 式 搜 索 引 擎 无 可 比 拟 的 深 度 。 目 前 , 集 中 式 搜 索 引 擎 谷 歌 、 雅 虎 、 百 度 是 人 们 在 网络 中 检 索 信 息 资 源 的 主 要 工 具 , 但 这 种 集 中 式 的 搜 索 引 擎 远 远 无 法 涵 盖 所 有 互 联 网 内 的 共 享 内 容 , 而 <strong>P2P</strong> 搜 索 技术 正 好 是 这 种 集 中 式 检 索 的 一 种 良 性 互 补 。简 单 描 述 这 个 过 程 : 每 个 节 点 在 加 入 网 络 的 时 候 , 会 对 存 储 在 本 节 点 上 的 内 容 进 行 索 引 , 以 满 足 本 地 内 容 检 索 的目 的 。 然 后 按 某 种 预 定 的 规 则 选 择 一 些 节 点 作 为 自 己 的 邻 居 , 加 入 到 <strong>P2P</strong> 网 络 当 中 去 。 发 起 者 P 提 出 检 索 请 求 q,并 将 q 发 送 给 自 己 的 邻 居 ,P 的 邻 居 收 到 q 后 , 检 查 本 身 是 否 存 在 查 询 的 信 息 , 如 果 不 存 在 , 转 发 查 询 , 直 到 返 回 结果 。图 3 <strong>P2P</strong> 搜 索 流 程三 、 国 内 学 术 机 构 研 发 情 况●MazeMaze 是 北 京 大 学 网 络 实 验 室 开 发 的 一 个 中 心 控 制 与 对 等 连 接 相 融 合 的 对 等 计 算 文 件 共 享 系 统 , 在 结 构 上 类 似Napster, 对 等 计 算 搜 索 方 法 类 似 于 Gnutella。 网 络 上 的 一 台 计 算 机 , 不 论 是 在 内 网 还 是 外 网 , 可 以 通 过 安 装 运 行Maze 的 客 户 端 软 件 自 由 加 入 和 退 出 Maze 系 统 。 每 个 节 点 可 以 将 自 己 的 一 个 或 多 个 目 录 下 的 文 件 共 享 给 系 统 的 其他 成 员 , 也 可 以 分 享 其 他 成 员 的 资 源 。Maze 支 持 基 于 关 键 字 的 资 源 检 索 , 也 可 以 通 过 好 友 关 系 直 接 获 得 。http://maze.tianwang.com/●Granaryhttp://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch04.html( 第 4/9 页 )2006-11-1 11:46:22


<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong>的 应 用 研 究 、 面 临 的 问 题 与 前 景 展 望Granary 是 清 华 大 学 自 主 开 发 的 <strong>P2P</strong> 存 储 服 务 系 统 。 所 谓 <strong>P2P</strong> 存 储 服 务 系 统 是 指 存 储 服 务 的 提 供 者 在 Internet 中 部署 一 定 数 量 的 存 储 服 务 器 , 为 用 户 提 供 数 据 存 储 服 务 , 确 保 数 据 的 可 靠 性 、 可 用 性 、 安 全 性 和 访 问 效 率 ; 存 储 服务 的 使 用 者 按 照 所 存 储 数 据 的 容 量 和 质 量 付 费 。 它 以 “ 对 象 ” 格 式 存 储 数 据 并 且 支 持 属 性 级 的 数 据 查 询 。http://hpc.cs.tsinghua.edu.cn/granary/●AnySeeAnySee 是 华 中 科 大 设 计 研 发 的 视 频 直 播 系 统 。 它 采 用 了 一 对 多 的 服 务 模 式 , 支 持 部 分 NAT 和 防 火 墙 的 穿 越 , 提高 了 视 频 直 播 系 统 的 可 扩 展 性 ; 同 时 , 它 利 用 近 播 原 则 、 分 域 调 度 的 思 想 , 使 用 Landmark 路 标 算 法 直 接 建 树 的方 式 构 建 应 用 层 上 的 组 播 树 , 克 服 了 ESM 等 一 对 多 模 式 系 统 由 联 接 图 的 构 造 和 维 护 带 来 的 负 载 影 响 。●WonGooWonGoo 是 中 科 院 计 算 所 研 制 的 一 套 <strong>P2P</strong> 技 术 平 台 , 该 平 台 主 要 为 信 息 安 全 、 网 格 计 算 提 供 支 撑 技 术 和 试 验 环境 , 同 时 WonGoo 的 基 础 部 件 将 在 开 发 完 善 之 后 以 开 放 源 代 码 的 方 式 向 社 会 公 开 。WonGoo 主 要 包 括 两 个 方 面 的 特 色 功 能 : 具 有 强 匿 名 性 的 <strong>P2P</strong> 通 讯 (WonGoo-Link), 基 于 内 容 查 找 的 <strong>P2P</strong>资 源 共 享 (WonGoo-Search)。 可 以 在 这 两 个 功 能 的 基 础 上 搭 建 各 种 特 色 化 的 <strong>P2P</strong> 应 用 , 目 前 相 关 的 应 用 还 没有 具 体 实 现 。WonGoo-Link 与 WonGoo-Search 可 以 分 别 独 立 构 造 并 搭 建 各 自 的 应 用 。 同 时 ,WonGoo-Search 底层 通 讯 也 可 以 采 用 WonGoo-Link 协 议 来 实 现 更 安 全 的 应 用 。●基 于 IPV6 的 <strong>P2P</strong> 内 容 存 取 应 用 系 统这 是 北 京 大 学 、 清 华 大 学 、 上 海 交 通 大 学 、 浙 江 大 学 、 华 中 科 技 大 学 、 华 南 理 工 大 学 、 北 京 世 纪 鼎 点 软 件 有 限 公司 共 同 承 担 的 国 家 CNGI 项 目 的 一 部 分 。 它 主 要 研 究 基 于 智 能 节 点 弹 性 重 叠 网 络 技 术 的 内 容 存 取 应 用 中 间 件 系统 , 在 CNGI 上 建 设 可 管 理 、 可 控 制 和 可 运 营 的 智 能 节 点 弹 性 重 叠 网 络 , 开 发 内 容 存 取 类 应 用 。http://p2p.grids.cn/四 、 国 内 企 业 研 发 的 情 况国 内 企 业 在 <strong>P2P</strong> 的 应 用 领 域 研 究 一 直 与 世 界 同 步 , 开 发 了 众 多 使 用 广 泛 的 <strong>P2P</strong> 产 品 。 这 些 产 品 主 要 集 中 在 文 件 共享 与 下 载 , 网 络 流 媒 体 电 视 等 方 面 。●POCOPOCO 是 中 国 领 先 的 免 费 电 影 、 音 乐 、 动 漫 等 多 媒 体 分 享 平 台 , 同 时 在 线 人 数 突 破 数 七 十 万 人 , 是 中 国 最 大的 电 影 音 乐 动 漫 分 享 平 台 , 是 有 流 量 控 制 力 的 , 无 中 心 服 务 器 的 第 三 代 <strong>P2P</strong> 资 源 交 换 平 台 。POCO 提 供 多 点 传http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch04.html( 第 5/9 页 )2006-11-1 11:46:22


<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong>的 应 用 研 究 、 面 临 的 问 题 与 前 景 展 望输 、 断 点 续 传 等 技 术 , 来 保 障 传 输 过 程 的 高 效 和 稳 定 。●OPOP- 又 称 为 Openext Media Desk<strong>to</strong>p, 一 个 网 络 娱 乐 内 容 平 台 ,Napster 的 后 继 者 , 它 可 以 最 直 接 的 方 式 找 到您 想 要 的 音 乐 、 影 视 、 软 件 、 游 戏 、 图 片 、 书 籍 以 及 各 种 文 档 , 随 时 在 线 共 享 文 件 容 量 数 以 亿 计 “ 十 万 影 视 、 百万 音 乐 、 千 万 图 片 ”。OP 整 合 了 Internet Explorer、Windows Media Player、RealOne Player 和 ACDSee , 是 国内 的 网 络 娱 乐 内 容 平 台 。●PPLivePPLive 是 一 款 用 于 互 联 网 上 大 规 模 视 频 直 播 的 共 享 软 件 。 它 使 用 网 状 模 型 , 有 效 解 决 了 当 前 网 络 视 频 点 播 服务 的 带 宽 和 负 载 有 限 问 题 , 实 现 用 户 越 多 , 播 放 越 流 畅 的 特 性 , 整 体 服 务 质 量 大 大 提 高 。其 他 的 非 常 优 秀 的 商 业 软 件 包 括 PP 点 点 通 ,eMule,BT 客 户 端 软 件 可 以 访 问 中 国 <strong>P2P</strong> 门 户 网 站 http://www.ppcn.net/ , 这 里 不 再 赘 述 。五 、 面 临 的 问 题●知 识 产 权 保 护在 <strong>P2P</strong> 共 享 网 络 中 普 遍 存 在 着 知 识 产 权 保 护 问 题 。 尽 管 目 前 Gnutella、Kazaa 等 <strong>P2P</strong> 共 享 软 件 宣 传 其 骨 干 服 务 器上 并 没 有 存 储 任 何 涉 及 产 权 保 护 的 内 容 的 备 份 , 而 仅 仅 是 保 存 了 各 个 内 容 在 互 联 网 上 的 存 储 索 引 。 但 无 疑 的 是 ,<strong>P2P</strong> 共 享 软 件 的 繁 荣 加 速 了 盗 版 媒 体 的 分 发 , 提 高 了 知 识 产 权 保 护 的 难 点 。 美 国 唱 片 工 业 协 会 RIAA 与 这 些 共 享 软件 公 司 展 开 了 漫 长 的 官 司 拉 锯 战 , 著 名 的 Napster 便 是 这 场 战 争 的 第 一 个 牺 牲 者 。 另 一 个 涉 及 面 很 关 的 战 场 则 是RIAA 和 使 用 <strong>P2P</strong> 来 交 换 正 版 音 乐 的 平 民 。 从 2004 年 1 月 至 今 RIAA 已 提 交 了 1000 份 有 关 方 面 的 诉 讼 。 尽 管 如 此 ,至 今 每 个 月 仍 然 有 超 过 150,000,000 的 歌 曲 在 网 络 上 被 自 由 下 载 。 后 Napster 时 代 的 <strong>P2P</strong> 共 享 软 件 较 Napster 更 具有 分 散 性 , 也 更 难 加 以 控 制 。 即 使 <strong>P2P</strong> 共 享 软 件 的 运 营 公 司 被 判 违 法 而 关 闭 , 整 个 网 络 仍 然 会 存 活 , 至 少 会 正 常工 作 一 段 时 间 。另 一 方 面 ,Napster 以 后 的 <strong>P2P</strong> 共 享 软 件 也 在 迫 切 寻 找 一 个 和 媒 体 发 布 厂 商 的 共 生 互 利 之 道 。 如 何 更 加 合 法合 理 的 应 用 这 些 共 享 软 件 , 是 一 个 新 时 代 的 课 题 。 毕 竟 <strong>P2P</strong> 除 了 共 享 盗 版 软 件 , 还 可 以 共 享 相 当 多 的 有 益 的 信息 。网 络 社 会 与 自 然 社 会 一 样 , 其 自 身 具 有 一 种 自 发 地 在 无 序 和 有 序 之 间 寻 找 平 衡 的 趋 势 。<strong>P2P</strong> 技 术 为 网 络 信 息共 享 带 来 了 革 命 性 的 改 进 , 而 这 种 改 进 如 果 想 要 持 续 长 期 地 为 广 大 用 户 带 来 好 处 , 必 须 以 不 损 害 内 容 提 供 商 的 基本 利 益 为 前 提 。 这 就 要 求 在 不 影 响 现 有 <strong>P2P</strong> 共 享 软 件 性 能 的 前 提 下 , 一 定 程 度 上 实 现 知 识 产 权 保 护 机 制 。 目 前 ,http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch04.html( 第 6/9 页 )2006-11-1 11:46:22


<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong>的 应 用 研 究 、 面 临 的 问 题 与 前 景 展 望已 经 有 些 <strong>P2P</strong> 厂 商 和 其 它 公 司 一 起 在 研 究 这 样 的 问 题 。 这 也 许 将 是 下 一 代 <strong>P2P</strong> 共 享 软 件 面 临 的 挑 战 性 技 术 问 题 之一 。●网 络 病 毒 传 播随 着 计 算 机 网 络 应 用 的 深 入 发 展 , 计 算 机 病 毒 对 信 息 安 全 的 威 胁 日 益 增 加 。 特 别 是 在 <strong>P2P</strong> 环 境 下 , 方 便 的 共 享和 快 速 的 选 路 机 制 , 为 某 些 网 络 病 毒 提 供 了 更 好 的 入 侵 机 会 。由 于 <strong>P2P</strong> 网 络 中 逻 辑 相 邻 的 节 点 , 地 理 位 置 可 能 相 隔 很 远 , 而 参 与 <strong>P2P</strong> 网 络 的 节 点 数 量 又 非 常 大 , 因 此 通 过<strong>P2P</strong> 系 统 传 播 的 病 毒 , 波 及 范 围 大 , 覆 盖 面 广 , 从 而 造 成 的 损 失 会 很 大 。在 <strong>P2P</strong> 网 络 中 , 每 个 节 点 防 御 病 毒 的 能 力 是 不 同 的 。 只 要 有 一 个 节 点 感 染 病 毒 , 就 可 以 通 过 内 部 共 享 和 通 信机 制 将 病 毒 扩 散 到 附 近 的 邻 居 节 点 。 在 短 时 间 内 可 以 造 成 网 络 拥 塞 甚 至 瘫 痪 , 共 享 信 息 丢 失 , 机 密 信 息 失 窃 , 甚至 通 过 网 络 病 毒 可 以 完 全 控 制 整 个 网 络 。一 个 突 出 的 例 子 就 是 2003 年 通 过 即 时 通 讯 软 件 传 播 病 毒 的 案 例 显 著 增 多 。 包 括 Symantec 公 司 和 McAfee 公 司的 高 层 技 术 主 管 都 预 测 即 时 通 讯 软 件 将 会 成 为 网 络 病 毒 传 播 和 黑 客 攻 击 的 主 要 载 体 之 一 。随 着 <strong>P2P</strong> 技 术 的 发 展 , 将 来 会 出 现 各 种 专 门 针 对 <strong>P2P</strong> 系 统 的 网 络 病 毒 。 利 用 系 统 漏 洞 , 达 到 迅 速 破 坏 、 瓦解 、 控 制 系 统 的 目 的 。 因 此 , 网 络 病 毒 的 潜 在 危 机 对 <strong>P2P</strong> 系 统 安 全 性 和 健 壮 性 提 出 了 更 高 的 要 求 , 迫 切 需 要 建 立一 套 完 整 、 高 效 、 安 全 的 防 毒 体 系 。●网 络 带 宽 问 题<strong>P2P</strong> 文 件 共 享 和 下 载 给 用 户 带 来 了 很 大 便 利 。 然 而 , 随 着 它 的 大 面 积 流 行 ,<strong>P2P</strong> 下 载 流 量 占 用 带 宽 接 入 的 大 量 资源 , 被 许 多 ISP 视 为 洪 水 猛 兽 。 据 统 计 , 在 一 些 地 方 ,Internet 超 过 了 70% 以 上 的 流 量 被 <strong>P2P</strong> 相 关 应 用 占 据 , 很 多公 司 和 学 校 不 得 不 封 杀 <strong>P2P</strong> 端 口 来 阻 止 这 种 视 频 、 音 频 文 件 传 输 。 这 样 的 下 载 流 量 在 有 时 会 影 响 了 某 些 用 户 使 用正 常 的 Web, Email 以 及 视 频 点 播 等 业 务 。●安 全 问 题<strong>P2P</strong> 网 络 系 统 的 开 发 , 除 了 涉 及 传 统 的 安 全 性 的 领 域 : 身 份 识 别 认 证 、 授 权 、 数 据 完 整 性 、 保 密 性 和 不 可 否 认性 , 还 有 一 系 列 安 全 管 理 问 题 比 较 突 出 :●<strong>P2P</strong> 网 络 没 有 中 心 服 务 器 , 信 息 完 全 共 享 , 这 给 了 使 用 者 很 大 的 自 由 , 但 是 这 也 使 其 陷 入 “ 无 政 府 主 义 ” 的困 境 色 情 影 片 、 暴 力 影 片 在 这 些 系 统 中 随 处 可 见 , 获 取 完 全 免 费 , 这 样 对 青 少 年 成 长 会 造 成 负 面 影 响 。●由 于 <strong>P2P</strong> 系 统 的 复 制 传 播 迅 速 , 一 些 机 密 文 件 一 旦 丢 失 , 在 <strong>P2P</strong> 系 统 只 要 有 一 份 拷 贝 , 就 有 可 能 迅 速 扩张 , 造 成 大 面 积 的 影 响 。●间 谍 软 件 已 经 成 为 <strong>P2P</strong> 软 件 的 硬 伤 。 例 如 ,<strong>P2P</strong> 软 件 KaZaa 在 大 面 积 流 行 的 时 候 , 里 面 出 现 了 大 量 的 间 谍http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch04.html( 第 7/9 页 )2006-11-1 11:46:22


<strong>Peer</strong>-<strong>to</strong>-<strong>Peer</strong>的 应 用 研 究 、 面 临 的 问 题 与 前 景 展 望软 件 ,CA 公 司 称 :KaZaa 是 互 联 网 最 具 威 胁 的 间 谍 件 。 许 多 使 用 <strong>P2P</strong> 网 络 下 载 的 用 户 被 植 入 间 谍 软 件 。六 、 发 展 趋 势在 <strong>P2P</strong> 文 件 共 享 领 域 , 技 术 已 经 比 较 成 熟 , 这 样 的 软 件 如 eMule,BT,KaZaa,POCO 分 别 培 养 了 自 己 的 用 户群 。 但 是 , 由 于 基 于 不 同 协 议 的 <strong>P2P</strong> 系 统 资 源 并 不 共 享 , 相 互 隔 绝 。 所 以 , 当 前 阶 段 , 这 一 类 型 软 件 正 处 在 自 由竞 争 阶 段 , 进 入 市 场 的 企 业 无 论 是 规 模 还 是 实 力 , 都 不 相 上 下 。 要 想 在 竞 争 中 取 胜 , 下 面 这 些 内 容 必 须 考 虑 。 怎么 样 激 励 用 户 提 供 资 源 ? 怎 么 样 保 障 网 络 里 资 源 高 速 稳 定 的 下 载 速 度 ? 怎 么 样 去 除 间 谍 软 件 和 病 毒 在 系 统 中 的 传播 ? 除 了 这 些 , 还 有 人 气 的 较 量 , 服 务 质 量 的 较 量 , 收 费 与 免 费 的 较 量 。 最 终 研 究 方 向 是 ,<strong>P2P</strong> 网 间 资 源 的 整合 , 资 源 互 通 , 搜 索 共 享 。在 <strong>P2P</strong> 协 同 计 算 方 面 , 国 内 企 业 起 步 较 晚 。 相 关 产 品 还 不 是 很 多 , 而 国 外 例 如 Groove 在 这 方 面 已 经 作 了 大 量 的 工作 , 开 发 了 相 对 成 熟 的 产 品 。 随 着 协 同 计 算 概 念 的 兴 起 , 这 方 面 软 件 的 需 求 呈 现 急 剧 增 长 的 趋 势 , 应 该 是 一 片 广阔 的 篮 海 。 而 且 , 这 类 软 件 往 往 是 面 向 企 业 和 政 府 用 户 , 所 以 相 对 于 免 费 的 <strong>P2P</strong> 文 件 共 享 软 件 来 说 , 有 更 好 的 盈利 空 间 。在 <strong>P2P</strong> 的 流 媒 体 技 术 方 面 , 目 前 , 流 媒 体 传 输 的 研 究 才 刚 起 步 不 久 , 还 有 许 多 问 题 需 要 解 决 。 由 于 <strong>P2P</strong> 流 媒 体 系统 中 节 点 的 行 为 具 有 Ad-Hoc 性 质 , 如 何 在 动 态 的 系 统 环 境 下 保 证 流 媒 体 的 服 务 质 量 , 需 要 结 合 流 媒 体 对 QoS 的要 求 和 网 络 流 量 分 析 等 方 面 的 知 识 , 研 究 高 效 率 、 低 代 价 的 QoS 保 障 机 制 。 可 研 究 的 方 向 包 括 : 服 务 节 点 的 选择 、 节 点 失 效 时 如 何 保 证 流 媒 体 服 务 的 连 续 以 及 对 多 个 发 送 端 的 传 输 调 度 等 。基 于 <strong>P2P</strong> 技 术 的 VoIP 产 品 Skype 的 巨 大 成 功 给 <strong>P2P</strong> 开 辟 了 又 一 个 新 的 领 域 。 相 关 专 家 认 为 ,VOIP 的 发 展 目 前 应 该是 有 两 条 路 , 一 种 是 传 统 电 信 运 营 商 的 路 线 , 即 在 可 管 理 的 IP 网 上 建 立 IMS 平 台 发 展 VoIP 话 音 业 务 。 这 种 网 络 是封 闭 的 , 可 管 理 的 。 另 外 一 种 是 基 于 现 有 互 联 网 公 众 公 共 <strong>P2P</strong> VoIP 网 络 。 它 的 特 点 是 开 放 的 , 任 何 人 可 以 自 由加 入 和 离 开 网 络 , 具 有 分 布 管 理 和 增 长 能 力 , 任 何 设 备 只 要 支 持 标 准 协 议 都 可 以 使 用 。 传 统 电 信 运 营 商 的 利 益 需求 和 广 大 用 户 的 需 求 成 为 一 个 矛 盾 , 但 是 市 场 的 需 求 和 VOIP 的 发 展 趋 势 是 不 可 改 变 的 。 将 来 具 体 采 用 哪 条 路 ,还 不 确 定 , 还 要 看 发 展 , 看 竞 争 情 况 。 或 许 会 有 很 多 的 企 业 大 客 户 、 政 府 机 构 等 对 安 全 性 等 有 特 殊 的 要 求 , 会 采用 电 信 运 营 商 建 立 的 VOIP 业 务 , 但 是 对 于 广 大 普 通 用 户 来 说 , 基 于 公 共 互 联 网 的 <strong>P2P</strong> VoIP 网 络 将 是 大 势 所 趋 。综 上 所 述 ,<strong>P2P</strong> 技 术 正 处 在 发 展 的 春 天 , 基 于 这 项 技 术 的 杀 手 级 应 用 将 不 断 涌 现 , 这 些 技 术 将 极 大 地 改 善 了 整 个IT 世 界 的 面 貌 , 可 以 说 是 互 联 网 技 术 的 又 一 次 新 的 革 命 。( 标 注 1) 著 名 的 <strong>P2P</strong> 协 同 软 件 Groove 的 创 始 人 Ray Ozzie 目 前 被 微 软 公 司 任 命 为 首 席 软 件 架 构 师 。http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/ch04.html( 第 8/9 页 )2006-11-1 11:46:22


后 记上 一 页后 记这 篇 文 章 是 我 在 中 科 院 计 算 所 的 一 篇 技 术 报 告 的 部 分 内 容 ( 修 改 )。 最 先 是 在 2005-4-25 号挂 在 自 己 的 个 人 主 页 上 。 目 的 是 让 更 多 的 朋 友 通 过 阅 读 对 <strong>P2P</strong> 技 术 有 一 个 大 概 的 了 解 。 为 了让 文 章 变 得 通 俗 易 懂 , 我 删 除 了 其 中 非 常 细 节 的 部 分 , 这 次 又 对 第 一 版 进 行 了 修 改 。 承 蒙 厚爱 , 在 这 期 间 , 我 收 到 了 很 多 朋 友 , 包 括 学 校 的 同 学 、 公 司 的 技 术 人 员 给 我 写 的 email, 表达 对 文 章 的 肯 定 , 希 望 一 起 探 讨 p2p 的 问 题 , 这 里 表 示 感 谢 . 笔 者 会 在 以 后 的 版 本 中 更 加 完善 。其 它 网 站 需 要 转 载 , 请 署 上 作 者 名 和 出 处 。2005-4-25 第 一 版2005-11-3 第 二 版2006-8-25 第 三 版http://www.intsci.ac.cn/users/luojw/<strong>P2P</strong>/apa.html2006-11-1 11:46:48

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!