21.04.2015 Views

生物信息学初探 - abc

生物信息学初探 - abc

生物信息学初探 - abc

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

生 物 信 息 学 初 探<br />

农 科 院 生 物 信 息 一 班 caas09s1<br />

报 告 人 : 荆 振 宇


课 题 研 究 思 路<br />

来 源 于 文 献<br />

血 红 蛋 白<br />

结 构 分 析<br />

血 红 蛋 白<br />

特 性 分 析<br />

人 血 红 蛋<br />

白 的 起 源<br />

已 被 试 验 证 实 的<br />

结 果<br />

斑 头 雁<br />

实 例<br />

血 红 蛋 白<br />

功 能 预 测<br />

的 验 证


第 一 篇 已 知 的 理 论 基 础<br />

血 红 蛋 白 是 红 细 胞<br />

的 主 要 成 分 , 它 由<br />

珠 蛋 白 四 聚 体 结 合<br />

四 个 含 铁 的 血 素 ,<br />

在 成 体 细 胞 中 , 珠<br />

蛋 白 四 聚 体 有 两 条<br />

相 同 的 α 链 和 β 链<br />

构 成 。


脊 椎 动 物 珠 蛋 白 演 化 模 式 如 下 :<br />

从 上 图 可 以 看 出 , 脊 椎 动 物 所 有 珠 蛋 白 基 因 是 由 共 同 的 祖 先 基 因 进 化<br />

而 来 的 ,α 链 珠 蛋 白 基 因 和 β 链 珠 蛋 白 基 因 的 分 开 发 生 的 很 晚 , 在 300~<br />

400 百 万 年 前 。α 链 珠 蛋 白 基 因 包 括 ξ、α2、α1 和 和 两 条 假 基 因 , 而 β 链<br />

珠 蛋 白 包 括 β、δ、ε 和 两 个 γ 何 一 条 假 基 因 。(Burmester T, 2002)


血 红 蛋 白 结 构<br />

血 红 蛋 白 的 空 间 结 构 测 定 是 由<br />

佩 鲁 茨 及 其 同 事 于 1963 年 完<br />

成 的 , 在 他 的 《 真 该 早 些 惹 怒<br />

你 》 一 书 中 , 创 造 性 地 提 出 了<br />

“ 同 晶 置 换 法 ”, 即 在 所 要 分<br />

析 的 蛋 白 质 晶 体 中 引 人 适 当 的<br />

重 金 属 原 子 , 得 到 同 晶 置 换 晶<br />

体 , 通 过 对 同 晶 置 换 晶 体 的 x<br />

射 线 衍 射 结 构 分 析 , 成 功 揭 示<br />

了 血 红 蛋 白 的 三 维 结 构 。<br />

佩 鲁 茨 (Perutz,Max<br />

Ferdinand) 英 国 化 学 家 ,<br />

生 物 学 家 。


镰 刀 型 血 红 蛋 白<br />

1956 年 , 英 格 拉 姆 (Ingram) 等 人 用 胰 蛋 白 酶 把<br />

正 常 的 血 红 蛋 白 (HbA) 和 镰 形 细 胞 的 血 红 蛋 白<br />

(HbS) 在 相 同 条 件 下 切 成 肽 段 , 通 过 对 比 二 者 的<br />

滤 纸 电 泳 双 向 层 析 谱 , 发 现 有 一 个 肽 段 的 位 置 不<br />

同 。<br />

这 是 β 链 N 末 端 的 一 段 肽 链 。 也 就 是 说 ,HbS 和<br />

HbA 的 α 链 是 完 全 相 同 的 , 所 不 同 的 只 是 " 链 上<br />

从 N 末 端 开 始 的 第 6 位 的 氨 基 酸 残 基 , 在 正 常 的<br />

HbA 分 子 中 是 谷 氨 酸 , 在 病 态 的 HbS 分 子 中 却<br />

被 缬 氨 酸 所 代 替 。


第 二 篇 生 物 信 息 学 的 预 测 与 论 证<br />

第 一 部 分 血 红 蛋 白 的 起 源<br />

1<br />

系 统 发 育 树 的 构 建<br />

2<br />

人 血 红 蛋 白 在 进 化 过 程 中 的 位 置<br />

3<br />

物 种 起 源 与 血 红 蛋 白 的 分 化


系 统 发 育 树 构 建 的 理 论 基 础<br />

系 统 发 生 分 析 一 般 是<br />

建 立 在 分 子 钟 基 础 上<br />

的 。<br />

分 子 钟 : 分 子 序 列 进 化<br />

是 按 照 一 恒 定 速 率 进<br />

行 的 , 所 以 积 累 突 变<br />

的 数 量 和 进 化 时 间 成<br />

一 定 比 例 , 基 于 这 个<br />

假 说 , 发 生 树 上 的 树<br />

枝 长 度 可 以 用 来 估 算<br />

基 因 分 离 的 时 间 。


进 化 树 的 构 建<br />

以 人 新 发 现 的 Neuroglobin 为 例 利 用 mega 软<br />

件 对 Neuroglobin 是 否 属 人 类 血 红 蛋 白 家 族<br />

经 分 析 。<br />

判 定 利 用 生 物 信 息 学 预 测 生 物 进 化 关 系 是 否 与<br />

通 过 传 统 的 进 化 理 论 和 实 验 室 所 得 数 据 一 致 。


步 骤<br />

1<br />

1、<br />

ngb_human<br />

蛋 白 序 列 在<br />

swiss-prot<br />

中 搜 索<br />

2<br />

2、 在 NCBI<br />

中 Blast 搜 索<br />

ngb_human<br />

同 源 序 列<br />

3<br />

3、 用 mega<br />

软 件 进 行 序 列<br />

比 对 并 构 建 进<br />

化 树


在 ExPASy 搜 索 NGB_HUMAN<br />

保 存 蛋 白 质 序 列 为 .fasta 格 式


NCBI 中 Blast 结 果<br />

利 用 Blastp 在 swissprot proteinseqence 的 人 类 蛋<br />

白 数 据 中 搜 索 到 12 条 保 存 为 .fasta 格 式


在 alignment/align by clustalw 对 序 列 进 行 比 较


view seqence data<br />

C-- 保 守 位 点<br />

PI-- 信 息 位 点<br />

V-- 可 变 位 点 区<br />

S-- 单 残 基 差 异


选 用 Neighbor-Joining 法 建 树


所 得 结 果 与 文 献 中 数 据 的 对 比<br />

Thorsten Burmester Cytoglobin: A Novel Globin Type Ubiquitously Expressed in<br />

Vertebrate Tissues. Mol. Biol. Evol. 19(4):416–421. 2002


利 用 血 红 蛋 白 构 建 发 育 树 的 实 际 应 用<br />

氨 基 酸 分 析 结 果 可 以 为 生 物<br />

的 亲 缘 关 系 的 研 究 提 供 更 多<br />

的 资 料 , 目 前 研 究 最 多 的 是<br />

血 红 蛋 白 和 细 胞 色 素 C。<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

哺 乳 纲 - 食 肉 目 - 犬 型 亚 目 - 熊 科 - 熊 猫 亚 科 - 大 熊<br />

猫<br />

两 栖 纲 - 有 尾 目 - 蝾 螈 科 - 蝾 螈 属 - 蝾 螈<br />

哺 乳 纲 - 食 肉 目 - 犬 科 - 犬 属 - 狗<br />

哺 乳 纲 - 灵 长 目 - 人 科 - 人 属 - 智 人 种 - 人<br />

哺 乳 纲 - 食 肉 目 - 鼬 科 - 水 獭 属 - 水 獭<br />

哺 乳 纲 - 单 孔 目 - 鸭 嘴 兽 科 - 鸭 嘴 兽 属 - 鸭 嘴 兽<br />

哺 乳 纲 - 食 肉 目 - 灵 猫 科 - 果 子 狸 属 - 果 子 狸<br />

鸟 纲 - 新 鸟 亚 纲 - 鸵 形 目 - 鸵 形 科 - 鸵 鸟 属 - 鸵 鸟 种<br />

哺 乳 纲 - 食 肉 目 - 熊 科 - 熊 亚 科 - 棕 熊 属 - 北 极 熊<br />

鸟 纲 - 今 鸟 亚 纲 - 突 胸 总 目 - 隼 形 目 - 鹰 科 - 兀 鹫 亚<br />

科 - 秃 鹫 属<br />

软 骨 鱼 纲 - 板 鳃 亚 纲 - 下 孔 总 目 - 鳐 目<br />

哺 乳 纲 - 有 袋 目 - 袋 鼠 科 - 大 袋 鼠 属 - 灰 大 袋 鼠<br />

哺 乳 纲 - 食 肉 目 - 猫 科 - 豹 亚 科 - 豹 属 - 美 洲 虎


第 二 部 分 人 血 红 蛋 白 分 析<br />

人 的 12 种 血 红 蛋 白 同 源 序 列 基 因 结 构 差<br />

异 分 析<br />

人 的 12 种 血 红 蛋 白 同 源 序 列 相 似 性 分 析<br />

38 种 哺 乳 动 物 血 红 蛋 白 alpha 亚 基 相 似<br />

性 分 析


人 的 12 种 血 红 蛋 白 同 源 序 列 基 因 结 构 差 异 分 析<br />

Query Full Name ID Sequence length<br />

P02008 Hemoglobin subunit zeta HBAZ_HUMAN 142<br />

P69892 Hemoglobin subunit gamma-2 HBG2_HUMAN 147<br />

P02042 Hemoglobin subunit delta HBD_HUMAN 147<br />

P69891 Hemoglobin subunit gamma-1 HBG1_HUMAN 147<br />

P68871 Hemoglobin subunit beta HBB_HUMAN 147<br />

P69905 Hemoglobin subunit alpha HBA_HUMAN 142<br />

P02100 Hemoglobin subunit epsilon HBE_HUMAN 147<br />

P09105 Hemoglobin subunit theta-1 HBAT_HUMAN 142<br />

Q6B0K9 Hemoglobin subunit mu HBM_HUMAN 141<br />

P02144 Myoglobin MYG_HUMAN 154<br />

Q8WWM9 Cytoglobin CYGB_HUMAN 190<br />

Q9NPG2 Neuroglobin NGB_HUMAN 151<br />

用 “HBA_HUMAN” 在<br />

ExPASy 中 提 取 序 列 , 用 blastP<br />

在 人 的 基 因 组 中 检 索 到 12 条 同<br />

源 序 列<br />

所 得 的 12 种 蛋 白 的 基 本 信 息


利 用 GSDS 软 件 分 析 基 因 结 构 差 异<br />

用 搜 索 到 的 人 12 条 序 列 的 ID 在 ExPASy 中 检 索<br />

用 ”Cross Reference” 查 找 对 应 蛋 白 序 列 的 全 长<br />

CDS 和 完 整 基 因 核 酸 序 列<br />

将 12 条 CDS 核 酸 序 列 链 接 成 一 个 FASTA 文 件 , 将 12<br />

条 基 因 序 列 链 接 成 另 一 个 FASTA 文 件<br />

运 行 GSDS


大 部 分 含 3 个 外 显 子 , 少 数 的 含 有 一 个 外 显 子<br />

内 含 子 的 序 列 长 度 差 异 很 大<br />

在 进 化 的 过 程 中 , 由 同 一 祖 先 进 化 过 来 的 基 因 内 含 子 外 显 子 产 生 了 一 定 的<br />

变 化 , 这 有 可 能 是 物 种 进 化 的 一 种 方 式


人 的 12 种 血 红 蛋 白 同 源 序 列 相 似 性 分 析<br />

用 HBA_human 蛋 白 质 序 列 进 行 PSI-BLAST,<br />

找 出 人 类 基 因 组 中 全 部 同 源 序 列 , 结 果 显 示 共 有<br />

12 条


用 MEME 预 测 12 条 序 列 中 的 保 守 motif<br />

motif 1<br />

motif 2<br />

motif 3


12 条 序 列 的 motif 组 成 结 构 :<br />

为 了 形 成 各 自 特 定 的 功 能 , 而 产 生 了 特 异 性 的 分 化 , 从<br />

而 导 致 了 基 因 结 构 的 差 异


38 种 哺 乳 动 物 血 红 蛋 白 alpha 亚 基 相 似 性 分<br />

析<br />

在 SRS 中 提 取 38 种 哺 乳 动 物 的 血 红 蛋 白 alpha 亚 基 蛋 白 序<br />


用 MEME 预 测 38 条 序 列 中 的 保 守 motif


第 三 部 分 人 血 红 蛋 白 alpha 亚 基 结 构 分 析<br />

跨 膜 区 域<br />

疏 水 性 与 亲 水 性<br />

结 构 分 析<br />

特 殊 结 构 和 特 征 序 列


氨 基 酸 残 基 疏 水 性 与 亲 水 性 分 析<br />

首 先 用 pepstats, 统 计 各 种 氨 基 酸 残 基 的 含 量 , 结 果 如 下 :<br />

Molecular weight = 15257.51<br />

Residues = 142<br />

Charge = 7.0<br />

Average Residue Weight = 107.447<br />

Isoelectric Point = 9.0879<br />

A280 Molar Extinction Coefficient = 9530 A280<br />

Extinction Coefficient 1mg/ml = 0.62<br />

Improbability of expression in inclusion bodies = 0.724<br />

Property Residue Number Mole%<br />

Tiny (A+C+G+S+T) 49 34.507<br />

Small (A+B+C+D+G+N+P+S+T+V) 81 57.042<br />

Aliphatic (A+I+L+V) 52 36.620<br />

Aromatic (F+H+W+Y) 21 14.789<br />

Non-polar (A+C+F+G+I+L+M+P+V+W+Y) 81 57.042<br />

Polar (D+E+H+K+N+Q+R+S+T+Z) 61 42.958<br />

Charged (B+D+E+H+K+R+Z) 36 25.352<br />

Basic (H+K+R) 24 16.901<br />

Acidic (B+D+E+Z) 12 8.451


用 pepinfo, 以 图 形 方 式 显 示 不 同 的 氨 基 酸 残 基 含<br />


用 SPDBV 分 析 , 在 color 中 选 择 accessibility<br />

Color---by Accessibility<br />

在 结 构 中 每 个 氨 基 酸 残 基 与<br />

周 围 溶 剂 接 触 程 度 的 多 少 决<br />

定 了 残 基 的 颜 色 。 与 溶 剂<br />

接 触 最 少 的 是 蓝 色 , 完 全 露<br />

在 分 子 表 面 的 是 红 色 , 接 触<br />

介 于 2 者 之 间 的 , 用 蓝 色<br />

和 红 色 中 间 的 颜 色 表 示 , 如<br />

蓝 绿 色 和 洋 红 色 。


Color 中 选 择 type<br />

对 结 构 模 型 染 色 的<br />

依 据 是 残 基 的 化 学<br />

类 型 : 带 正 电 的 用<br />

蓝 色 表 示 ; 带 负 电<br />

用 红 色<br />

表 示 ; 不 带 电 的 用<br />

黄 色 表 示 ; 无 极 性<br />

的 用 灰 色 表 示 。


接 着 用 garnier, 预 测 蛋 白 质 序 列 中 的 二 级 结 构


也 可 以 用 hmoment, 以 图 形 的 方 式 预 测 蛋 白 质 序<br />

列 中 可 能 形 成 α 螺 旋 和 β 折 叠 的 片 段


用 helixturnhelix 和 pepcoil, 预 测 该 序 列 当 中<br />

是 否 有 这 些 特 殊 的 domain<br />

结 果 显 示 : 没 有 这 些 domain


最 后 用 patmatmotif, 预 测 该 蛋 白 具 有 哪 些 特 征 序<br />

列<br />

结 果 显 示 : 有 1 个 Amidation 酰 胺 化 位 点


第 四 部 分 血 红 蛋 白 功 能 预 测 的 验 证<br />

突 变<br />

突 变 导<br />

致 镰 刀<br />

型 贫 血<br />

症<br />

突 变 与<br />

结 合 氧<br />

能 力 的<br />

关 系


镰 刀 型 红 细 胞 贫 血 症<br />

镰 刀 型 红 细 胞 贫 血 症 是 一 种 “ 分 子 病 ”, 即 分<br />

子 结 构 、 特 别 是 蛋 白 质 分 子 结 构 发 生 遗 传 性 变<br />

化 而 造 成 的 病 变 。<br />

为 什 么 会 出 现 这 样 的 遗 传 病 呢 ?


研 究 表 明 : 出 现 镰 刀 型 红 细 胞 , 原 因 在 于 :<br />

异 常 血 红 蛋 白 β 链 的 第 6 位 谷 氨 酸 被 缬 氨 酸 所 代<br />

替 。<br />

由 于 带 负 电 的 极 性 亲 水 谷 氨 酸 被 不 带 电 的 非 极<br />

性 疏 水 缬 氨 酸 所 代 替 , 致 使 血 红 蛋 白 的 溶 解 度<br />

下 降 。 在 氧 张 力 低 的 毛 细 血 管 区 , 血 红 蛋 白 形<br />

成 管 状 凝 胶 结 构 ( 如 棒 状 结 构 ), 导 致 红 细 胞 扭 曲<br />

成 镰 刀 状 ( 即 镰 变 )。


β 链 的 第 6 位 谷 氨 酸 被 缬 氨 酸 所 代 替<br />

未 突 变 的 β 链 的 第 6 位 Glu<br />

突 变 后 β 链 的 第 6 位 Val


β 链 的 第 6 位 谷 氨 酸 被 缬 氨 酸 所 代 替<br />

未 突 变 的<br />

hemoglobin<br />

突 变 的 hemoglobin


β 链 的 第 6 位 Glu 未 突 变 时<br />

与 相 邻 的 血 红 蛋 白 β 亚 基<br />

不 能 相 连<br />

β 链 的 第 6 位 Val 突 变 时 与<br />

相 邻 突 变 的 β 亚 基 相 连


为 什 么 脱 氧 合 血 红 蛋 白 镰 刀 型 化 而 氧 合 血<br />

红 蛋 白 ( 携 氧 ) 不 镰 刀 型 化 ?<br />

通 过 图 中 的 分<br />

析 , 可 以 简 单<br />

解 释 为 : 在 氧<br />

合 形 式 中 , 血<br />

红 蛋 白 亚 基 的<br />

重 新 排 列 使 β<br />

链 的 口 袋 不 能<br />

接 受 相 邻 的 血<br />

红 蛋 白 分 子 。


第 五 部 分 斑 头 雁 血 红 蛋 白 序 列 , 结 构<br />

和 功 能 的 分 析


引 言<br />

斑 头 雁 是 候 鸟 中 一 个 特 殊 的 物 种 。 它 们 夏 天 居 住<br />

在 青 海 湖 , 而 在 秋 天 会 飞 过 青 藏 高 原 到 达 印 度 再<br />

在 春 天 飞 回 。 有 趣 的 是 , 与 斑 头 雁 亲 缘 关 系 接 近<br />

的 灰 雁 长 年 居 住 在 印 度 低 地 , 并 不 迁 徙 。 通 过 两<br />

者 血 红 蛋 白 的 序 列 对 比 发 现 仅 有 4 处 发 生 了 替 换 。<br />

灰 雁 alpha 亚 基 中 第 119 位 脯 氨 酸 在 斑 头 雁 中 变 为<br />

丙 氨 酸 。 该 残 基 位 于 alpha/beta 的 分 界 面 上 。 目<br />

前 研 究 认 为 , 这 种 残 基 的 改 变 导 致 脱 氧 状 态 时 张<br />

力 状 态 的 变 化 使 得 alpha 和 beta 亚 基 之 间 的 接 触<br />

减 少 , 从 而 增 强 了 对 氧 的 亲 和 力 。 下 面 我 们 将 用<br />

SPDBV 软 件 来 证 明 该 结 论 。


1、 序 列 比 对<br />

从 NCBI 上 分 别 搜 索 1a4f 和 1faw 可 以 得 到 斑 头 雁<br />

和 灰 雁 的 血 红 蛋 白 alpha 和 beta 亚 基 的 蛋 白 质 序<br />

列 各 两 条 。<br />

以 fasta 格 式 保 存 到 本 地 计 算 机 , 并 用 wablab 中<br />

的 needle 工 具 进 行 序 列 比 对 , 注 意 的 是 alpha 和<br />

beta 亚 基 分 别 进 行 比 对 。


序 列 比 对 的 结 果 显 示 , 斑 头 雁 和 灰 雁 的 血 红 蛋 白 仅 有 4 个 氨 基<br />

酸 的 差 异 。


2.PDB 文 件 的 获 取<br />

• 首 先 下 载 并 安 装 SPDB-Viewer 软 件 .<br />

• 进 入 PDB 主 页 后 , 搜 索 1a4f 和 1faw 分 别 得 到 斑<br />

头 雁 血 和 灰 雁 的 血 红 蛋 白 3D 结 构<br />

• 点 击 download 图 标 , 下 载 1a4f.pdb 和<br />

1faw.pdb 文 件 至 本 地 计 算 机 。


3、 载 入 文 件<br />

载 入 蛋 白 质 文 件 : 在 菜 单 file→open PDB file<br />

选 择 目 标 pdb 文 件 , 即 可 载 入 。<br />

载 入 蛋 白 质 后 , 我 们 首 先 打 开 windows 下 的<br />

control panel 和 layers infos。<br />

去 除 主 链 和 侧 链 , 用 ribon 形 式 分 别 显 示 , 并 选 择<br />

color-Secondary Structure Succession 对 其<br />

染 色 。


4.3D 结 构 的 显 示<br />

斑 头 雁 血 红 蛋 白 的 氧 合 形 式 1a4f<br />

灰 雁 血 红 蛋 白 的 氧 合 形 式<br />

1faw


5、 选 定 所 需 序 列<br />

通 过 color-chain 功 能<br />

我 们 很 容 易 看 出 1a4f<br />

由 α 和 β 两 个 亚 基 组 成 ,<br />

而 1faw 则 含 有 4 个 亚<br />

基 。<br />

选 取 1faw 的 α 和 β 亚 基 ,<br />

保 存 为 1faw-ab, 便<br />

于 后 面 的 操 作 。


6. 用 SPDBV 进 行 结 构 分 析<br />

由 上 图 可 以 看 出 , 斑 头 雁 α 链 119 位 的 Ala 和 灰 雁 α 链<br />

119 位 的 Pro 都 位 于 血 红 蛋 白 α 链 和 β 链 的 结 合 处 。


7、α 链 和 β 链 之 间 距 离 的 测 定 - 斑 头 雁<br />

显 示 斑 头 雁 α 链 119 位 Ala 周 围 6 埃 的 氨 基 酸


8.α 链 和 β 链 之 间 距 离 的 测 定 - 灰 雁<br />

未 突 变 119 位 脯 氨 酸<br />

突 变 119 位 丙 氨 酸


9、 结 论<br />

和 灰 雁 比 较 , 斑 头 雁 血 红 蛋 白 α 链 119 位 Ala 使<br />

亚 基 间 距 离 减 小 , 导 致 分 子 疏 松 、 亚 基 间 牵 制<br />

作 用 弱 , 从 而 更 易 结 合 氧 气 分 子 。 推 测 其 氧 合<br />

曲 线 趋 于 平 缓 , 这 符 合 斑 头 雁 在 高 原 缺 氧 情 况<br />

下 结 合 氧 气 的 需 求 。<br />

以 上 现 象 说 明 α-119 在 血 红 蛋 白 氧 亲 和 力 上 起<br />

到 了 非 常 重 要 的 作 用 。 因 此 可 以 通 过 改 变 这 一<br />

残 基 来 提 高 血 红 蛋 白 的 氧 亲 和 力 。


Last,but not the least…<br />

Thank you!

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!