13.07.2015 Views

ExPASy使用初探 - abc - 北京大学

ExPASy使用初探 - abc - 北京大学

ExPASy使用初探 - abc - 北京大学

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ExPASy 使 用 初 探— 以 斑 头 雁 血 红 蛋 白 为 例组 长 : 任 娇组 员 : 申 立 平 孔 寅 飞 李 东 旭2009.03.18


工 作 分 工• a2 任 姣 : 斑 头 雁 的 物 种 介 绍 ,ExPASy 介 绍 , 整理 全 组 的 工 作 , 查 漏 补 缺 , 编 辑 全 文 。• b1 申 立 平 : 对 斑 头 雁 血 红 蛋 白 研 究 背 景 包 括 现 阶段 的 进 展 做 一 个 详 尽 的 介 绍 。• a1 孔 寅 飞 : 尽 可 能 多 的 运 用 ExPASy 的 各 种 工 具对 该 蛋 白 的 DNA 序 列 进 行 分 析 。• b2 李 东 旭 : 尽 可 能 多 的 运 用 ExPASy 的 各 种 工 具对 该 蛋 白 的 蛋 白 质 序 列 进 行 分 析 。


ExPASy 简 介• ExPASy 是 Expert Protein Analysis System的 缩 写 , 即 为 专 业 蛋 白 质 分 析 系 统 。ExPASy 由 瑞 士 生 物 信 息 学 研 究 所 维 护(Swiss Institute of Bioinformatics), 提供 从 序 列 (Swiss-Prot) 到 结 构 (Swiss-Model), 以 及 2-D PAGE 等 蛋 白 质 操 作 相关 的 全 套 服 务 。ExPASy 汇 总 的 蛋 白 质 组 学在 线 实 用 分 析 工 具 包 , 涉 及 蛋 白 分 类 、 翻译 、 结 构 预 测 、 相 似 检 索 、 序 列 比 对 等 等 。


ExPASy Proteomics tools• [Protein identification and characterization](MS 相 关 )• [DNA -> Protein]• [Similarity searches] ( 序 列 相 关 )• [Sequence alignment]• [Pattern and profile searches](domain/motif 相 关 )• [Post-translational modification prediction]• [Topology prediction]( 定 位 , 跨 膜 相 关 )• [Primary structure analysis]• [Secondary structure prediction]• [Tertiary structure]• [Phylogenetic analysis]( 进 化 相 关 )• [Biological text analysis]( 结 构 相 关 )


第 一 部 分斑 头 雁 背 景 知 识 介 绍


基 本 知 识 :• Anser indicus Latham, 世 界 上 飞 的 最 高 的 鸟 类• 别 名 : 白 头 雁• 英 文 名 :Bar-headed Goose• 斑 头 雁 , 雁 形 目 , 鸭 科 , 雁 属 。 大 雁 的 一 种 , 因 头 上 有 两 条 黑 色 条 斑而 得 名 。 它 体 形 如 鹅 , 重 约 2500-3500 克 , 长 着 桔 红 色 嘴 巴 、 黑 色 嘴唇 、 桔 红 色 腿 脚 , 灰 褐 色 的 羽 翅 , 虹 膜 - 褐 色 ; 嘴 - 鹅 黄 , 嘴 尖 黑 ;脚 - 橙 黄 。 飞 行 高 度 可 达 8000 米 以 上 , 每 日 飞 行 300 到 500 公 里 , 是鸟 类 飞 行 的 一 级 运 动 员 。灰 雁 是 斑 头 雁 的 近 亲 , 生 活 在 欧 洲 和 亚 洲 大 陆 。 栖 息 于 湖 泊 、河 滩 水 域 地 带 。 它 们 却 不 能 承 受 缺 氧 环 境 。 所 以 怀 疑 可 能 是 斑 头 雁的 血 红 蛋 白 和 灰 雁 的 血 红 蛋 白 结 构 有 所 不 同 , 从 而 导 致 它 结 合 氧 的能 力 不 同 。


斑 头 雁 血 红 蛋 白 研 究 背 景 及 进 展 :• 1979 年 Braunitzer G, Oberthür W. 比 对 了 灰 雁 和 鸡 的 血 红 蛋 白 的 α 链和 β 链 , 发 现 灰 雁 的 氨 基 酸 序 列 相 对 于 鸡 的 有 差 异 , 证 明 血 红 蛋 白 确实 存 在 突 变 , 为 上 面 的 对 斑 头 雁 的 推 测 奠 定 了 依 据 。• 1980 年 Black CP, Tenney SM 做 了 一 个 研 究 工 作 , 把 斑 头 雁 和 北 京 鸭( 体 型 和 斑 头 雁 相 当 , 但 生 长 在 地 面 , 不 能 飞 的 鸟 类 ) 的 耐 低 氧 能 力做 了 一 个 比 较 , 发 现 当 把 二 者 都 置 在 高 空 中 时 , 斑 头 雁 没 有 明 显 的 动作 变 化 , 但 北 京 鸭 的 结 合 氧 的 能 力 却 没 有 增 强 。• 1982 年 ,Oberthür W, Braunitzer G, Würdinger I. 等 人 把斑 头 雁 和 灰 雁 的 血 红 蛋 白 氨 基 酸 序 列 进 行 了 分 析 ,, 其 中斑 头 雁 α 链 119 位 Ala 在 灰 雁 中 变 成 了 Pro, 而 斑 头 雁 β 链125 位 Asp 变 成 了 Glu, 这 两 个 氨 基 酸 都 在 血 红 蛋 白 α 链 和β 链 的 结 合 处 。 并 试 图 解 释 了 此 变 化 造 成 斑 头 雁 结 合 氧 能力 强 的 原 因 。


斑 头 雁 血 红 蛋 白 研 究 背 景 及 进 展 :• 1993 年 ,Weber RE, 等 人 将 人 的 血 红 蛋 白 进 行 了 类 似 斑 头 雁 血 红 蛋白 的 突 变 , 发 现 , 突 变 后 的 血 红 蛋 白 确 实 能 够 增 强 和 氧 的 结 合 能 力 。• 1999 年 北 京 大 学 Zhang J, Hua Z. 等 人 解 析 了 斑 头 雁 的 血 红 蛋 白 晶 体结 构 , 证 明 了 斑 头 雁 的 高 结 合 氧 能 力 确 实 是 和 Pro 变 为 Ala 有 关 。通 过 近 二 三 十 年 的 对 斑 头 雁 血 红 蛋 白 的 研 究 , 现 在 已 经 清 楚 的 了 解 了 斑头 雁 血 红 蛋 白 的 结 构 , 以 及 由 于 结 构 的 变 化 而 导 致 斑 头 雁 结 合 氧 能 力 增 强 能在 海 拔 9000 多 米 飞 翔 的 原 因 。 斑 头 雁 血 红 蛋 白 的 研 究 也 成 为 一 个 比 较 有 代 表性 的 例 子 , 为 其 它 近 亲 物 种 由 于 结 构 变 异 引 起 的 功 能 差 异 奠 定 了 很 好 的 基 础与 参 考 。


第 二 部 分斑 头 雁 血 红 蛋 白 的 蛋 白 质 分 析


( 一 ) 蛋 白 序 列 基 本 特 征 分 析• ProtParam tool• Compute pI/Mw• PeptideCutter• PeptideMass• Isotopident


1.ProtParam tool: 蛋 白 质 的 氨 基 酸 组 成 、 分 子 量 、PI 等 基 本 特 征 的 分 析 。将 斑 头 雁 的 血 红 蛋 白 序 列 输 入 该 工 具 中 , 可 以 得 到 如 下 结果 :Number of amino acids: 142Molecular weight: 15467.8Theoretical pI: 8.54Amino acid composition:Ala (A) 19 13.4%Arg (R) 3 2.1%Asn (N) 3 2.1%Asp (D) 7 4.9% ……Total number of negatively charged residues (Asp + Glu): 13Total number of positively charged residues (Arg + Lys): 15Atomic composition:Carbon C 702Hydrogen H 1102Nitrogen N 190Oxygen O 196Sulfur S 4Formula: C 702H 1102N 190O 196S 4Total number of atoms: 2194Extinction coefficients/Estimated half-life /Instability index/Aliphatic index该 软 件 的 分 析 结果 包 括 了 蛋 白 的氨 基 酸 组 成 、 原子 组 成 、 分 子 量 、半 衰 期 、 等 电 点等 全 面 的 基 本 信息 。


2.Compute pI/Mw: 通 过 与 UniProt Knowledgebase 中 蛋 白 的 比 较 计 算 目的 蛋 白 的 理 论 分 子 量 与 等 电 点 。以 斑 头 雁 的 血 红 蛋 白 为 例 , 结 果 如 下 :该 软 件 分 析 结 果 只 能 得 到 蛋 白 质 分 子 量 和 理 论 等 电 点 的 信 息 , 但是 与 上 面 的 分 析 结 果 是 一 致 的 。


3.PeptideCutter: 蛋 白 质 酶 切 分 析以 斑 头 雁 的 血 红 蛋 白 为 例 ,参 数 设 置 :有 多 种 酶 可 供 选 择 , 此 例 中 选 择 Trypsin;Trypsin 和 Chymotrypsin 酶 还 可 以 选 择 酶 切 效 率 , 此 例 中 选 择 酶 切 最 低 效 率 为 100%;结 果 可 以 表 格 形 式 、 图 谱 形 式 等 显 示 , 此 例 中 选 择 以 表 格 形 式 显 示 ;选 择 酶 切 最 低 效 率 为 90% 时 :


4.PeptideMass: 蛋 白 酶 切 得 到 的 肽 段 的 分 子 量 计 算 ( 也 可 以 包 含 翻 译 后修 饰 )以 斑 头 雁 的 血 红 蛋 白 为 例 ,参 数 设 置 :选 择 Trypsin 作 酶 解 分 析 ;Cysteines 在 蛋 白 预 处 理 过 程 中 的 处 理 方 法 也 可 以 进 行 选 择 , 此 例 中 选 择“nothing(in reduced form)”;也 可 以 对 “missed cleavages” 进 行 设 置 , 此 例 中 设 置 为 “0”;还 可 以 对 肽 段 的 显 示 方 式 进 行 选 择 , 包 括 显 示 内 容 和 顺 序 , 此 例 中 选 择 显示 >500 Da 的 肽 段 , 并 按 其 大 小 顺 序 排 列 ;结 果 如 下 :


与 PeptideCutter 比 较 分 析 :PeptideMass 所 得 的 结 果 较 直 观 , 并 且 以 表格 形 式 集 中 显 示 出 所 得 酶 切 肽 段 的 分 子 量 、 氨 基 酸 序 列 及 肽 段 在 整 个 蛋白 中 的 位 置 , 而 且 还 可 以 对 “missed cleavages” 进 行 设 置 。 另 外 , 酶 切肽 段 的 显 示 方 式 也 比 PeptideCutter 更 加 完 善 。


5.Isotopident: 用 来 估 测 蛋 白 或 肽 段 或 多 聚 核 苷 酸 链 中 的 同 位 素 分 布 情 况 ,还 可 以 计 算 出 该 蛋 白 或 肽 段 的 单 一 同 位 素 峰 的 分 子 量 以 及 自 然 情 况 下 最有 可 能 存 在 的 同 位 素 分 布 组 合 并 计 算 出 其 分 子 量 。 这 在 质 谱 数 据 分 析 中很 有 用 。以 斑 头 雁 的 血 红 蛋 白 为 例 , 结 果 如 下 :


( 二 )Protein DNA• Reverse Translate• Genewise


1.Reverse Translate: 用 来 从 蛋 白 质 序 列 推 测 DNA 序 列 , 可 以 用 来 对还 不 知 道 基 因 序 列 的 已 知 蛋 白 进 行 引 物 设 计 。以 斑 头 雁 的 血 红 蛋 白 分 析 为 例 ,参 数 设 置 : 采 用 default codon usage table,结 果 如 下 :>reverse translation of Untitled to a 426 base sequence of most likely codons.atggtgctgagcgcggcggataaaaccaacgtgaaaggcgtgtttagcaaaattagcggccatgcggaagaatatggcgcggaaaccctggaacgcatgtttaccgcgtatccgcagaccaaaacctattttccgcattttgatctgcagcatggcagcgcgcagattaaagcgcatggcaaaaaagtggtggcggcgctggtggaagcggtgaaccatattgatgatattgcgggcgcgctgagcaaactgagcgatctgcatgcgcagaaactgcgcgtggatccggtgaactttaaatttctgggccattgctttctggtggtggtggcgattcatcatccgagcgcgctgaccgcggaagtgcatgcgagcctggataaatttctgtgcgcggtgggcaccgtgctgaccgcgaaatatcgc>reverse translation of Untitled to a 426 base sequence of consensus codons.atggtnytnwsngcngcngayaaracnaaygtnaarggngtnttywsnaarathwsnggncaygcngargartayggngcngaracnytngarmgnatgttyacngcntayccncaracnaaracntayttyccncayttygayytncarcayggnwsngcncarathaargcncayggnaaraargtngtngcngcnytngtngargcngtnaaycayathgaygayathgcnggngcnytnwsnaarytnwsngayytncaygcncaraarytnmgngtngayccngtnaayttyaarttyytnggncaytgyttyytngtngtngtngcnathcaycayccnwsngcnytnacngcngargtncaygcnwsnytngayaarttyytntgygcngtnggnacngtnytnacngcnaartaymgn


同 时 它 还 给 出 了 , 每 个 氨 基 酸 所 对 应 的 密 码 子 的 每 个 位 置 的 核 苷 酸 的 出 现 概 率 , 如 下 :Graph of base probabilities:……3_L_firstg 0.00a 0.00TTTTTTTTTTTTTTTTTTTTTTTTTTT 0.26CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC 0.743_L_secondg 0.00a 0.00TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT 1.00C 0.003_L_thirdgggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggg 0.62aaaaaaaaaaaaaaaaaa 0.17TTTTTTTTTTT 0.11CCCCCCCCCCC 0.10……该 软 件 除 了 可 以 选 择 所 使 用 的 密 码 子 的 优 点 外 , 还 具 有 在 结 果 显 示 每 个 氨 基 酸 所 对 应 的 密 码子 的 每 个 位 置 的 核 苷 酸 的 出 现 概 率 的 优 点 。


2.Genewise: 可 以 将 一 个 蛋 白 序 列 与 某 一 个 基 因 组 DNA 序 列 进 行 比 较 , 适合 寻 找 还 不 知 道 基 因 的 蛋 白 的 同 源 基 因 。将 斑 头 雁 的 血 红 蛋 白 序 列 与 与 Rat 的 血 红 蛋 白 基 因 的 CDs 序 列 进 行 比 对 , 得到 如 下 结 果 :


( 三 ) 蛋 白 序 列 比 对• BLAST• Fasta3• MPsrch


1.BLAST: 用 来 寻 找 蛋 白 的 同 源 序 列 , 再 根 据 同 源 蛋 白 的 已 知 信 息 来 推 测 未知 蛋 白 的 相 关 信 息 。BLAST 根 据 所 使 用 数 据 库 和 不 同 软 件 有 多 种 方 法 , 在 此仅 以 在 ExPASy 中 对 斑 头 雁 的 血 红 蛋 白 序 列 进 行 BLAST 为 例 :从 BLAST 结 果 中 可 以 看 到 , 目 的 蛋 白 跟 Hemoglobin subunit 有 很 高 的 同 源 性 ,若 我 们 不 知 道 目 的 蛋 白 是 斑 头 雁 的 血 红 蛋 白 的 话 , 便 由 此 推 测 目 的 蛋 白 可 能 与 血 红蛋 白 在 结 构 或 功 能 上 相 似 。


2.Fasta3: 用 FASTA 和 SSEARCH programs 进 行 蛋 白 相 似 序 列 的 搜 索 。以 斑 头 雁 的 血 红 蛋 白 为 例 :


3.MPsrch:a biological sequence comparison tool that implements thetrue Smith and Waterman algorithm.以 斑 头 雁 的 血 红 蛋 白 为 例 :


上 述 三 种 工 具 的 比 较 :Fasta3 所 使 用 的 SSEARCH 严 格 按 照 Smith-Waterman 原理 进 行 相 似 序 列 搜 索 ,FASTA 则 对 于 低 相 似 性 的 长 序列 分 析 比 对 具 有 专 一 性 ;MPsrch 目 前 被 认 为 是 最 灵 敏的 序 列 比 对 工 具 , 也 是 使 用 Smith-Waterman 原 理 , 但它 利 用 了 exhaustive algorithm, 而 BLAST and FASTA仅 仅 是 启 发 式 的 。


( 四 ) 一 级 结 构 分 析• Three-/one-letter amino acid converter• ScanSite pI/Mw


1.Three-/one-letter amino acid converter: 可 以 将 蛋 白 氨 基 酸 序 列 由 三 个 字母 显 示 转 换 成 一 个 字 母 显 示 , 反 之 亦 然 。以 斑 头 雁 的 血 红 蛋 白 为 例 :One letter sequence:> 142 aminoacids; Mw=15469.79DaMVLSAADKTNVKGVFSKISGHAEEYGAETLERMFTAYPQTKTYFPHFDLQHGSAQIKAHGKKVVAALVEAVNHIDDIAGALSKLSDLHAQKLRVDPVNFKFLGHCFLVVVAIHHPSALTAEVHASLDKFLCAVGTVLTAKYR*Three letter sequence:> 142 aminoacids; Mw=15469.79DaMetValLeuSerAlaAlaAspLysThrAsnValLysGlyValPheSerLysIleSerGlyHisAlaGluGluTyrGlyAlaGluThrLeuGluArgMetPheThrAlaTyrProGlnThrLysThrTyrPheProHisPheAspLeuGlnHisGlySerAlaGlnIleLysAlaHisGlyLysLysValValAlaAlaLeuValGluAlaValAsnHisIleAspAspIleAlaGlyAlaLeuSerLysLeuSerAspLeuHisAlaGlnLysLeuArgValAspProValAsnPheLysPheLeuGlyHisCysPheLeuValValValAlaIleHisHisProSerAlaLeuThrAlaGluValHisAlaSerLeuAspLysPheLeuCysAlaValGlyThrValLeuThrAlaLysTyrArg***蛋 白 质 结 构 数 据 库 (PDB) 用 三 字 符 缩 写 表 示 , 而 蛋 白 质 序 列 、家 族 、 功 能 等 数 据 库 用 单 字 符 代 码 表 示 , 以 减 少 存 储 空 间 , 提 高 数据 库 搜 寻 速 度 。 常 用 序 列 分 析 软 件 也 用 单 字 符 表 示 。 因 此 , 该 软 件 使用 频 率 较 高 , 是 蛋 白 分 析 的 基 本 软 件 。


2.ScanSite pI/Mw: 可 以 计 算 蛋 白 在 各 种 磷 酸 化 状 态 下 的 分 子 量 及 等 电 点 。以 斑 头 雁 的 血 红 蛋 白 为 例 :该 软 件 可 用 于 等 点 聚 焦 分 离 具 有 多 种 磷 酸 化 修 饰 状 态 的 磷 酸 化 蛋 白的 分 析 。


( 五 ) 二 级 结 构 分 析• GOR• SOPMA


1.GOR: 蛋 白 质 二 级 结 构 预 测 。 斑 头 雁 的 血 红 蛋 白 为 例 :该 软 件 可 以 预 测 分 析 蛋 白 的 helix,sheet,coil 等 二 级 结 构 。


2.SOPMA: 蛋 白 质 二 级 结 构 预 测 。 以 斑 头 雁 的 血 红 蛋 白 为 例 :该 软 件 功 能 与 GOR 功 能 差 不 多 , 所 得 结 果 稍 微 有 些 差 别 , 可能 是 由 于 原 理 的 差 别 而 造 成 的 。


( 六 ) 翻 译 后 修 饰 分 析• ProP• NetPhos


1.ProP: 分 析 蛋 白 质 中 赖 氨 酸 和 精 氨 酸 的 断 开 位 点 , 以 斑 头 雁 的 血 红 蛋 白 为 例 :该 软 件 功 能 与 Trypsin 酶 切 功 能 有 些 相 似 。


2.NetPhos: 分 析 蛋 白 质 中 serine, threonine 及 tyrosine 的 磷 酸 化 位 点 。以 斑 头 雁 的 血 红 蛋 白 为 例 :该 软 件 对 于 蛋 白质 的 磷 酸 化 位 点 分 析及 预 测 很 有 价 值 。


第 三 部 分斑 头 雁 血 红 蛋 白 DNA 序 列 分 析


考 虑 到 Expasy 是 主 要 分 析 蛋 白 质 序 列 的 , 我 们 对 该 网 站上 可 以 用 以 分 析 DNA 的 软 件 也 进 行 了 尝 试 , 在 这 里 只 是 略讲 。主 要 有 一 下 工 具 :Codon PlotCodon UsageCpG IslandsDNA Molecular WeightDNA Pattern FindORF FINDERPairwise Align DNA


Codon Plot 可 以 对 DNA 序 列 的 密 码 子 组 成 进 行 分 析 , 也 可 以 分 析 出 相应 的 氨 基 酸 的 出 现 频 率 以 及 该 密 码 子 出 现 的 概 率 。Codon Usage 可 以 得 出 密 码 子 出 现 的 概 率 , 也 可 以 得 出 各 个 氨 基 酸 的简 并 密 码 子 的 频 率 。CpG Islands 可 以 分 析 GC 含 量 , 可 以 通 过 该 软 件 的 分 析 设 计 一 定 的 片段 克 隆 的 引 物 , 并 判 断 引 物 的 退 火 温 度 。DNA Molecular Weight 分 析 DNA 的 分 子 质 量 。DNA Pattern Find 可 以 用 来 分 析 连 续 氨 基 酸 出 现 的 频 率 , 可 进 而 分 析氨 基 酸 Group 在 该 蛋 白 中 的 作 用 。ORF FINDER 可 以 分 析 不 同 的 翻 译 可 能 性 , 直 接 翻 译 出 相 应 的 蛋 白 。Pairwise Align DNA 可 以 用 来 进 行 保 守 性 分 析 , 进 而 分 析 功 能 结 构 上的 进 化 同 源 性 。


致 谢• 罗 老 师• 任 娇• 申 立 平• 孔 寅 飞

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!