21.04.2015 Views

对人癌胚抗原相关蛋白质的生物信息学工具分析 - abc

对人癌胚抗原相关蛋白质的生物信息学工具分析 - abc

对人癌胚抗原相关蛋白质的生物信息学工具分析 - abc

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

对 人 癌 胚 抗 原 相 关 蛋 白 质 的 生 物 信 息 学 工 具 分 析<br />

水 稻 组 .. 龚 俊 义 潘 哲 超 吕 桂 云 张 春 秋<br />

人 癌 胚 抗 原 是 一 种 富 含 多 糖 的 蛋 白 复 合 物 , 主 要 存 在 于 直 、 结 肠 癌 组 织 和 胎 儿 肠 粘 膜 内 , 属 性 为 膜<br />

表 面 蛋 白 质 。 在 个 体 发 育 过 程 中 , 人 癌 胚 抗 原 蛋 白 只 在 胎 儿 时 期 大 量 表 达 , 随 着 发 育 过 程 的 不 断 深 入 ,<br />

许 多 人 癌 胚 抗 原 的 表 达 明 显 减 少 甚 至 停 滞 表 达 。 成 年 细 胞 发 生 癌 变 后 会 出 现 去 分 化 现 象 , 导 致 原 先 被<br />

关 闭 表 达 的 人 癌 胚 抗 原 再 次 活 跃 起 来 , 重 新 达 到 胎 儿 时 期 的 表 达 状 态 。 基 于 其 生 理 功 能 的 重 要 性 , 研<br />

究 人 癌 胚 抗 原 应 该 具 有 很 强 烈 的 现 实 意 义 。<br />

分 析 之 一 : 人 癌 胚 抗 原 相 关 蛋 白 质 的 序 列 搜 索 与 比 对<br />

通 过 ExPASy 搜 索 获 得 17 条 与 关 键 词 “carcinoembryonic antigen” 相 关 的 蛋 白 质 序 列 , 分 别 是 :<br />

CEA16_HUMAN (Q2WEN9)、CEA19_HUMAN (Q7Z692)、CEA20_HUMAN (Q6UY09)、<br />

CEA21_HUMAN (Q3KPI0)、CEAB_RAT (Q10753)、CEAM1_HUMAN (P13688)、CEAM1_MOUSE<br />

(P31809)、CEAM1_RAT (P16573)、CEAM2_MOUSE (Q925P2)、CEAM3_HUMAN (P40198)、<br />

CEAM3_RAT (Q63111)、CEAM5_HUMAN (P06731)、CEAM6_HUMAN (P40199)、CEAM7_HUMAN<br />

(Q14002)、CEAM8_HUMAN (P31997)、CEAMA_MOUSE (Q61400) 和 PSG3_HUMAN (Q16557)。 其<br />

中 CEAB_RAT (Q10753) 只 有 部 分 序 列 ,CEAM5_HUMAN (P06731) 为 当 前 研 究 较 为 深 入 的 蛋 白 质 。<br />

蛋 白 质 序 列 比 对 的 信 息 如 下 :<br />

(1)CEAM5_HUMAN 自 身 序 列 的 Dotmatcher 和 Dottup 比 对<br />

可 以 看 出 :CEAM5_HUMAN 自 身 序 列 内 部 存 在 不 同 程 度 的 序 列 重 复 , 这 些 重 复 序 列 与 后 面 将 要 研<br />

究 的 免 疫 球 蛋 白 结 构 域 又 有 如 何 的 关 联 呢 ? 需 要 接 下 来 的 进 一 步 工 具 分 析 。


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

(2)17 条 蛋 白 质 信 息 的 Poly dotplot 比 对 :<br />

可 以 看 出 :CEA16_HUMAN (Q2WEN9)、CEA19_HUMAN (Q7Z692) 和 CEA20_HUMAN (Q6UY09)、<br />

三 个 序 列 之 间 以 及 与 其 它 14 个 序 列 之 间 的 序 列 差 异 很 大 ,Poly dotplot 比 对 结 果 中 几 乎 找 不 到 重 叠 片<br />

段 。 发 现 序 列 CEAM3_RAT 自 身 比 对 结 果 中 有 众 多 杂 点 区 , 显 示 出 该 序 列 存 在 许 多 小 片 段 的 重 复 。<br />

还 发 现 序 列 CEAM5_HUMAN 与 CEAM1_HUMAN、CEAM6_HUMAN 、CEAM8_HUMAN 三 个 序<br />

列 间 存 在 较 大 片 段 的 重 复 。 为 了 看 一 看 它 们 相 互 之 间 的 详 细 序 列 位 点 差 异 , 我 们 有 必 要 进 行 以 下 初 步<br />

蛋 白 质 信 息 分 析 和 Clustalw 全 序 列 信 息 比 对 分 析 。


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

(3)Showalign 和 emma 分 析 17 条 蛋 白 质 信 息 :


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

(4)Needle 和 Water 分 析 17 条 蛋 白 质 信 息 :<br />

Alignment<br />

Alignment length scope identity similarity gaps<br />

pairs<br />

types<br />

CEAM5&CEA16 needle 772 450.5 18.5% 28.1% 46.4%<br />

water 401 474.5 31.4% 46.9% 8.7%<br />

CEAM5&CEA19 needle 723 148.5 11.8% 19.6% 61.4%<br />

water 395 157 20.3% 33.9% 34.7%<br />

CEAM5&CEA20 needle 798 587 21.6% 33.6% 38.7%<br />

water 521 601 29.2% 45.5% 18.2%<br />

CEAM5&CEA21 needle 722 551 17.6% 22.7% 62.2%<br />

water 254 564.5 46.5% 59.1% 6.7%<br />

CEAM5&CEAM1 needle 722 1604.5 45.6% 52.2% 29.9%<br />

water 520 1612 62.7% 71.7% 5.0%<br />

CEAM5&CEAM1-MO needle 715 1025 33.3% 43.8% 29%<br />

water 555 1028.5 42.2% 54.8% 11.4%<br />

CEAM5&CEAM1-RA needle 706 974 32.2% 43.5% 27.1%<br />

water 567 975 40% 54.1% 9.5%<br />

CEAM5&CEAM2-MO needle 720 995.5 31.8% 43.1% 30.3%<br />

water 560 999 40.2% 53.8% 13.2%<br />

CEAM5&CEAM3 needle 741 623 18.8% 20.9% 71.3%<br />

water 154 639.5 80.5% 84.4% 2.6%<br />

CEAM5&CEAM3-RA needle 904 500.5 21.2% 30.5% 43.9%<br />

water 792 503.5 24.2% 34.8% 36.2%<br />

CEAM5&CEAM6 needle 702 1432 39% 40.9% 51%<br />

water 323 1443 83.9% 87.3% 0%<br />

CEAM5&CEAM7 needle 711 825 23.2% 26.9% 64%<br />

water 245 832.5 65.7% 75.5% 2.9%


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

CEAM5&CEAM8 needle 707 1255.5 34.9% 38.3% 51.3%<br />

water 314 1272 76.8% 82.8% 0%<br />

CEAM5&CEAMA-MO needle 704 343.5 14.6% 20.3% 62.6%<br />

water 297 352 33% 45.8% 19.2%<br />

CEAM5&CEAPSG needle 711 1135.5 33.6% 40.8% 41.1%<br />

water 496 1143 47.4% 57.7% 17.5%<br />

可 以 看 出 , 就 全 局 比 对 而 言 ,CEAM1_HUMAN 与 CEAM5_HUMAN 的 序 列 相 似 性 最 高 , 为 52.2%;<br />

就 局 部 比 对 而 言 ,CEAM1_HUMAN、CEAM3_HUMAN、CEAM6_HUMAN、CEAM7_HUMAN、<br />

CEAM8_HUMAN 都 与 CEAM5_HUMAN 存 在 较 高 的 序 列 相 似 性 。 就 与 CEAM5_HUMAN 的 整 体 比<br />

对 效 果 而 言 ,CEAM1_HUMAN 综 合 成 绩 应 该 是 最 好 的 。 同 时 我 们 还 可 以 发 现 , 尽 管 人 和 大 、 小 鼠 的<br />

形 态 差 异 较 大 , 但 是 CEAM1_MOUSE、CEAM1_RAT 和 CEAM2_MOUSE 三 个 蛋 白 质 序 列 与 人 的<br />

CEAM5_HUMAN 也 存 在 较 高 的 序 列 相 似 性 。<br />

(4)Clustalw 全 序 列 分 析 16 条 蛋 白 质 ( 除 去 了 其 中 的 CEAB_RAT) 信 息 :


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

可 以 看 出 ,16 个 序 列 内 部 存 在 一 定 的 氨 基 酸 残 基 位 点 , 是 哪 一 些 具 体 的 位 点 保 守 呢 ? 这 些 位 点 的<br />

变 异 范 围 又 如 何 呢 ? 这 些 疑 问 又 需 要 依 赖 下 面 的 相 关 蛋 白 质 的 保 守 基 序 和 进 化 树 分 析 结 果 来 予 以 说<br />

明 。<br />

分 析 之 二 : 人 癌 胚 抗 原 相 关 蛋 白 质 的 保 守 基 序 和 进 化 树 分 析<br />

(1)MEME 分 析 :<br />

MOTIFS ./meme.html (peptide)<br />

MOTIF WIDTH BEST POSSIBLE MATCH<br />

----- ----- -------------------<br />

1 50 TASLLTFWNPPTTAQVTIEAMPFNVAEGKEVLLLVHNLPQHLFGYSWYKG<br />

2 50 PGPAYSGRETIYPNGSLLFQNVTMNDTGFYTLHMIKRDFKNEEATGQFHV<br />

3 50 WWFNGQSLPVSDRLQLSEGNRTLTLFNVRRNDAGPYECEIWNPVSANRSD<br />

4 50 HPGENLNLSCHAASNPPAQYFWFINGKFQQSTQELFIPNITTNNSGSYMC<br />

5 29 PKPSITSNNSNPVEDKDAVAFTCEPETQN


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

>P06731|CEAM5_HUMAN( start=21 )TASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKG<br />

>P13688|CEAM1_HUMAN( start= 21 )TASLLTFWNPPTTAQLTTESMPFNVAEGKEVLLLVHNLPQQLFGYSWYKG<br />

>P40198|CEAM3_HUMAN( start= 21 )TASLLNFWNPPTTAKLTIESMPLSVAEGKEVLLLVHNLPQHLFGYSWYKG<br />

>P40199|CEAM6_HUMAN( start= 21 )TASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKG<br />

>P31997|CEAM8_HUMAN( start= 21 )TASLFTFWNPPTTAQLTIEAVPSNAAEGKEVLLLVHNLPQDPRGYNWYKG<br />

>Q16557|PSG3_HUMAN( start= 21 )TALLLNFWNLPTTAQVTIEAEPTKVSKGKDVLLLVHNLPQNLAGYIWYKG


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

>Q14002|CEAM7_HUMAN( start= 21 )TASLLTFWNLPNSAQTNIDVVPFNVAEGKEVLLVVHNESQNLYGYNWYKG<br />

>Q61400|CEAMA_MOUSE( start= 21 )TASLLTYWSPATTAQVTVEAVPPNVTADNNVLLLVHNLPQTLRVFYWYKG<br />

>P31809|CEAM1_MOUSE( start= 21 )TASLLASWSPATTAEVTIEAVPPQVAEDNNVLLLVHNLPLALGAFAWYKG<br />

>Q63111|CEAM3_RAT( start= 21 )TASLLTCWLLPTTAQVSIESLPPQVVEGENVLLHVDNLPENLIAFVWYKG<br />

>Q3KPI0|CEA21_HUMAN( start= 21 )TASLLTFWNAPTTAWLFIASAPFEVAEGENVHLSVVYLPENLYSYGWYKG<br />

>P16573|CEAM1_RAT( start= 21 )TASLLTYWSPLTTAQVTVDAVPPNVVEESSVLLLTHNLPQEFQVFYWYKV<br />

>Q925P2|CEAM2_MOUSE( start= 21 )TASLLASWSPPTTAQVTVMAFPLHAAEGNNVILVVYNMMKGVSAFSWHKG<br />

>Q2WEN9|CEA16_HUMAN( start= 66 )SWLLLSATFLNVGAEISITLEPAQPSEGDNVTLVVHGLSGELLAYSWYAG<br />

>Q6UY09|CEA20_HUMAN( start= 17 )SASLCTVWSPPAAAQLTLNANPLDATQSEDVVLPVFGTPRTPQIHGRSRE<br />

(2)Weblog 分 析 :<br />

可 以 看 出 在 这 些 蛋 白 质 序 列 中 存 在 着 部 分 位 点 的 氨 基 酸 残 基 的 不 同 程 度 的 保 守 性 , 如 上 图 中 的 4<br />

位 的 P、14 位 的 A、22 位 的 P、31 位 的 V 和 33 位 的 L。 这 些 保 守 氨 基 酸 残 基 对 于 该 类 蛋 白 的 功 能 表<br />

现 的 作 用 如 何 , 有 赖 于 从 上 述 蛋 白 质 的 三 维 结 构 中 得 到 些 许 证 实 , 可 惜 , 当 前 该 类 蛋 白 的 结 构 研 究 很<br />

少 。<br />

(3) 进 化 树 分 析 :<br />

由 此 对 基 序 1 进 行 的 进 化 树 分 析 图 可 以 初 步 得 出 上 述 几 种 蛋 白 之 间 的 进 化 关 系 , 结 果 与 前 面 进<br />

行 的 序 列 比 对 结 果 差 异 较 大 , 不 仅 说 明 比 对 与 进 化 树 构 建 两 种 分 析 途 径 的 不 同 , 也 说 明 CEA 家<br />

族 成 员 内 部 之 间 的 明 显 差 异 性 , 研 究 CEA 家 族 面 临 的 困 难 可 能 要 超 过 以 往 。


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

(1)SMART 分 析 :<br />

分 析 之 三 : 人 癌 胚 抗 原 相 关 蛋 白 质 的 结 构 域 和 跨 膜 分 析<br />

>Q2WEN9|CEA16_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 16 - Homo sapiens (Human).<br />

>Q7Z692|CEA19_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 19 - Homo sapiens (Human).<br />

Immunoglobulin V-set domain<br />

>Q6UY09|CEA20_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 20 - Homo sapiens (Human).<br />

>Q3KPI0|CEA21_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 21 - Homo sapiens (Human).<br />

>P13688|CEAM1_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 1 - Homo sapiens (Human).<br />

>P31809|CEAM1_MOUSE Carcinoembryonic antigen-related cell adhesion molecule 1 - Mus musculus (Mouse).<br />

>P16573|CEAM1_RAT Carcinoembryonic antigen-related cell adhesion molecule 1 - Rattus norvegicus (Rat)


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

>Q925P2|CEAM2_MOUSE Carcinoembryonic antigen-related cell adhesion molecule 2 - Mus musculus (Mouse).<br />

>P40198|CEAM3_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 3 - Homo sapiens (Human).<br />

>Q63111|CEAM3_RAT Carcinoembryonic antigen-related cell adhesion molecule 3 - Rattus norvegicus (Rat).<br />

>P06731|CEAM5_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 5 - Homo sapiens (Human).<br />

>P40199|CEAM6_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 6 - Homo sapiens (Human).<br />

>Q14002|CEAM7_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 7 - Homo sapiens (Human).<br />

>P31997|CEAM8_HUMAN Carcinoembryonic antigen-related cell adhesion molecule 8 - Homo sapiens (Human).


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

>Q61400|CEAMA_MOUSE Carcinoembryonic antigen-related cell adhesion molecule 10 - Mus musculus (Mouse).<br />

>Q16557|PSG3_HUMAN Pregnancy-specific beta-1-glycoprotein 3 - Homo sapiens (Human).<br />

SMART 分 析 可 以 初 步 解 释 在 前 面 序 列 比 对 中 出 现 的 重 复 点 阵 区 应 该 是 免 疫 球 蛋 白 结 构 域 区 , 也 可<br />

以 一 定 程 度 上 解 释 出 CEA5 与 CEA3 的 综 合 相 似 程 度 高 , 还 可 以 看 出 CEA 家 族 成 员 普 遍 具 有 免 疫 球<br />

蛋 白 结 构 域 , 从 这 一 点 出 发 , 可 以 利 用 已 知 的 免 疫 球 蛋 白 三 维 结 构 来 推 测 未 知 结 构 的 CEA 家 族 蛋 白 。<br />

(2)TopPred 分 析 :


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4


生 物 信 息 学<br />

caas07f1b6 caas07f1e3 caas07f1d3 caas07f1d4<br />

结 果 表 明 上 述 蛋 白 质 都 存 在 非 常 明 显 的 跨 膜 区 域 , 这 些 特 点 对 于 研 究 相 关 抗 原 蛋 白 的 详 细 功 能<br />

应 该 有 用 。 下 一 步 , 可 以 考 虑 参 照 免 疫 球 蛋 白 结 构 来 预 测 人 癌 胚 抗 原 蛋 白 的 三 维 结 构 , 具 体 分 析<br />

还 有 待 于 本 小 组 成 员 的 进 一 步 学 习 。

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!