Lid
Lab
Laboratory of Biological Networks
  • 12月 06

    2013 | 课题组建立面向染色体蛋白质组学数据分析的生物信息工作流

        作为人类蛋白质组计划(HPP)的重要组成部分,国际染色体蛋白质组计划(C-HPP)于2011年在瑞士日内瓦由HUPO启动。C-HPP计划旨在识别每条人类染色体上基因编码的所有蛋白质,同时获取它们相关的丰度、组织表达特异性、亚细胞定位、翻译后修饰和相互作用组等信息。为了更好的推动此项目,C-HPP组织采用了“chromosome-by-chromosome”的研究策略,人类24条染色体和线粒体的研究任务分别由全球25个研究团队承担。C-HPP计划的实施产生了大量蛋白质组数据集。如何从这些不同来源、类型和置信水平的大规模高通量数据集中挖掘生物学知识是亟待解决的课题。一个整合不同分析工具、满足科研人员不同研究需求、具有良好交互性的生物信息学研究平台是不可或缺的。 

        针对这一问题,北京蛋白质组研究中心联合北京健数通科技有限公司,构建了基于工作流的在线C-HPP数据分析和可视化平台——CAPER 2.0(http://www.bprc.ac.cn/CAPE)。与其他同类型的软件平台相比,该平台的配置性、交互性与扩展性大大提升,同时整合了进行C-HPP分析的多种工具,包括发现“缺失蛋白”、将鉴定到的肽段映射到染色体、整合C-HPP与ENCODE数据集及蛋白质功能注释等。该平台同时整合了一个可配置的工作流系统,支持工作流的展示、编辑、运行与分享。该项工作近期已在Journal of Proteome Research在线发表(http://pubs.acs.org/doi/abs/10.1021/pr400795c)。 
        该论文的第一作者是北京蛋白质组研究中心生物学网络研究课题组王聃硕士生、刘中扬助理研究员和郭非非博士生,责任作者是贺福初院士和李栋副研究员。2013年1月,该研究小组曾经在同一杂志上发表了人类蛋白质组学浏览器CAPER(
    http://pubs.acs.org/doi/abs/10.1021/pr300831z)。CAPER 2.0是CAPER的升级版本,它不仅保留了CAPER前一版本基于轨道(Track)与热图(Heatmap)的蛋白质组学数据可视化功能,同时还整合了工作流和软件仓,在当前生物大数据研究的背景下,这些功能特点有利于解决染色体蛋白质组甚至是蛋白质组学数据的数据分析问题。

    1.PNG