当今分子生物学领域内,蛋白质组已成为研究的热点。基因组相对较稳定,而且各种细胞或生物体的基因组结构有许多基本相似的特征;蛋白质组是动态的,随内外界刺激而变化。对蛋白质组的研究可以使我们更容易接近对生命过程的认识。但同时对数千种(甚至更多)蛋白质特性的研究也提出了一个很大的技术挑战。双向凝胶电泳(2DE,DIGE-2D等)、质谱技术(ICAT,iTRAQ,label-free,SELDI-TOF-MS等)、酵母双杂交技术以及生物信息学的发展在一定程度上解决了这一技术难题。
目前蛋白质组相关技术:
1、双向凝胶电泳
1.1 2DE
双向凝胶电泳是将不同种类的蛋白质按照等电点和分子量差异进行高分辨率分离的分析方法。成功的二维电泳可以将2000到3000种蛋白质进行分离,是目前唯一的同时能分离成百上千种蛋白质的工具。通过对蛋白质双向电泳的图谱扫描,用相关软件(PDQUEST等)进行图谱差异分析,找到差别点。然后把差别点切出,进行脱色、酶解。最后样品进入质谱测试,得到质谱原始数据文件。通过搜库可得到差别点蛋白质的详细信息。
原理:
1、根据蛋白质的等电点(第一向)和分子量(第二向)的不同进行分离。
2、电泳后根据蛋白质的上样量对胶进行考马斯亮兰染色、银染或荧光染色,然后用相关软件对电泳图象进行分析。
1.2 DIGE-2D
Ettan DIGE荧光差异蛋白表达分析系统在传统双向电泳技术的基础上,结合了多重荧光分析的方法,在同一块胶上共同分离多个分别由不同荧光标记(Cy2,Cy3,Cy5)的样品,并第一次引入了内标的概念,极大地提高了结果的准确性,可靠性和重复性。在DIGE技术中,每个蛋白点都有它自己的内标,并且软件全自动根据每个蛋白点的内标对其表达量进行校准,保证所检测到的蛋白丰度变化是真实的。DIGE技术可检测到样品间小于10%的蛋白表达差异,统计学可信度达到95%以上。利用Ettan DIGE技术还可以对微量(少到5μg)样本进行蛋白质组学分析。
原理:
2、质谱技术
2.1 iTRAQ
iTRAQ (isobaric tags for relative and absolute quantitation)技术是由美国应用生物系统公司ABI 研发的一种多肽体外标记技术。该技术采用4种或8种同位素编码的标签,通过特异性标记多肽的氨基基团,尔后进行串联质谱分析,可同时比较4种或8种不同样品中蛋白质的相对含量或绝对含量。iTRAQ的4种同位素标记试剂由4种相对分子质量分别为114、115、116和117的报告基团(reporter group),相对分子质量分别为31、30、29 和28 的质量平衡基团(balance group)以及一个相同的肽反应标记试剂基团(peptide reactive group)组成。不同的报告基团分别与相应的平衡基团相配后,相对分子质量均为145,即等量异位标签(isobaric tag)。其原理是首先将蛋白质裂解为肽段,然后用iTRAQ试剂进行差异标记。由于iTRAQ试剂是等量的,即不同同位素在标记同一多肽后在第一级质谱检测,分子量完全相同,用串联质谱方法对在第一级质谱检测到前体离子(precursor ion)进行碰撞诱导解离,产物离子通过第二级质谱进行分析。在二级质谱分析过程中,报告基团、质量平衡基团和多肽反应基团之间的键断裂,质量平衡基团丢失,产生低质荷比(m/z)的报告离子。由于二级质谱可分析相对分子质量相差1的报告基团,不同报告基团离子强度的差异就代表了它所标记的多肽的相对丰度。同时,多肽内的酰胺键断裂,形成一系列b 离子和y 离子,得到离子片段的质量数,通过数据库查询和比较,可以鉴定出相应的蛋白质前体。
2.2 label-free
无标记的质谱定量方法(lable-free)只需分析大规模鉴定蛋白时所产生的质谱数据, 用蛋白相应肽段的质谱数据进行定量。非标记定量技术在定量蛋白质组学研究中受到了众多科学工作者的推崇。目前,已经有一系列配套的非标记定量分析软件,其中包括的GE公司开发的DeCyder MSTM商业化软件,实践证明其具有很好的定量准确性和可信性。
原理:
DeCyder MSTM软件对液相色谱串联质谱数据非标记定量分析是将质谱数据由谱峰形式转化为直观的类似双向凝胶的图谱,谱图上每一个点代表一个肽段,而不是蛋白质;再比较的不同样本上相应肽段的强度,从而对肽段对应的蛋白质进行相对定量。
2.3 SELDI-TOF-MS
表面增强激光解析电离行时间质谱( SELDI-TOF- MS)其主要有三部分组成:蛋白质芯片(Protein Chip)、芯片阅读器(protein chip reader)和分析软件。
1) 蛋白质芯片是SELDI-TOF MS的核心技术。根据芯片表面修饰的不同可分为:化学表面芯片和生物表面芯片。化学表面芯片又可分为疏水(hydrophobic surface ,H4)、亲水(normal phase,NP)、弱阳离子交换(weak cation exchange,WCX)、强阴离子交换(strong anion exchange,SAX)、金属离子鳌合(immobilized metal affinity capture,IMAC)等。这些芯片可以根据蛋白质的化学特性如疏水或亲水性及所带电荷而选择性的捕获特异蛋白质。
其优点是:
①直接用粗生物样品进行分析,如血清,尿,体液
②少量样品,只需0.5-5ul,或2000个细胞即可检测
③高通量,操作自动化
④可发现低丰度,小分子量蛋白质,并能测定疏水蛋白质特别是膜蛋白质
⑤灵敏度高
⑥同时快速发现多个生物标记物⑦在同一系统中集分离,纯化,鉴定,检测和数据分析为一体,快捷方便。而生物表面芯片可分为抗原-抗体、受体-配体、DNA-蛋白质、酶等芯片。
其原理是抗原、抗体结合或供体、受体结合从而分离某一特异蛋白质。
其特点是:
①特异性高(如利用单克隆抗体芯片,可鉴定未知抗原/蛋白质,以减少测定蛋白质序列的工作量)
②可以定量(如利用单克隆抗体芯片,由于结合至芯片上的抗体是定量的,故可以测定抗原量,但一般飞行质谱不能用于定量分析);
③功能广(如利用单克隆抗体芯片不仅可替代Western Blot,还可以弥补流式细胞仪不足的功能,如将细胞溶解,可测定细胞内的抗原,而且灵敏度和特异性远高于流式细胞仪)。
2) 芯片阅读器,就是激光解析电离飞行时间质谱仪。其通过激光脉冲辐射将样品转化为运动的气态离子并按质荷(M/Z)大小进行分离,根据不同质荷比在电场中飞行时间长短不一,从而绘制出一张质谱图。
3) 分析软件,是用来处理实验所得的数据。通过对已知数据进行差异性分析,从而发现有鉴别意义的峰值变化。
SELDI-TOF MS技术操作步骤:
1) 被分析的样品直接点样到芯片阵列进行反应,样品中的蛋白特异性结合到具有生化特性的“芯池”上进行反应。
2) 冲洗芯片,把未结合的蛋白和非特异性结合的蛋白洗脱掉,从而除去了样品“噪声”。
3) 在剩下的特异结合的蛋白质样品中加入基质(能量吸收物质 energy absorbing molecule,EAM),当激光照射芯片时,它能把激光的能量转化为热能。
4) 样品中的蛋白质吸收能量后,被解吸而发生离子化。这些离子化的蛋白质在电场力的作用下,通过真空管飞到离子检测器,其中最小的离子化蛋白质飞得最快而最先到达离子检测器而被确定。这样质荷比不同其飞行时间不同,所以不同的蛋白质即可根据质荷比而被分离。
3、酵母双杂交技术
酵母双杂交系统的建立得力于对真核生物调控转录起始过程的认识。细胞起始基因转录需要有反式转录激活因子的参与。转录激活因子在结构上是组件式的(modular), 即这些因子往往由两个或两个以上相互独立的结构域构成, 其中有DNA结合结构域(DNA binding domain, 简称为DB)和转录激活结构域(activation domain, 简称为AD), 它们是转录激活因子发挥功能所必需的。 单独的DB虽然能和启动子结合, 但是不能激活转录,而不同转录激活因子的DB和AD形成的杂合蛋白具有激活转录的功能。DB与AB分别能与多肽X和Y结合,由DB和AD形成的融合蛋白现在一般分别称之为“诱饵”(bait)和“猎物”或靶蛋白(prey or target protein)。如果在X和Y之间存在相互作用, 那么分别位于这两个融合蛋白上的DB和AD就能形成有活性的转录激活因子, 从而激活相应基因的转录与表达。这个被激活的、能显示“诱饵”和“猎物”相互作用的基因称之为报道基因(reporter gene)。 通过对报道基因表达产物的检测, 反过来可判别作为“诱饵”和“猎物”的两个蛋白质之间是否存在相互作用。用酵母双杂交系统检测蛋白质之间的相互作用通常会存在假阳性或假阴性的问题,已有许多学者对此系统进行了改进,并且将其扩展到检测DNA-蛋白质,RNA-蛋白质,小分子-蛋白质之间的相互作用上。
4、生物信息学技术
目前生物信息学已广泛渗透到各个领域中,例如2DE及质谱分析后对蛋白质描述的一种方法是肽质量指纹图谱,这种方法需要精确地确定多肽经过蛋白酶消化后少数几个肽的分子量,然后搜索Genebank、PIR蛋白质数据库、SWISS-PROT Database及EMBL(TrEMBL)等数据库。
SWISS-PROT是对数据人工审读很严格的库。可以说,只有实际存在的蛋白质才被收入。每一条数据都有详细注释,包括功能、结构域、翻译后的修饰等,以及齐全的引文和到许多其他数据库的链接。一般说,任何蛋白质序列数据的搜寻和比较都应当从SWISS-PROT开始。
其网址是:http://www.expasy.ch/sprot/
TrEMBL是从EMBL库中的核酸序列翻译出来的氨基酸序列,已经完成了自动注释。它又分成两部分:SP-TrEMBL 的条目已由专家人工分类并且赋予了SWISS-PROT库的索取号,但还没有通过人工审读被最终收入SWISS-PROT;REM-TrEMBL包含由于某种原因还没有被收入SWISS-PROT的条目。
其网址是:ftp://ftp.ebi.ac.uk (/pub/databases/tremble/)
如果想取得SWISS-PROT和TrEMBL中全部条目的清单,可访问:http://www.expasy.ch/sprot/sprot-retrive-list.html
PIR是蛋白质信息资源(Protein Information Resource)的缩写。这是一个国际蛋白质序列数据库,它包含所有序列已知的自然界中野生型蛋白质的信息。此库主要目的是提供按同源性和分类学组织的综合的非冗余的数据库。
其网址是:http://www-nbrf.georgetown.edu/pir/
合作单位发表文献:
【蛋白组学】
[1]Cun,
Kun Guo et al, Identification of transaldolase as a novel serum
biomarker for hepatocellular carcinoma metastasis using xenografted
mouse model and clinic samples , Cancer Letters 313 (2011) 154–166(IF
4.8,血清样本)
[2]Guang-Zhi
Jin, Yan Li, et al, iTRAQ2DLCESIMS/MS Based Identification of a New Set
of, immunohisto –chemical Biomarkers for Classification of Dysplastic
Nodules and Small Hepatocellular Carcinoma.J. Proteome Res. 2011, 10,
3418–3428(IF5.12,组织样本)
[3]Wu
Duojiao Wu,Dong Zhu, et al, Analysis of Transcriptional Factors and
Regulation Networks in Patients with Acute Renal Allograft Rejection
.Journal of Proteome Research. 2011, 10, 175–181(IF5.12,血清样本)
[4]Junhua
Ge, Hui Yan, et al, Changes in proteomics profile during maturation of
marrow-derived dendritic cells treated with oxidized low-density
lipoprotein. Proteomics.2011, 11, 1893–190(IF 4.42,细胞样本)
[5]Yifeng
He, Xin Wu, et al LC-MS/MS Analysis of Ovarian Cancer
Metastasis-Related Proteins Using a Nude Mouse Model: 14-3-3 Zeta as a
Candidate Biomarker. J. Proteome Res.2010,6180–6190(IF5.12,囊液样本)