您的当前位置:首页正文

引物设计原则

来源:一二三四网


设计的目的是在两个目标间取得平衡:扩增特异性和扩增效率。引物分析软件将试图通过使用每一引物设计变化的预定值在这两个目标间取得平衡。设计引用有一些需要注意的基本原理: 引物设计有3 条基本原则:

首先引物与模板的序列要紧密互补。

其次引物与引物之间避免形成稳定的二聚体或发夹结构。

再次引物不能在模板的非目的位点引发DNA 聚合反应(即错配) 。

具体实现这3 条基本原则需要考虑到诸多因素,如引物长度(primer length) , 产物长度(productlength) ,序列Tm 值(melting temperature) ,引物与模板形成双链的内部稳定性(internal stability ,用ΔG值反映) ,形成引物二聚体(primer dimer) 及发夹结构(du2plex formation and hairpin) 的能值,在错配位点(falsepriming site) 的引发效率, 引物及产物的GC 含量(composition) ,等等。必要时还需对引物进行修饰,如增加限制性内切酶位点,引进突变等。

① 引物长度和产物长度

一般引物长度为18~30碱基。产物长度以200bp—500bp为宜。总的说来,决定引物退火温度(Tm值)最重要的因素就是引物的长度。有以下公式可以用于粗略计算引物的退火温度。

在引物长度小于20bp时:[4(G+C)+2(A+T)]-5℃

在引物长度大于20bp时:62.3℃+0.41℃(%G-C)-500/length-5℃

为了优化PCR反应,使用确保退火温度不低于54℃的最短的引物可获得最好的效率和特异性。总的说来,每增加一个核苷酸引物特异性提高4倍,这样,大多数应用的最短引物长度为18个核苷酸。引物长度的上限并不很重要,主要与反应效率有关。由于熵的原因,引物越长,它退火结合到靶DNA上形成供DNA聚合酶结合的稳定双链模板的速率越小。

② GC含量

一般引物序列中G+C含量一般为40%~60%,一对引物的GC含量和Tm值应该协调。若是引物存在严重的GC倾向或AT倾向则可以在引物5’端加适量的A、T或G、C尾巴。

③ 退火温度

退火温度需要比解链温度低5℃,如果引物碱基数较少,可以适当提高退火温度,这样可以使PCR的特异性增加;如果碱基数较多,那么可以适当减低退火温度,是DNA双链结合。一对引物的退火温度相差4℃~6℃不会影响PCR的产率,但是理想情况下一对引物的退火温度是一样的,可以在55℃~75℃间变化。

④ 避免扩增模板的二级结构区域

选择扩增片段时最好避开模板的二级结构区域。用有关计算机软件可以预测估计目的片段的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2’-脱氧GTP取代dGTP对扩增的成功是有帮助的。

⑤ 与靶DNA的错配

当被扩增的靶DNA序列较大的时候,一个引物就有可能与靶DNA的多个地方结合,造成结果中有多个条带出现。这个时候有必要先使用BLAST软件进行检测,网址:http://www.ncbi.nlm.nih.gov/BLAST/。选择Align two sequences (bl2seq),如下图。

⑥ 引物末端

引物3’端是延伸开始的地方,因此要防止错配就从这里开始。3’端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。3′端也不能有形成任何二级结构可能,除在特殊的PCR(AS-PCR)反应中,引物3′端不能发生错配。如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。

⑦ 引物的二级结构

引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构,这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp。两引物之间不应该存在互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一般情况下,一对引物间不应多于4个连续碱基的同源性或互补性。

⑧ 为了下一步操作而产生的不完全匹配

5’端对扩增特异性影响不大,因此,可以被修饰而不影响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序

列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。额外的碱基或多或少会影响扩增的效率,还加大引物二聚体形成的几率,但是为了下一步的操作就要作出适当的“牺牲”。

很多时候PCR只是初步克隆,之后我们还需要将目的片段亚克隆到各种载体上,那么就需要在PCR这个步骤为下一步的操作设计额外的碱基。以下总结一些为了亚克隆所要设计的序列。

a 添加限制性内切酶酶切位点

添加酶切位点是将PCR产物进行亚克隆使用得最多的手段。一般酶切位点是六个碱基,另外在酶切位点的5’端还需要加2~3个保护碱基。但是不同的酶需要的保护碱基数目是不相同的,例如:SalⅠ不需要保护碱基,EcoRⅤ需要1个,NotⅠ需要2个,Hind Ⅲ 3个。其中,在原核表达设计引物时还有一些小技巧,大家可以参考:《原核表达之实验前的分析》。里面一些规则是所有表达都通用的。

有一种做法是在进行PCR反应的同时进行酶切,这样就需要注意一些内切酶在PCR反应中的酶切反应率,见附录。不过这种方法虽然方便但并不推荐。有时候,就是把PCR产物回收后酶切再与载体连接效果都不尽理想,同步进行会使出现问题的原因变得更加复杂。一旦出现问题,分析起来更麻烦。

b LIC添加尾巴

LIC的全称是Ligation-Independent cloning,它是Navogen公司专门为其部分的pET载体而发明的一种克隆方法。用LIC 法制备的pET 载体有不互补的12–15 碱基单链

粘端,与目的插入片段上相应粘端互补。扩增目的插入片段的引物5'序列要与LIC载体互补。T4 DNA 聚合酶的3'→5'外切活性经短时间即可在插入片段上形成单链粘端。由于只能由制备好的插入片段和载体互相退火形成产物,这种方法非常快速高效,而且为定向克隆。

c 定向TA克隆添加尾巴

在T载体刚出的时候大家都拍手称赞,真是方便,哪个小子脑子这么聪明想出来的。但是后来人们发现TA克隆无法将片段定向克隆到载体中,所以后来Invitrogen推出了可以定向克隆的载体,它的一端含有四个突出的碱基GTGG。因此在PCR引物设计时也要相应的加上与之互补的序列,这样片段就可以“有方向”了。

d In-Fusion克隆方法

这项技术是Clontech还属于BD的时候推出的,2004年在生物通可着实风光了一把,不但当选年度创新试剂还被大家投票为最受大家欢迎的试剂。此技术就其步骤来说是及其方便的,不需连接酶,不需长时间的反应。只要在设计引物的时候引入一段线性化载体两端的序列,然后将PCR产物和线性化的载体加入到含有BSA的In-Fusion酶溶液中,在室温下放置半个小时就可以进行转化了。这种方法特别适合大批量的转化。

引物设计原则 引物是人工合成的两段寡核苷酸序列,一个引物与感兴趣区域一端的一条DNA模板链互补,另一个引物与感兴趣区域另一端的另一条DNA模板链互补。

在PCR(聚合酶链式反应)技术中,已知一段目的基因的核苷酸序列,根据这一序列合成引物,利用PCR扩增技术,目的基因DNA受热变性后解链为单链,引物与单链相应互补序列结合,然后在DNA聚合酶作用下进行延伸,如此重复循环,延伸后得到的产物同样可以和引物结合。

PCR引物设计的目的是找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。如前述,引物的优劣直接关系到PCR的特异性与成功与否。对引物的设计不可能有一种包罗万象的规则确保PCR的成功,但遵循某些原则,则有助于引物的设计。

1.引物最好在模板cDNA的保守区内设计。

DNA序列的保守区是通过物种间相似序列的比较确定的。在NCBI上搜索不同物种的同一基因,通过序列分析软件(比如DNAman)比对(Alignment),各基因相同的序列就是该基因的保守区。

2.引物长度一般在15~30碱基之间。

引物长度(primer length)常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA 聚合酶进行反应。

预期产物的特定长度经常取决于应用的需要。若目的是建立测定特异DNA片段的临床检验方法,120~300bp的小DNA扩增产物可能是最好的。产物应具有好的特异性和高的产生效率,并含有能用于探针捕捉杂交实验的足够信息。这一长度范围的产物可以通过采用两步扩增循环方法得到,从而减少扩增时间。

其他PCR方法有不同的最佳产物长度。例如,通过定量的RNA-PCR检测基因表达时,产物应该足够大以便构成竞争性模板,这样,产物和竞争物都能够在凝胶上很容易的分辨出来。这些产物一般在250~750bp范围内。

3.引物GC含量在40%~60%间,Tm值最好近72℃

GC含量(composition)过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。另外,上下游引物的Tm值(melting temperature)是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度。有效启动温度,一般高于Tm值5~10℃。若按公式Tm= 4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳。

4.引物3′端要避开密码子的第3位。

如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增的特异性与效率。

5.引物3′端不能选择A,最好选择T。

引物3′端错配时,不同碱基引发效率存在着很大的差异,当末位的碱基为A时,即使在错配的情况下,也能有引发链的合成,而当末位链为T时,错配的引发效率大大降低,G、C错配的引发效率介于A、T之间,所以3′端最好选择T。

6. 碱基要随机分布。

引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易

导致错误引发(False priming)。降低引物与模板相似性的一种方法是,引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G或C,因这样会使引物在GC富集序列区错误引发。

7. 引物自身及引物之间不应存在互补序列。

引物自身不应存在互补序列,否则引物自身会折叠成发夹结构(Hairpin)使引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物自身不能有连续4个碱基的互补。

两引物之间也不应具有互补性,尤其应避免3′ 端的互补重叠以防止引物二聚体(Dimer与Cross dimer)的形成。引物之间不能有连续4个碱基的互补。 引物二聚体及发夹结构如果不可避免的话,应尽量使其△G值不要过高(应小于4.5kcal/mol)。否则易导致产生引物二聚体带,并且降低引物有效浓度而使PCR 反应不能正常进行。

8. 5′ 端和中间△G值应相对较高3′ 端较低

△G值是指DNA 双链形成所需的自由能,它反映了双链结构内部碱基对的相对稳定性,△G值越大,则双链越稳定。应当选用5′ 端和中间△G值相对较高,而3′ 端△G值较低(绝对值不超过9)的引物。引物3′ 端的△G 值过高,容易在错配位点形成双链结构并引发DNA 聚合反应。(不同位置的△G值可以用Oligo 6软件进行分析)

9.引物的5′端可以修饰,而3′端不可修饰。

引物的5′ 端决定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰

而不影响扩增的特异性。引物5′ 端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入点突变、插入突变、缺失突变序列;引入启动子序列等。

引物的延伸是从3′ 端开始的,不能进行任何修饰。3′ 端也不能有形成任何二级结构可能。

10. 扩增产物的单链不能形成二级结构。

某些引物无效的主要原因是扩增产物单链二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关软件(比如RNAstructure)可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G°)小于58.6l kJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。

11. 引物应具有特异性。

引物设计完成以后,应对其进行BLAST检测。如果与其它基因不具有互补性,就可以进行下一步的实验了。

值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;用作克隆目的的PCR,因为产物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条件。

做Real Time时,用于SYBR Green I法时的一对引物与一般PCR的引物,在引物设计上所要求的参数是不同的。引物设计的要求:

●避免重复碱基,尤其是G.

●Tm=58-60度。

●GC=30-80%.

●3'端最后5个碱基内不能有多于2个的G或C.

●正向引物与探针离得越近越好,但不能重叠。

●PCR扩增产物长度: 引物的产物大小不要太大,一般在80-250bp之间都可;80~150 bp最为合适(可以延长至300 bp)。

●引物的退火温度要高,一般要在60度以上;

要特别注意避免引物二聚体和非特异性扩增的存在。

而且引物设计时应该考虑到引物要有不受基因组DNA污染影响的能力,即引物应该跨外显子,最好是引物能跨外显子的接头区,这样可以更有效的不受基因组DNA污染的影响。

做染料法最关键的就是寻找到合适的引物和做污染的预防工作。对于引物,你要有从一大堆引物中挑出一两个能用的引物的思想准备---寻找合适的引物非常不容易。

关于BLAST的作用应该是通过比对,发现你所设计的这个引物,在已经发现并在GENEBANK中公开的不物种基因序列当中,除了和你的目标基因之外,还有没有和其他物种或其他序列当中存在相同的序列,如和你的目标序列之外的序列相同的序列,则可能扩出其他序列的产物,那么这个引物的特异性就很差,从而不能用。

因篇幅问题不能全部显示,请点此查看更多更全内容

Top