已已已已已已已已已已已 ——已已已已已已已已已已已 黄 黄 黄黄黄黄黄黄黄 黄黄黄 传 2006.11.1.
Jan 21, 2016
已知基因序列的获取策略——兼谈引物设计与序列分析
黄 钢第三军医大学遗传教研室
2006.11.1.
获取序列信息,设计合适的引物
选取相应的组织或细胞,提取 RNA 并 RT
PCR 扩增获得全长 cDNA
装入合适的克隆或表达载体,菌落 PCR 、酶切与测序证实
根据需要进一步进行亚克隆
RNase H 消化(可选)
一、如何获取已知目的基因的序列信息 先查找其蛋白相关信息 , 了解该基因编码
产物的基本情况与功能(www.expasy.org)
进一步查找其核酸相关序列信息,常用数据库: Genebank、 EBI、 DDBJ
二、目的基因 cDNA 序列的获取方法
cDNA 文库扫描 RT-PCR 人工合成
组织 RNA 的提取 在匀浆器中加工冷冻的组织 通过注射器加工冷冻的组织 在液氮中将组织研磨成粉末 在液氮中研磨组织至粉末状,细胞裂解
更完全,产量比前二者多一倍。 合适的 RNA 提取方法加上合适的组织处
理方法,才能够获得最佳的提取效果
RNA 提取两要素 忌讳贪多:不能指望 1ml Trizol 提取 100mg 以
上组织,一般 50mg 用 1mlTrizol 较合适 速战速决:尽量缩短提取时间,不要完全照搬 Pr
otocol, 比如匀浆后如果没有很多组织碎片的话,可以立即加入氯仿,立即离心, 14000rpm 离心10min, 取完上清加入 0.6~1 体积的异丙醇,立即高速离心( 14,000rpm,5min ), ..... 总之尽量快速!
尽量减少 RNAase 污染 RNase 的危害主要集中在将 RNA pellet
溶解在水中之后,防止 RNA 降解的重点应当放在组织样本的保存和 RNA 水溶液的保存上。
注意实验前的准备工作:各种器材的去RNAase 处理与无 RNAase 的准备。
长期保存 RNA 时建议用去离子甲酰胺溶解总 RNA沉淀
如何确认 RNA 的质量 RNA 的电泳图谱 检测 RNA 溶液的吸光度 保温试验 荧光染色、毛细管电泳和 Agilent2100生物分析仪分析
28S
18S
5S
RT 引物的选用
GSP :适合序列肯定的模板,常用于一步法 RT- PCR 。但是引物设计质量影响 RT 的结果。在扩增低丰度的转录本时是最好的。
Oligo dT 引物 : 真核生物的 mRNA 适用,建议用于高质量 RNA及全长转录本的逆转录;
随机引物:适合各种 RNA 的 RT ,可用于mRNA 片段的逆转录。
RT 中提高合成全长 cDNA 的效率 消除mRNA 二级结构:逆转录之前将 RT 引物与 RNA 模板进行短暂的热变性 , 可破坏mRNA 二级结构 , 促进锚定引物与模板的正确配对。
选用 RNase H灭活改造的新型耐高温逆转录酶: Thermoscript 、 Superscript Ⅲ等, RT 后建议进行 RNase H消化处理。
锚定 RT 引物的选用: 5'–(T)25V N–3‘ 热启动 RT 有条件者选用 Tricine-EDTA Buffer 溶解 cDNA 10 mM Tricine-KOH (pH 8.5) 1.0 mM EDTA
小于 5微克
可自己找公司合成
建议用热盖 PCR 仪或空气浴孵箱保温
建议选用 RNase H 消化
高保真 DNA 多聚酶的选用 常用高保真 DNA 多聚酶:如 Pfu、 Deep Vent 、 Vent 、
Pwo 、 KOD 、 Pyrobest 、 PrimerStar等 PCR 过程中 HotStart 与 Touchdown 的使用 高保真 DNA 多聚酶与普通 rTaq的混合使用 PCR 产物加 A尾进行 T-A 克隆:循环即将结束时加入
rTaq 5U 72 ℃保温 20~ 30 min 两步变温法 PCR
载体构建中的常见问题 利用单酶切位点将片段插入载体 双酶切中的问题对过长 cDNA 片段 : 可分段扩增,再利用
RE位点或重叠延伸融合成全长 cDNA 酶切位点甲基化的问题 Cla I G6mATCGAT Xba I TCTAG6mATC
真核表达载体的选择
Promoter Conventional/Tissue-Specific/Inducible Poly (A) tail Kozak 序列:- 9GCCGCCA/GCCAUGG+
4
一个载体内的多基因表达 IRES系统 加 linker直接融合表达 多个独立的表达 cassettes :优于共转
染表达
SOE 技术与基因人工合成及多基因融合
基因设计与人工合成中的密码子优化 DNAWorks 2.4 (Hoover, D. and Lubkowski, J., 2002)
http://mcl1.ncifcrf.gov/dnaworks/
SOE : Spliced by overlapping extension
搭桥技术融合基因
三、引物设计引物设计的 3 条基本原则: 引物与模板的序列要紧密互补 引物与引物之间避免形成稳定的二聚体
或发夹结构, 引物不能在模板的非目的位点引发 DNA
聚合反应 ( 即错配 ) 。
引物设计注意事项 引物的长度一般为 15-30 bp ,常用的是
18-27 bp ,但不应大于 38bp 。 引物序列在模板内应当没有相似性较高,尤其是 3’端相似性较高的序列,否则容易导致错配。
引物 3’端的末位碱基对 Taq酶的 DNA合成效率有较大的影响。
5’ 端序列的修饰与标记:可在引物设计时加上限制酶位点、核糖体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等 . 通常应在5‘端限制酶位点外再加 1-3 个保护碱基。
简并引物:应选用简并程度低的密码子 , 例如选用只有一种密码子的Met, 3’ 端应不存在简并性。否则可能由于产量低而看不见扩增产物。
同源性或互补性:两引物间最好不存在 4个连续碱基的同源性或互补性。
GC 含量:一般为 40-60%。另外,上下游引物的 GC含量不能相差太大。
Tm 值:引物所对应模板位置序列的 Tm值在 72℃左右可使复性条件最佳。有多种计算方法,如按公式 Tm= 4(G+C) + 2(A+T),在软件中常使用的是最邻近法 (the nearest neighbor method) 。
△G 值:指 DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端△ G值较低(绝对值不超过 9),而 5’端和中间△ G值相对较高的引物。引物的 3’端的△ G值过高,容易在错配位点形成双链结构并引发 DNA聚合反应。引物二聚体及发夹结构的能值过高(超过4.5kcal/mol )易导致产生引物二聚体带,并且降低引物有效浓度而使 PCR反应不能正常进行。
Primer Premier 5.0
引物设计 限制性内切酶位点分析 DNA 基元 (motif)查找 同源性分析
Genetool V 2.0
Oligo6.69
四、测序图比对、拼接与虚拟克隆 (in silico cloning)
常用本地软件: Clone manager 、 Vector NTI 、 DNAstar 和 ds-Gene等
在线工具: BLAST等
常用序列拼接软件 DNAstar 的 SeqMan模块 VectorNTI程序的 Contig Express模块
Sequencher
开始→所有程序→ DNAstar →SeqMan
新的拼接任务
添加序列
打开保存序列的文件夹
选择序列
导入
整理一下末端
用鼠标拖动手动更改末端
用鼠标点击更改序列方向和形式
选择载体
自动查找
拼接
看看结果
点开测序图
6 种阅读框
选择的序列的位置
NCBI 查询所选择的序列
保存结果
打印成 PDF文件也是一个不错的选择
运行 VNTI 程序 Contig Express
程序窗口,可以设定参数,一般用默认值即可。
导入测序结果(文件扩展名 ab1 改成abi )相关软件 EditView for Macs ;Chroma for Windows] 也可以用鼠标右键
导入后可以双击查看和编辑各个测序结果
选择序列,根据实际情况调整序列末端
选择序列拼接
双击查看结果
输出结果到剪贴板,注意最上面的像机按钮,直观吧。
开始→所有程序
导入序列
选择序列
此界面调整参数
详细说明
拼接
双击查看结果
输出结果