摘要:定量宏基因组学和定量宏转录组学技术是通过在样本中添加已知拷贝数的核酸内标片段,经建库测序后通过计算测序数据中内标序列的回收率,再结合原始环境样品的定量信息,估算样品中赋存的各基因和转录本的绝对丰度。对于不同类型的环境样品或受环境扰动前后生物量发生显著变化的样品,基因的相对丰度无法准确反映其绝对丰度的差异性与时空变化。因此,相较于基于序列相对丰度的常规定量方法,定量宏基因组与定量宏转录组能够在绝对定量的框架下更准确地比较样品之间的生物学差异,定量宏组学方法的应用实例与技术优势见参考文献1前言部分。该方法适用范围广,包括工程系统、天然水体、土壤、沉积物等不同类型的环境样品,都可以通过不同的绝对定量信息与方式(体积、生物量、质量、细胞数),结合内标的回收率来推算其中任一基因或转录本的拷贝数。本文在参考文献2的基础上定义了一系列实现微生物组内任一目标基因绝对转录本与绝对基因量的计算公式和相关参数。
关键词: 定量宏基因组, 定量宏转录组, 内标, 绝对定量, 微生物群落
材料与试剂
耗材:
- 0.22 μm注射过滤器单元:MILLEX 0.22 μm filter
- 50 ml无菌注射器
- Qubit™ assay tubes(Thermo Invitrogen, 货号:Q32856)
试剂:
- 十二烷基硫酸钠(SDS)(生工,货号:S0227-500g)
- 醋酸钠(国药,货号:10018818)
- 乙酸(国药,货号:10000208)
- 异丙醇(Acros, 货号:447080010)
- 无水乙醇(Sigma, BioUltra, for molecular biology, 货号:51976)
- 柠檬酸盐饱和苯酚(Sigma, BioReagent, for molecular biology, 货号:P4682-100ml)
- 氯仿(国药,货号:10006818)
- 无核酸酶纯水(Thermo UltraPure™ DNase/RNase-Free Distilled Water, 货号:10977023)
- 限制性核酸内切酶:Thermo FastDigest enzyme Mss I(Thermo Scientific™, 货号:FD1344)
- 胶回收试剂盒:Promega Wizard® SV Gel and PCR Clean-Up System(Promega, 货号:A9282)
- proteinase K(Thermo Invitrogen, 货号:AM2546)
- 体外转录试剂盒:MEGAscript™ T7 Transcription Kit(Thermo Invitrogen, 货号:AM1333)
- Qubit™ 1X dsDNA HS Assay Kits(Thermo Invitrogen, 货号:Q33231)
- Qubit™ RNA HS Assay Kit(Thermo Invitrogen, 货号:Q32852)
- Q5超保真2X 预混液(NEB Q5® High-Fidelity 2X Master Mix, 货号:M0492)
仪器设备
- Qubit荧光计(Thermo Qubit™ 4 Fluorometer)
- 全自动凝胶成像系统 (Tanon 2500)
- 水平电泳仪(Tanon EPS300+HE120)
- 高通量NGS片段分析系统:AATI Fragment analyzer(Agilent GENE-QC006)
- 低速离心机(杭州奥盛 Mini-6KS)
- 台式高速冷冻离心机(Eppendorf centrifuge 5427R)
- PCR仪(Biometra TRIO 48)
- 振荡型恒温金属浴仪(杭州奥盛 MSC-100)
- 千分位天平(Precisa XJ220A SCS)
- Nanodrop OneC(Thermo)
- 涡旋混合器(杭州奥盛 MTV-1)
实验步骤
- 内标序列和PCR引物的设计与合成
本流程通过人工合成的DNA和RNA内标物投加来实现微生物群落的定量宏基因组学和定量宏转录组学分析,内标序列在设计时需要满足以下几个条件:
- RNA内标(RNA Internal Standard, RIS)的制作
- DNA内标(DNA Internal Standard, DIS)的制作
上述用于RNA内标制作的质粒同样可以作为定量宏基因组的内标使用。
- 内标的定量与添加
- 文库构建与测序
使用双端测序(2 x 150)的测序策略在Illumina的Hiseq4000平台上对构建的DNA和cDNA文库进行测序(实际测序策略和测序平台的选择并不局限于本文示例,可根据实际实验需求对添加完内标的DNA和cDNA文库选择建库与测序的策略)。 - 内标的回收与基础生物信息学分析
失败经验
- 使用外转录试剂盒为:MEGAscript™ T7 Transcription Kit(Thermo Invitrogen, 货号:AM1333)时应在室温下配制反应体系,不能在冰上进行,在冰上配制反应体系温度过低会导致10X Reaction Buffer中的亚精胺可能会与模板DNA发生共沉淀。
- 在使用苯酚/氯仿溶液对RNA内标进行回收时,样品与试剂混合再离心后,水相分布在上层,有机相分布在下层,吸取上层水相时应尽量小心避免吸到下层的有机相。
- 每次使用RNA内标之前都需要对其重新进行定量,若重新定量时RNA内标的浓度低于初始浓度的90%,就不再建议使用,建议重新进行体外转录实验,获取新鲜的RNA内标。
结果与分析
RNA内标的质检结果
图1. RNA内标的水平琼脂糖凝胶(0.7%)电泳结果图
图2. RNA内标的Fragment analyzer结果图
*Fragment analyzer的实验结果可能会与内标的真实长度有部分偏差(<10%)
致谢
本文工作得到了科学技术部国家重点研发计划的资助(项目编号:2018YFE0110500)。内标物设计序列方案和合成方法参考Mary Ann Moran课题组发表的论文《Use of internal standards for quantitative metatranscriptome and metagenome analysis》;内标物的添加方法与生物信息学定量计算方法参考作者鞠峰博士发表的论文《Wastewater treatment plant resistomes are shaped by bacterial composition, genetic exchange, and upregulated expression in the effluent microbiomes》。
参考文献
- Ju, F., Beck, K., Yin, X., Maccagnan, A., McArdell, C.S., Singer, H.P., Johnson, D.R., and Zhang, T., Buergmann, H. (2018). Wastewater treatment plant resistomes are shaped by bacterial composition, genetic exchange, and upregulated expression in the effluent microbiomes. The ISME Journal 13, 346–360
- Satinsky, B.M., Gifford, S.M., Crump, B.C., and Moran, M.A. (2013). Use of internal standards for quantitative metatranscriptome and metagenome analysis. Methods in Enzymology 531, 237-250
附录
附录1. 内标序列设计的基本原则和注意事项
本流程通过人工合成的DNA和RNA内标物投加来实现微生物群落的定量宏基因组学和定量宏转录组学分析,内标序列在设计时需要满足以下几个条件:
1)该序列为受测环境样品或自然环境中不存在的序列;提交到NCBI Blast比对nr数据库时,没有显著相似性参考序列被比对上;也没有任何bit-score得分大于50分的比对结果,以保证所设计内标序列的独特性和有效性。
2)细菌和古细菌基因的平均大小约为924 bp,考虑到不同的转录本长度在RNA的提取、文库构建、测序过程中的差异性,即转录本长度对最终测序数据回收率的影响,该内标序列的设计长度建议在1000个碱基左右。GC 含量接近50%,不存在一些高GC,或发卡结构的区域。
注意:如果研究的重点是小RNA或短转录本,则可以缩小内标的长度;高GC的核酸片段更容易形成二级结构,在常规建库过程中难以被扩增,难以被打断,其最终的测序丰度信息往往会受此影响而偏低。
3)在设计RNA内标时需要在序列的起始端添加T7 promoter的序列(5’ -TAATACGACTCACTATAGG),以保证合成的质粒能够进行体外转录实验。
4)在设计RNA内标时,需要在内标序列的末端嵌入一个酶切后产生平末端的限制性核酸内切酶酶切位点,用于质粒的线性化,且该酶切位点在内标序列中的其他位置不存在。
5)当实验计划用PCR对质粒上人工合成的内标序列进行扩增,将扩增产物作为定量宏基因组实验中使用的DNA内标时,在引物设计过程中需要注意不要将T7启动子序列包含进去,避免影响后续的内标序列回收。
6)内标参考序列BMS5 (Satinsky et al., 2013):
TAATACGACTCACTATAGGGTTCGGTGGTCTATACTACTACCTAAGTTGGATGTACTGGTGGAAGTGCTACCAACACAGTAATGCTGGTATAGGTAGGCAACACTACGACTTCAGGAAGAGTCTAACGAATGTATGCATAATACTAATGCCTTACATGTGGAAGCACCCTATAACGGACAGGATGAGGCACAGGCACATGTGCAGGCAAGCTTTCAAGTGGATGTGCGGTGAAAATAAGTTCTGGCTAGTAAGGGCTATGGAAAATCAACCTGACGAAAGGATACTAGCTCAAATGACGATAACGGACAGTGACTGGCAACCTGAAGAATGGTACAAGAAGAGGCACGACCCTGGTGAAAATGACGTAATAAGGTGCGTATACATAGGTATAGAAAATCTAGTAAATGCTACGTGCCCTGACATGGAAGACTACTACGCTATGACGGGTAATAAGCCTCTACTAGAACTAAATAGTATAGGTCCTTGCACGCAATGCACGGTACACAAGCTAGAAGGTGTACACTGCATATGGTGGATAGTAAGGAGGGACCACTTCCCTGTACCTATAATACAAATAGTAGACGTATTCAATCTATACAATTTCGCTAGTGGTACGGTACTATGCATACAACACGCTGCTCACCCTTGGGGTGACTGGATGTTCGACGTACAATACGAAAGTTGCAGGATGTACAGGTGGTGGATGACGAGGAATGACTGGAGTGGTCCTAATAAGTGGAGTGGTGCTCACAGTATATGCCAACCTCACTGCTGCAGGAGTGACGACAGTAGGGTAAGTAAGAGGATGGCTACGGTAACGAAGGAAGTAGTAGAAATGAGTCACATGGACCTAAAGAGGAGTGCTTACTGCAATAGGACGCAACTAGAAGAATACGACGCTTTCTACACGAGGTGGAAGTTCGTACCTTGGATGTACCCTGCTCCTCTACCTTGCGAAGTACAAGACTTCGTAACGAGGAGGACGTTCGACTACCCTGACCCTACGGCTTGCGGTCTAGTTTAAAC
如图1所示,其中“TAATACGACTCACTATAGG”为合成时加入的T7启动子序列,作为体外转录实验中RNA聚合酶的结合位点,不是实际的内标序列;序列最末尾的“GTTTAAAC”是设计过程中加入的一个用于线性化质粒的平末端酶切位点,酶切后TTT即为内标序列的最后三个碱基;综上所述,该内标设计合成的序列总长度为1027 bp,实际内标序列长度为1004 bp。
图1. 内标设计合成的结构示意图
附录2. 胶回收的具体实验步骤
Promega Wizard® SV Gel and PCR Clean-Up System:
1)电泳后,从琼脂糖凝胶上切下目的条带(完全线性化的质粒条带),并将凝胶放入1.5 ml离心管中;
2)每10 mg胶块添加10 μl Membrane Binding Solution,并在50–65°C下孵育(金属浴仪或烘箱皆可),直到凝胶片完全溶解,期间需每隔3-5 min中颠倒混匀;
3)将SV Minicolumn插入收集管中(Collection Tube),并做好样品名称的标记;
4)将溶解的凝胶混合物冷却到室温,然后转移到Minicolumn管中,在室温下孵育1 min;
5)以16,000 × g离心1 min,丢弃收集管中的废液,然后将Minicolumn重新插入收集管中;
6)添加700 μl的Membrane Wash Solution(确保Membrane Wash Solution使用之前已经按照说明书的要求加入乙醇),以16,000 × g离心1 min,丢弃收集管中的废液,然后将Minicolumn重新插入收集管中;
7)添加500μl的Membrane Wash Solution,以16,000 × g离心5 min,丢弃收集管中的废液,然后将Minicolumn重新插入收集管中;
8)重新以16,000 × g离心1 min,以去除任何可能残留的乙醇;
9)小心地将Minicolumn转移到干净的1.5 ml离心管中;
10)向Minicolumn正中部加入20 μl Nuclease-free water。在室温下孵育1 min,以16,000 × g离心1 min;
11)丢弃Minicolumn,并将样品保存在-20 °C。
该实验方法参考:Promega公司 Promega Wizard® SV Gel and PCR Clean-Up System 试剂盒说明书。
附录3. VSS测定方法
实验材料:无菌超纯水,玻璃纤维滤盘,坩锅,烘箱,马弗炉,干燥器
实验步骤:
1)玻璃纤维滤盘的准备:组装过滤装置,打开真空泵,用20ml的无菌超纯水冲洗滤膜和滤杯,重复三次,确认滤膜和滤杯上的所有水都抽干后关闭真空泵,取下玻璃纤维滤盘,将其置于坩锅中,将坩锅和玻璃纤维滤盘一同放入马弗炉中550°C灼烧15min,灼烧完成适当冷却后取出置于干燥器内冷却至室温,称重。重复灼烧、干燥冷却和称重,直到获得恒重或重量变化小于4%或0.5mg(以较小值为准),记录玻璃纤维滤盘的自重m_(glass-fiber filter disk),单位mg。将玻璃纤维滤盘储存在干燥器中备用。
注意:在组装过滤装置时,玻璃纤维滤盘带褶皱的一面应当朝上。
2)选择过滤器和样品:样品体积需满足能够产生2.5-200mg的干燥物,如果样品的过滤体积不能满足最低产量的要求,则将样品体积增加至1L;如果单个样品的过滤时间需要10min以上,则需要考虑增加过滤器的直径或减小样品体积,记录样品过滤体积V_1,单位ml。
3)过滤:组装过滤器开始过滤,加入样品之前先向过滤系统中添加少量的无菌超纯水湿润过滤系统,确保待过滤样品充分混匀后正式开始过滤,样品过滤完成后,先不关闭真空泵。继续用10ml的无菌超纯水洗涤过滤器,并完全排水,再重复清洗过程两次,在清洗过滤完成后,继续抽吸3 min。
注意:对于固体含量特别高的样品可能需要额外的洗涤过程。
4)烘干称重:小心地从过滤器上取下玻璃纤维滤盘并转移到坩锅中,连同坩锅一起置于烘箱中在103-105°C下干燥至少1h,适当降温后取出置于干燥器内冷却至室温,称重。重复高温干燥、冷却和称重”直到获得恒重或重量变化小于4%或0.5mg(以较小值为准)。记录下此时质量m_1,单位mg;m_1表示烘干后玻璃纤维滤盘的自重和样品中总悬浮固体(Total Suspended Solids,TSS)的质量之和,即m_1=m_(glass-fiber filter disk)+m_TSS。
5)将滤盘重新置于坩锅中,再放入马弗炉中550°C灼烧15min*,灼烧完成适当冷却后取出置于干燥器内冷却至室温,称重。重复灼烧、干燥冷却和称重直到获得恒重或重量变化小于先前称量的4%或0.5mg(以较小值为准)。记录下此时称重得到的质量m_2,单位mg;m_2表示马弗炉中550°C灼烧后玻璃纤维滤盘的自重和样品中灰分(Fixed Solids)的质量之和,即m_2=m_(glass-fiber filter disk)+m_(Fixed Solids)
注:*通常200 mg残留物需要灼烧15-20min,但是一个以上的样品或样品中残留物质量大于200mg会加重马弗炉的负担,因此可能需要更长的灼烧时间。
注意:所有实验样品至少一式两份,重复测定的数据偏差应该小于平均值的5%。
6)计算
因为:
mvss: 样品中的挥发性悬浮固体的质量,单位mg
V1: 过滤到玻璃纤维滤膜上的样品体积,单位ml
该测试方法参考:Association, A. P. H. (1998). Standard methods for the examination of water and wastewater. 20th edition. American Public Health Association, American Water Works Association and Water Pollution Control Federation。
Copyright: © 2021 The Authors; exclusive licensee Bio-protocol LLC.
引用格式:黄昕瑜, 张璐, 袁凌, 鞠峰. (2021). 微生物组的定量宏基因组学和定量宏转录组学方法. // 微生物组实验手册.
Bio-101: e2003693. DOI:
10.21769/BioProtoc.2003693.
How to cite: Huang, X. Y., Zhang, L. Y., Yuan, L. and Ju, F. (2021). Quantitative Metagenomics and Metatranscriptomics Methods of Microbiome. // Microbiome Protocols eBook.
Bio-101: e2003693. DOI:
10.21769/BioProtoc.2003693.