摘要:高通量测序技术的快速发展极大地促进了环境功能微生物基因组学的研究,但传统的宏基因组学技术以样品的所有序列为研究对象,因而原始测序数据量庞杂 (Gb级别) ,噪音干扰较多,易导致微生物信息挖掘效率低下。本文介绍了DNA稳定同位素示踪与宏基因组单菌草图组装联用技术,可将目标功能微生物的基因组进行有效标记和分离,从而简化了宏基因组分析难度。具体包括:首先将含13C稳定同位素的标记物作为唯一碳源与微生物共培养 (DNA-SIP),可直接锚定参与代谢过程的功能菌群 (Neufeld et al., 2007),极大地降低了后续测序数据的噪音干扰,提高生物信息挖掘效率。然后对锚定的DNA进行高深度的宏基因组测序,再基于无参比对方法将短序列分箱 (Metagenomic Binning),重构微生物在株水平的基因组草图(Alneberg et al., 2014; Sun et al., 2018)。对非培养模式获得的功能微生物,进行基因注释和代谢通路分析,解析环境功能微生物的进化和代谢特性,可有效发掘新型/未知功能物种的基因组学信息 (Quince et al., 2017; Zhang et al., 2020)。
关键词: 稳定同位素示踪, 高通量测序, 宏基因组分箱, 基因组DNA, 环境功能微生物
基本原理
- 稳定同位素示踪原理
在碳同化培养体系中添加含13C的标记物与微生物共培养。该过程中微生物如果可以利用标记物进行同化作用,则可将13C合并至自身DNA,从而完成对目标功能菌群的“标记”。然后收集样品总DNA,利用超速离心机分离。由于浮力密度的不同,13C-DNA主要分布在底层(重层),未被标记的12C-DNA则主要分布在上层(轻层)(图1)。重点收集重层DNA进行下游的高通量测序及生物信息学分析(图2)。
图1 DNA-SIP分层示意图。 (图片来自网络)
图2 DNA-SIP与生物信息学分析联用的流程示意图。(图片来自网络)
- 宏基因组分箱原理
宏基因组分箱(Binning)基于宏基因组原始测序序列,可进一步将其中混合了不同微生物的序列或序列组装得到的contigs按物种进行分类(图3)。提取个体基因组草图(bins)可以实现宏基因组的单菌基因组水平分析。以往传统的单物种全基因组序列都是对目标菌群经过纯培养后,方能进行全基因组de novo测序。但是环境中存在着大量的不可培养微生物,Binning技术不依赖培养条件就可获得微生物的全基因组序列,从而获得新物种的基因组序列和代谢功能等生物信息。
图3 宏基因组分箱原理示意图。(Kang et al.,2015)
材料与试剂
- 普通12C乙酸 (北京百灵威科技有限公司,Lot: LE10Q200)
- 13C乙酸 (Cambridge Isotope Laboratories,Inc,Lot: PR-29445)
- DNA提取试剂盒(QIAGEN GmbH,Lot: 163046382)
- qPCR试剂盒 (Takara,Lot: AJ91708A)
- 氯化铵 (广州化学试剂厂)
- 十二水合·磷酸氢二钠 (麦克林,Lot: C11160473)
- 磷酸二氢钾 (广州化学试剂厂)
- 氯化镁 (广东光华科技有限公司,Lot: 20190404)
- 刃天青 (北京百灵威科技有限公司)
- TE buffer (ZOMANBIO,Lot: 9BB08S)
- 氯化铯 (BIOBOMEI,Lot: B23V1019)
- 无水乙醇 (阿拉丁)
- 核酸助沉剂 (ZOMANBIO)
仪器设备
- 掌上离心机 (Scilogex)
- 专用离心管 (Eppendorf Centrifuge 5430 R)
- 超高速离心机 (Beckman Optima MAX-TL)
- Qubit定量 (Thermo Fisher Scientific)
- qPCR仪 (BIO-RAD CFX96 Real-Time System)
- DNA裂解仪 (MP Biomedicals FASTPREP-24)
- SIP分层泵 (Beckman)
- 真空浓缩仪 (Eppendorf)
- 振荡器 (Silentshake)
- 折光率仪 (Atago)
软件和数据库
- QIIME2 (扩增子分析主流软件)
系列教程:https://docs.qiime2.org/2020.11/ - Megahit宏基因组组装软件
安装:conda install -y megahit
使用:time megahit -t 30 \
-1 `ls 质控后序列路径/File_1.fq|tr '\n' ','|sed 's/,$//'` \
-2 `ls 质控后序列路径/File _2.fq|tr '\n' ','|sed 's/,$//'` \
-o YOUR PATH/megahit --k-min 21 --k-max 121 --k-step 10
官方文档:《MEGAHIT: an μltra-fast single-node solution for large and complex metagenomics assembly via succinct de Bruijn graph》Bioinformatics, 2015. - MetaWRAP宏基因组分箱软件
安装:conda install -c ursky metawrap -mg
使用:metawrap binning -o resμlts/01_binning -t 30 -a YOUR PATH TO/final.contigs.fa \
--metabat2 --maxbin2 --concoct YOUR PATH TO指控后序列/File_clean_*.fastq
官方文档:《MetaWRAP—a flexible pipeline for genome-resolved metagenomic data analysis》Microbiome, 2018. - Kneaddata质控软件
安装:conda install -y kneaddata
使用:time kneaddata -i seq/sample_1.raw.fq.gz -i seq/ sample _2.raw.fq.gz \
-o temp/qc -v -t 30 --remove-intermediate-output \
--trimmomatic ~/miniconda2/envs/metagenome_env/share/trimmomatic/
--trimmomatic-options 'SLIDINGWINDOW:4:20 MINLEN:70' \
--bowtie2-options "--very-sensitive --dovetail" -db YOUR PATH TO/db/bowtie2' - Prokka 细菌基因组注释
安装:conda install -y prokka
使用:time prokka YOUR PATH TO/megahit/final.contigs.fa --outdir temp/prokka \
--prefix mg --metagenome --kingdom Archaea,Bacteria,Mitochondria,Viruses \
--force --cpus 30
官方文档:《Prokka: rapid prokaryotic genome annotation》Bioinformatics, 2015. - Salmon基因定量工具
安装:conda install -y salmon
使用:time parallel -j 3 \
'salmon quant -i temp/salmon/index -l A -p 40 --meta \
-1 YOUR PATH TO指控后序列/File_clean_1.fastq \
-2 YOUR PATH TO指控后序列/File_clean_2.fastq \
-o temp/salmon/Sample_output.quant'
官方文档:《Salmon: fast and bias-aware quantification of transcript expression using dual-phase inference》Nature Methods, 2017.
说明
- 本文以最简单的乙酸降解功能菌分析流程进行介绍,读者可根据实际需要将标记物由13C乙酸替换成其他标记物,如13C乳酸、13C碳酸氢钠、13C甲苯等。
- 13C标记物建议直接购买商用产品。
- 本文描述的12C标记物即为普通试剂。
- 以下实验操作中所用的枪头、离心管、西林瓶等耗材均需经过高压灭菌处理。
实验步骤
一、建立共培养微宇宙 (以乙酸降解菌群为例)
- 共培养实验设计分组如表1所示:
表1.实验分组设计
- 配制1 L矿物盐溶液 (MSM,配方见表2),利用高压灭菌锅将MSM、曝气所需针头、西林瓶、胶塞灭菌,然后冷却备用;MSM当天配当天使用;
- 称量2 g 土壤于已灭菌的西林瓶中,再加入100 ml 的MSM和100 μl的1 g/L的刃天青使用液;
- 用氮气曝气脱氧30 min后用胶塞塞紧,再用匹配的铝盖胶塞密封;
- 根据不同分组,利用注射器分别添加13C-乙酸或12C-乙酸至西林瓶内,充分摇匀;
- 微宇宙放入恒温摇床,在30 °C下进行共培养,用于标记乙酸降解菌群;
- 参与乙酸降解的菌群,可将13C合并至自身DNA,从而完成标记。
二、提取DNA
- 待反应结束后,破开微宇宙,静置沉淀一段时间后倒掉部分上清液,将剩余泥水混合物小心转移至50 ml离心管后离心15min (7,500 × g);
- 倒掉上清液,仅保留湿土用于DNA的提取;
- 建议使用DNA提取试剂盒提取样品的基因组DNA;
- 利用Qubit测定所提取的DNA浓度。
三、超速离心分层
- 经13C标记后的DNA密度相对于未标记的DNA更大,可由超速离心机进行分离;
- 用TE buffer和氯化铯粉末制备CsCl预配液 (折光率RI = 1.4032)和CsCl平衡溶液 (RI = 1.4020 ± 0.0001);
注:每个样品需要大约5 ml的CsCl预配液,根据所需样品配制足量的溶液,如离心6个样品,制备40 ml即可;CsCl平衡溶液所需体积较少,制备5 ml左右即可。 - 添加CsCl预配液至SIP专用离心管刻线处(图4);
图4. CsCl预配液添加量示意图
- 根据提取的DNA浓度,取总量3,000 ng的DNA至SIP专用离心管中;
- 离心管简单密封后涡旋震荡20 s,混匀CsCl预配液与DNA样品;
- 混匀后轻轻转动离心管,严格消除管内气泡;
- 测定混合液的RI,调节RI至1.4020 ± 0.0001。弱RI较低时可添加CsCl预配液增浓,较高时添加TE buffer稀释;
- 注入CsCl平衡溶液至瓶口位置,完成封液(图5);
图5. CsCl平衡溶液的封液示意图
- 将SIP离心管两两配平 (两管间误差需小于0.0010 g),将离心管口热封后,对称放入转子中;配平时往较轻的离心管中添加CsCl平衡溶液,不可从管中取出,避免DNA样品的损失;
- 超速离心条件:57,000 × g,48 h,20 °C;离心不足将导致DNA分层效果不佳;
- 离心完成后尽快取出,平稳取出转子,进行一下步分层收集。
四、分层接管
- 每一管超速离心样品预计分为24层;将提前灭菌的离心管写上对应编号;
- 打开分层取样泵,每管超离样品分24层,每层取样20 s,设定流速为595 μl/min;
注:实验前可提前进行预实验,观察取样情况,调整合适的流速。 - 小心剪去离心管瓶颈,注意瓶口要剪平;装入收集台并压紧,上提针头,扎破瓶底;
注:使用前可利用清水测试管路气密性,确保气密性良好再上样。 - 开启取样泵,借用计时器手动接管,观察出液管路,以管路中连续液柱的第一滴液体滴出开始计算,每20 s手动移动至下一分层管,最后一滴可快速靠壁防止洒漏;
- 依次收集各个样品的1-24层DNA (fraction, F1-F24, 由重至轻);
- 不同超离管样品采集的间隙需使用无菌水清洗管路,防止相互污染;
- 测定各层样品的折光率RI值,并将RI值转换成浮力密度 (Buoyant Density;BD)。
注:若分层效果较好,各层RI应呈现等差递减的趋势。
BD值=RI *10.8601-13.4974。 - 各层样品收集与RI测定示意图,建议以RI=1.4002为界,选取上下10层进行下游分析(图6)。
图6. 各层样品收集示意图
五、纯化回收DNA
- 配制纯化溶液 (配方见表3),根据接管所得样品数量配制总纯化溶液;
注:可以多预算5个样品量的体积,防止分加纯化溶液过程中损失。 - 往各层收集样品中加入1,106 μl纯化溶液,置于4 °C冰箱过夜反应 (帮助核酸沉淀);
注:由于每管的第1、2层和第23、24层误差较大故可不进行纯化回收,仅回收剩余20层。 - 各分层管子离心30 min (11,000 × g,4 °C),离心完后缓慢倾斜离心管小心倒掉管中液体;
- 将离心管放入真空浓缩仪内进行干燥 (D-AL模式,45 °C,20 min);直至离心管内已无肉眼可见水珠;
- 干燥完毕后,加30 μl ddH2O或TE buffer,震荡混匀,用掌上离心机离心5 s,放入-20 °C冰箱内长期保存;
注:若短时间内马上进行下游分子生物学分析可先放在4 °C冰箱中保存。 - 纯化后再次测定各层样品的浮力密度BD值。
六、荧光定量qPCR分析
- 利用qPCR方法对各层DNA量进行定量测定,以判断标记、分层效果;
- 选取纯化回收之前所得的浮力密度BD值在1.69 - 1.78之间的分层DNA进行测试;
- qPCR检测的目标基因可以是16S rRNA (乙酸为例),或其他功能基因;
- 将qPCR所需试剂和选取的DNA样品提前放入4 °C冰箱解冻、离心摇匀;
- 按照qPCR kit说明书配置20 μl 反应溶液;
- qPCR模板包括各层样品、标注曲线、阴性对照,且均需三个实验平行;
qPCR反应程序根据目标基因进行设定,本文使用16S rRNA检测程序如下:
Step1:95 °C,15min (预变性)
Step2:94 °C,15 s;55 °C,30s ;72 °C,30 s;44个循环 (扩增)
Step3:72 °C 7 min
Step4:起始温度94 °C,终止温度94 °C,温度变化速率为0.5 °C (溶解曲线)
Step5:读板
记录qPCR结果,换算得到各层DNA样品的基因浓度,绘制渐变曲线。
七、16S rRNA测序与生物信息学分析
- 参考qPCR结果,若13C-乙酸12C-乙酸两组样品错峰明显,表明标记效果较好,可继续对各层DNA样品进行扩增子测序;
- 为减少测序成本,可根据qPCR结果选取各峰尖、及左右各一层,共3个样品测序。
- 使用Earth Microbiome Project推荐的引物对基因组DNA的16S rRNA片段进行高通量测序 (Illumina MiSeq PE250);主要分析细菌群落组成;
- 下机数据主要使用QIIME2分析,包括序列除杂、过滤、拼接、去噪、注释等主要过程;
- 根据物种丰度统计表,绘制各样品不同分层下的物种变化图。
八、宏基因组测序与生物信息学分析
- 经过13C标记的重层DNA大大简化了乙酸降解功能菌群的生物信息,从而减少冗余数据的干扰,极大地降低了生物信息分析难度;
- 重点针对重层DNA进行宏基因组测序 (Illumina HiSeq PE250),测序数据量建议不低于6 G/样品;
- 下机数据主要使用Kneaddata进行质控、除杂、过滤;
- 利用Megahit软件对优化序列进行拼接;
- 使用MetaWRAP进行分箱 (包括metaBAT2、CONCOCT、MaxBin2三种主流方法),将短序列逐一组装成单菌基因组草图 (Bins),建议拼装完整度 > 70 %,污染率 < 10 %;
- 使用CheckM评估组装得到的Bins的质量,如基因组大小、完整性、杂合度等主要参数;
- 使用Salmon对各个Bins进行基因定量;
- 使用Prokka软件预测目标Bins的基因结构;
- 利用Diamond软件作KEGG/ COG/eggNOG基因功能注释,分别获得KO和EC号后,进一步对功能基因作富集分析和通路分析;
- 重点关注与乙酸降解密切相关的功能基因或代谢途径。
结果与分析
一、共培养标记后的qPCR检测结果
图7. 定量qPCR用于指示 DNA-SIP标记效率的示意图
图7所示:实验开始阶段 (第0天),乙酸降解功能菌的基因组DNA尚未得到13C标记,故实验组与对照组的各层中基因拷贝数浓度较为一致。随着标记时长逐渐增加 (第10天),乙酸降解功能菌的基因组DNA被13C标记,从而“变重”,故其各层中的基因拷贝数将向浮力密度更大的“重层”迁移,表现为与12C-乙酸对照组明显错峰,即为标记成功。
二、16S rRNA扩增子测序结果
图8. 标记样品的选择与高通量测序
图8所示:重点选取每个离心样品的各峰尖层 (F10)、及左右两层 (F9+F11) 进行测序可减少测序成本。经过物种丰度统计后,对比发现细菌A在13C实验组中富集,而在12C对照组中丰度较低,说明细菌A是潜在的乙酸降解菌群。而细菌B和细菌C在两组中的丰度差异不大,不是潜在的乙酸降解菌群。说明:本文仅设置了一个对照组进行简要说明,读者可根据实际情况设置更多对照组,排除假阳性标记结果。
三、宏基因组分箱结果
图9. 宏基因组Bins的物种注释与功能基因注释结果
图9所示:重点针对“重层”DNA样品进行宏基因组测序,并采用MetaWRAP分箱组装后一共获得了5个高质量的基因组草图 (Bins)。基于KEGG、COG等功能基因注释后,发现这些Bins含有特定的功能基因,可用于解释潜在的代谢机制。其中Bin1、2、3可注释至细菌A,与16S扩增子结果较为吻合。同时还发现了两种新型细菌 (Bin4、5)也可能是潜在的功能细菌,可进一步构建系统发育树探究其物种分类及潜在代谢能力。
溶液配方
- 微宇宙培养的MSM溶液配方 (以1 L计,用去离子水制备)
表2. MSM溶液配方
- 离心样品的纯化溶液配方
表3. 纯化溶液配方
失败经验
- 共培养实验需要通过预实验探索合适的标记时长,标记过久容易导致交叉污染(Cross Feeding),即被标记的功能细菌残体被其他非功能菌所捕食,导致非功能菌被错误标记而出现假阳性结果。
- 判断标记效果可利用荧光、16S rRNA-qPCR、功能基因-qPCR等方法综合判定。
致谢
感谢广东省科学院实施创新驱动发展能力建设专项 (2020GDASYL-20200103086),国家自然科学基金资助项目 (42007357),广东省基础与应用基础研究基金(2019A1515110351),中国博士后科学基金资助项目 (2019M662825 和 2020T130127),广州市科技计划项目资助 (202002030271 和 202002020072),广东省科学院实施创新驱动发展能力建设专项 (2019GDASYL-0103053),广东省“珠江人才计划”项目 (2017BT01Z176 和 2017GC010570) 对本工作的大力支持。
参考文献
- Alneberg, J., Bjarnason, B. S., de Bruijn, I., Schirmer, M., Quick, J., Ijaz, U. Z., Lahti, L., Loman, N. J., Andersson, A. F. and Quince, C. (2014). Binning metagenomic contigs by coverage and composition. Nature Methods 11(11): 1144-1146.
- Neufeld, J. D., Vohra, J., Dumont, M. G., Lueders, T., Manefield, M., Friedrich, M. W. and Murrell, J. C. (2007). DNA stable-isotope probing. Nature Protocols 2: 860.
- Quince, C., Walker, A. W., Simpson, J. T., Loman, N. J. and Segata, N. (2017). Shotgun metagenomics, from sampling to analysis. Nature Biotechnology 35(9): 833.
- Sun, W., Xiao, E., Häggblom, M., Krumins, V., Dong, Y., Sun, X., Li, F., Wang, Q., Li, B. and Yan, B. (2018). Bacterial survival strategies in an alkaline tailing site and the physiological mechanisms of dominant phylotypes as revealed by metagenomic analyses. Environmental Science & Technology 52(22): 13370-13380.
- Zhang, M., Li, Z., Haggblom, M. M., Young, L. Y., He, Z., Li, F., Xu, R., Sun, X. and Sun, W. (2020). Characterization of nitrate-dependent As(III)-oxidizing communities in arsenic-contaminated soil and investigation of their metabolic potentials by the combination of DNA-SIP and metagenomics. Environmental Science & Technology.
- Kang, D.D., Froμla, J., Egan, R., Wang, Z. (2015) MetaBAT, an efficient tool for accurately reconstructing single genomes from complex microbial communities. PeerJ Aug 27;3:e1165.
Copyright: © 2021 The Authors; exclusive licensee Bio-protocol LLC.
引用格式:徐锐, 陶婉, 黄端仪, 苏平舟, 孙晓旭, 张苗苗, 孙蔚旻. (2021). DNA稳定同位素示踪与宏基因组单菌草图组装联用技术. // 微生物组实验手册.
Bio-101: e2003705. DOI:
10.21769/BioProtoc.2003705.
How to cite: Xu, R., Tao, W., Huang, D. Y., Su, P. Z., Sun, X. X., Zhang, M. M. and Sun, W. M. (2021). DNA-Stable Isotope Probing and Metagenomics Binning. // Microbiome Protocols eBook.
Bio-101: e2003705. DOI:
10.21769/BioProtoc.2003705.