跨物种靶基因富集技术实验方案

摘要:本实验方案介绍了一种跨物种靶基因富集的方法,可以获得与探针相似度低至60-70%的目标基因序列。该方法能用于获得成千上万个单拷贝核基因编码序列,用于系统发育基因组学 (phylogenomics) 分析;也可以用于其它非模式生物功能基因的富集。实验方案包括三个实验方法和相关数据分析方法。1."MagNA磁珠清洗法纯化DNA产物"描述了通过自配MagNA清洗磁珠和缓冲液,可以几乎无成本地纯化DNA,用于靶基因文库构建和富集的各个步骤,也可用于一般的DNA纯化需求;2."文库构建"介绍了如何构建用于靶基因富集的Illumina文库;3."靶基因富集"是关于跨物种靶基因富集实验过程的详细步骤。另外,本方案还介绍了以单拷贝外显子为目标基因富集数据的组装和分析方法。本方案尽量选用实验室自配溶液和降低成本的设计,并尽可能地详尽描述实验步骤,旨在为相关科研工作者开展系统发育基因组学研究或其它方向的研究提供一种可操作、高效、低成本的解决方案。

关键词: 目标基因捕获, 外显子, 文库构建, 高通量测序, 数据组装, 系统发育基因组学

研究背景

        传统分子系统学研究往往采用一个或几个基因标记,通过设计PCR引物,扩增目标基因,然后克隆、测序。这种方法耗时费力,一次只能获得一个样本一个或几个基因的序列。随着测序技术的提高和测序成本的不断下降,越来越多的动物系统学和进化研究开始使用基因组水平的数据。但是目前采用全基因组测序的方法成本太高,特别是当研究涉及物种较多或者每个物种有多个样品的情况下。因此,越来越多的研究者通过使用简化基因组或靶基因富集等方法,获得基因组的部分同源序列用于系统学研究。
        简化基因组依靠限制性内切酶位点来选择同源序列,此方法用于遗传距离较远的物种往往不能保证序列的同源性,还可能会导致大量数据的缺失。而通过锚定超保守序列的基因富集方法,如ultraconserved elements (UCEs) 或anchored hybrid enrichment (AHE) 等方法获得的大部分序列是超保守的序列和非编码的侧翼序列。超保守序列提供的系统发育信息不足,而侧翼非编码序列与编码序列相比无论是在序列比对和适用分子进化模型等方面都还不成熟,不太适合用于系统学分析。另外,无论是UCEs还是AHE可用的标记数量有限。本方案介绍一种跨物种靶基因富集技术,通过改变杂交条件,降低杂交和清洗温度等步骤获得相似度低至60-70%的目标基因序列。因此,该方法比UCEs或AHE更具优势,可以用于富集不同物种的编码基因,能更好地用于系统发育基因组学的研究;也可以用于获得非模式物种的目标基因序列,用于基因功能进化的研究。
        本实验方案结合自主开发用于系统发育基因组学研究的分子标记,已成功应用于桑科植物 (Yao et al., 2013)、蚂蚁 (Stroeher et al., 2013)、绦虫 (Huan et al., 2016)、线虫、纤毛虫,鱼类 (Song et al., 2017,Yin et al., 2019)、爬行类和哺乳类等生物类群中。本实验方案尽量采用自配溶液和降低成本的设计,可以一次性获得一百多个样品的几千个基因序列。每个样品建库、富集和测序的总成本可以控制在300-400元。

材料与试剂

一、 "MagNA磁珠清洗法纯化DNA"试剂清单

  1. 5% Sera-Mag Magnetic Speed-beads (Fishersci,catalog number: 09-981-123,4 °C储存)
  2. PEG-8000 (生工,catalog number: A600433-0500,常温储存)
  3. 5 M NaCl (生工,catalog number: A100241,常温存储,自配至对应浓度)
  4. 1 M Tris-Cl (pH = 8.0) (生工,catalog number: B548127-0500,常温储存)
  5. 0.5 M EDTA (pH = 8.0) (Invitrogen,catalog number: 15575-020,常温存储)

二、 "靶基因富集文库构建"试剂清单

  1. Buffer Tango (10x) (Thermo, catalog number: BY5,-20 °C储存)
  2. dNTPs (10 mM each) (Invitrogen,catalog number: 18427088,-20 °C储存)
  3. ATP (100 mM) (Thermo,catalog number: R0441,-20 °C储存)
  4. T4 polynucleotide kinase (10 U/μl) (Thermo,catalog number: EK0031,-20 °C储存)
  5. T4 DNA polymerase (5 U/μl) (Thermo,catalog number: EP0061,-20 °C储存)
  6. T4 DNA ligase (5 U/μl) (Invitrogen,catalog number: 15224041,-20 °C储存)
  7. T4 DNA ligase buffer (10x) (T4 DNA ligase试剂盒配套)
  8. PEG-4000 (50%) (T4 DNA ligase试剂盒配套)
  9. Bsm polymerase, large fragment (8 U/μl) (Thermo,catalog number: EP0691,-20 °C储存)
  10. Bsm buffer (10x) (Bsm polymerase, large fragment (8U/μl) 试剂盒配套)
  11. KAPA HiFi Hotstart Ready Mix (2x) (KAPABIOSYSTEMS,catalog number: KK2602,-20 °C储存)

三、 "靶基因富集"试剂清单

  1. UltraPure™ SSPE, 20x (Invitrogen,catalog number: 15591043,常温储存)
  2. UltraPure™ 0.5M EDTA, pH 8.0 (Invitrogen,catalog number: 15575020,常温储存)
  3. Denhardt's Solution (50x) (Invitrogen,catalog number: 750018,-5 °C ~-30 °C储存)
  4. 10% SDS溶液 (生工,catalog number: B548118-0100,常温储存)
  5. SUPERase•In™ RNase Inhibitor (20 U/μl) (Invitrogen,catalog number: AM2696,-20 °C储存)
  6. DEPC 处理水 (生工,catalog number: B501005-0500,常温储存)
  7. RNA baits (Arbor Bioscience,-20 °C储存)
    注:RNA baits是一段带有生物素标记、与目标基因互补配对的RNA序列。通过杂交反应与目标基因结合,其特有的生物素能与链霉亲和素磁珠特异结合,根据此特性清洗去除非目标序列以达到富集效果。RNA baits可以根据目标基因进行设计,例如通过比较模式生物基因组寻找单拷贝核基因编码序列,设计RNA baits (Li et al., 2012)。
  8. Human Cot-1 DNA (Invitrogen,catalog number: 15279011,-20 °C储存)
  9. BO1 (封阻片段1,序列见"溶液配制")
  10. BO3 (封阻片段3,序列见"溶液配制")
  11. Dynabeads™ MyOne™ Streptavidin C1 (Invitrogen,catalog number: 65002,2-8 °C储存)
  12. Binding Buffer (成分见"溶液配制")
  13. Tween-20 (Amresco,catalog number: 0777-1L,常温储存)
  14. Wash Buffer2 (成分见"溶液配制")
  15. Wash Buffer1 (成分见"溶液配制")
  16. 1x TE buffer (生工,catalog number: B548106,常温储存)
  17. KAPA HiFi Hotstart Ready Mix (2x) (KAPABIOSYSTEMS,catalog number: KK2602,-20 °C储存)
  18. 20x SSC 缓冲液 (生工,catalog number: B548109-0200,常温储存)
  19. 1 M Tris-HCl 溶液,pH 7.5,无菌 (生工,catalog number: B548124-0500,常温储存)
  20. HPLC超纯水 (TEDIA,catalog number: WS2211-001,常温储存)

四、 其他耗材

  1. 0.2 ml 薄壁PCR管 (Axygen,catalog number: PCR-02-L-C)
  2. 各种型号的带滤芯枪头 (10 μl,100 μl,200 μl,1000 μl,Axygen)
  3. 0.2 ml 96孔PCR板盒 (淘宝)
  4. 自制磁板 (超强磁条 (淘宝) 嵌套于0.2 ml 96孔PCR板盒)

仪器设备

  1. PCR仪 (Eppendorf AG,22331 Hamburg)
  2. 杂交仪 (UVP HB-1000 Hybridizer)
  3. 0.1-2.5 μl, 0.5-10 μl, 2-20 μl, 10-100 μl, 20-200 μl, 100-1000 μl移液枪 (Eppendorf系列)
  4. 漩涡混匀仪 (上海沪析实业有限公司,Vortex-2)
  5. 微型掌上离心机 (上海沪析实业有限公司,HL-6KS)
  6. Nanodrop 3300超微量荧光分光光度计 (Thermo)
  7. 破碎仪 (Covaris M220)
  8. 高压蒸汽灭菌锅 (上海博讯实业有限公司)
  9. 服务器 (Linux系统,32 G以上的内存,500 G的存储)
  10. 电泳仪 (BIO-RAD,PowerPac-Basic)

分析软件

  1. Perl v5.18 or higher (https://www.perl.org/get.html)
  2. trim_galore v0.4.1 or higher (https://github.com/FelixKrueger/TrimGalore)
  3. cutadapt v1.2.1 or higher (https://github.com/marcelm/cutadapt)
  4. USEARCH 10.0.240 or higher (http://www.drive5.com/usearch/download.html)
  5. SGA v0.10.15 or higher (https://github.com/jts/sga)
  6. Exonerate v2.2.0 or higher (https://www.ebi.ac.uk/about/vertebrate-genomics/software/exonerate)
  7. Assexon (https://github.com/yhadevol/Assexon)
  8. Mafft v7.294b or higher (https://mafft.cbrc.jp/alignment/software/)
  9. RAxML (https://github.com/stamatak/standard-RAxML)
  10. ASTRAL (https://github.com/smirarab/ASTRAL)
  11. Figtree (http://tree.bio.ed.ac.uk/software/figtree/)

实验步骤

本实验方案包括三个部分:1.MagNA磁珠清洗法纯化DNA产物;2.文库构建;3.靶基因富集。

一、 MagNA磁珠清洗法纯化DNA产物

  1. 将30 μl的MagNA磁珠加入到0.2 ml PCR空管,将PCR管放在磁板上静置片刻,待磁珠吸附到管壁后,去除上清液 (可丢弃吸附上的磁性不强磁珠)。
  2. 以1:0.9的比例添加DNA样品与MagNA缓冲液 (见溶液配制),随后涡旋振荡PCR管片刻,使其充分混匀。
    注:1:0.9的比例是根据经验值而定,可最大化减少试剂的使用量、减少短片段的丢失,建议读者在配制MagNA缓冲液后,做浓度梯度预实验来确定最优的比例
  3. 常温下将PCR管置于96孔板上5 min (使磁珠吸附DNA),用微型离心机离心5 s。
  4. 将PCR管转移至磁板上5 min,直到磁珠吸附到管壁上。随后去除上清液,注意不要吸到磁珠。
  5. 继续将PCR管置于磁板上,添加186 μl的70%乙醇,用于清洗残留的MagNA缓冲液。静置1 min,随后去除上清液。
    注:不要吹打溶液,无需混匀磁珠
  6. 重复步骤5一次。
  7. 将PCR管盖敞开,室温静置5 min,使残留的乙醇彻底挥发。
  8. 添加20 μl DEPC处理水或1x TE缓冲液,将PCR管从磁板转移到96孔板上,用移液枪缓慢吹打溶液3-5次,使其充分混匀,室温静置1 min (释放DNA),随后离心5 s。
  9. 将PCR管放回磁板上,静置1 min,随后将上清液转移至新管中。
    注:在下面建库和富集过程中,往往不需洗脱DNA,而是保留有DNA的磁珠,此时省略第8-9步。

二、 文库构建

  1. DNA片段化
    1.1
    取0.3-1 μg DNA样品 (DNA片段大于100 bp),用Covaris M220破碎仪将DNA破碎成100-500 bp片段 (破碎仪可参考如下设置:Average Incident Power: 15 Watt, Peak Incident Power: 75 Watt, Duty Factor: 20%, Cycles/Burst: 200, Duration: 360 s;片段化DNA样品所需体积270 μl)。
    1.2
    分别取1 μl片段化产物和1 μl初始DNA,使用1%琼脂糖凝胶电泳进行检测。
    1.3
    取130 μl片段化DNA,正对照 (用于做正对照的样品可以是一般PCR产物,如300 bp左右的PCR产物) 和负对照 (30 μl超纯水) 作对比实验,用MagNA磁珠清洗法将片段化DNA吸附到磁珠上,随后去除上清液。


    图1. 破碎后的DNA示意图 图上分别为DNA样品和片段化DNA。

  2. 平末端修复
    2.1
    在冰盒上配制"平末端修复"反应溶液。将20 μl的反应溶液加入每个样品 (上一步保留的磁珠),并轻轻吹打3-5次混匀。

    成分 体积 (μl) 终浓度(20 μl体系)
    Buffer Tango (10x) 2 1x
    dNTPs (10 mM each) 0.2 100 μM each
    ATP (100 mM)
    T4 polynucleotide kinase (10 U/μl)
    T4 DNA polymerase (5 U/μl)
    DEPC处理水
    0.2
    1
    0.4
    16.2
    1 mM
    0.5 U/μl
    0.1 U/μl
    总体积 20
    注:建议在冰盒上进行操作

    2.2
    设置"平末端修复"程序如下:

    步骤 循环阶段 温度 时间 循环数
    1 平末端 25 °C 15 min 1
    2 DNA 5‘端磷酸化修饰 12 °C 5 min 1
    注:反应完成后,将PCR管离心5 s以免管盖内壁附着液滴,可以减少污染。

    2.3
    利用MagNA磁珠清洗法进行纯化 (无需添加新的磁珠),最后去除上清,保留磁珠。(仅做到磁珠清洗法的第7步)
    注:反应完成后需立即纯化,纯化产物可以4 °C过夜保存。
  3. 连接测序接头
    3.1
    在冰盒上配制"连接测序接头"反应溶液:

    成分 体积 (μl) 终浓度(40 μl体系)
    T4 DNA ligase buffer (10x) 4 1x
    PEG-4000 (50%) 4 5%
    Adapter mix P5 (50 μM each)
    Adapter mix P7 (50 μM each)
    T4 DNA ligase (5 U/μl)
    DEPC处理水
    1
    1
    1
    29
    1.25 μM each
    1.25 μM each
    0.125 U/μl
    总体积 40

    3.2
    将40 μl反应溶液加入上一步样品 (上一步保留的磁珠)中,轻轻吹打3-5次混匀。
    3.3
    设置"连接测序接头"程序如下:

    步骤 循环阶段 温度 时间 循环数
    1 连接测序接头 22 °C 30 min 1
    注:反应完成后,将PCR管离心5 s。

    3.4
    利用MagNA磁珠清洗法进行纯化 (无需添加新的磁珠),最后去除上清,保留干燥的磁珠。(仅做到磁珠清洗法的第7步)
    注:纯化产物可以4 °C过夜保存
  4. 缺刻补齐
    4.1
    在冰盒上配制"缺刻补齐"反应溶液:

    成分 体积(μl) 终浓度(40 μl体系)
    Bsm buffer (10x) 4 1x
    dNTPs (10 mM each)
    Bsm polymerase, large fragment (8 U/μl)
    DEPC处理水
    1
    1.5
    33.5
    250 μM each
    0.3 U/μl
    总体积 40

    4.2
    将40 μl反应溶液加入到上一步的样品 (上一步保留的磁珠) 中,轻轻吹打3-5次混匀。
    4.3
    设置"缺刻补齐"程序如下:

    步骤 循环阶段 温度 时间 循环数
    1 补齐缺刻 37 °C 20 min 1
    注:反应完成后,将PCR管离心5 s。

    4.4
    利用MagNA磁珠清洗法进行纯化 (无需添加新的磁珠),去除上清,将35 μl的1x TE缓冲液加入到每个样品中,保留磁珠在PCR管中,在管盖上标注"样品名+lib"。此时靶基因待富集文库已构建完成,可放于-20 °C环境下短期储存一个月。

  5. 预杂交PCR扩增在冰盒上配制"预杂交PCR扩增"反应溶液:

    成分 体积 (μl) 终浓度(25 μl体系)
    KAPA HiFi taq Ready Mix (2x) 12.5 1x
    Primer IS7 (10 μM)
    Primer IS8 (10 μM)
    0.75
    0.75
    0.3 μM
    0.3 μM
    总体积 14

    5.2
    将14 μl上述反应液加入到0.2ml PCR空管中,再分别加入11 μl第四步获得的样品 "lib"文库 (切记磁珠与溶液混匀后再吸取)。将样品与试剂吹打3-5次,充分混匀。设置"预杂交PCR"程序如下:

    步骤 循环阶段 温度 时间 循环数
    1 预变性 98 °C 45 s 1
    2 变性 98 °C 15 s 12-18 (具体循环数根据所添加样品的量而定)
    退火 60 °C 30 s
    延伸 72 °C 45 s
    3 延伸 72 °C 1 min 1
    4 降温 4 °C 5 min 1
    5 保存 12 °C 1

    5.3
    利用MagNA磁珠清洗法进行纯化 (需要添加新的MagNA磁珠!),然后将25 μl的1x TE缓冲液加入到每个样品管里,将上清液转移至新的0.2 ml PCR空管中,在管盖上标注"样品名+PreH",可放于-20 °C环境下短期储存一个月。
    5.4
    分别取1 μl "PreH"产物、1 μl 正对照原液 (300 bp),使用1%的琼脂糖凝胶电泳进行检测。若文库构建成功,则正对照的"PreH"产物长度比正对照原液稍长,且负对照的"PreH"产物中无条带。


    图2. 靶基因待富集文库构建结果电泳图 "J1"-"C15"共14个实验样品,"300 bp-lib"为正对照,"-"为负对照,"300 bp"为建库前的正对照DNA原液。Marker-D的片段大小从下至上分别为100 bp, 250 bp, 500 bp, 750 bp, 1 k, 2 k。

三、 靶基因富集

  1. 杂交
    1.1
    设置"靶基因富集"程序:

    步骤 循环阶段 温度 时间 循环数
    1 变性解链 95 °C 5 min 1
    2 预退火杂交 65 °C 5 min 1
    3 退火杂交 65 °C 240 min 1
    4 退火杂交 60 °C 240 min 1
    5 退火杂交 55 °C 240 min 1
    6 退火杂交 50 °C 240 min 1

    保存 50 °C
    注:共计16 h左右。 (通过降低退火温度、设定退火梯度温度,可杂交结合相似度低至60-70%的序列)

    1.2
    在室温下配制Hyb Baits Mix溶液 (杂交反应体系与RNA酶抑制剂),反应体系如下:

    成分 体积 (μl)
    HYB 20x SSPE 7
    HYB 0.5 M EDTA (pH = 8.0) 0.3
    HYB 50x Denhardt’s 3
    HYB 10% SDS 0.3
    SUPERase•In (20U/μl) 1
    RNA Baits (MYselect) 0.2
    DEPC处理水 4.8
    总体积 16.6
    注:各试剂添加完后,用移液枪轻轻地吹打混匀,随后用微型离心机离心5 s,将溶液集中到底部。

    1.3
    在室温下配制Lib Mix溶液 (封阻简单重复序列与接头测序序列),Lib Mix反应体系如下:

    成分 体积(μl)
    Block Human Cot1 (1 μg/μl) 2.5
    BO1.P5.F (200 μM) 0.5
    BO3.P7.part1.R (200 μM) 0.5
    总体积 3.5

    各试剂添加完后,用移液枪轻轻地吹打混匀,随后离心5 s,将溶液集中到底部。
            取0.2 ml薄壁PCR空管,在管盖上标注样品名。将3 μl的Lib Mix溶液加入到每个PCR管中,然后再分别加入11 μl样品"PreH"产物 (含有至少100 ng DNA),用移液枪轻轻地吹打混匀,随后用微型离心机离心5 s,将溶液集中到底部。
    1.4
    将混有Lib Mix和样品文库的PCR管放至PCR仪上,并启动反应程序。此时进入程序第一步,对DNA文库进行95 °C高温变性解链处理。
    1.5
    当程序到达第二步 (65 °C),将含有Hyb Baits Mixs的管子载入PCR仪,预热Hyb Baits Mix 5 min,期间混有Lib Mix和样品文库的PCR管始终置于PCR仪上。
    1.6
    5 min后,PCR仪上的管子不取出,继续维持65 °C,将16 μl的Hyb Baits Mix转移到混有Lib Mix和样品的PCR管中,用移液枪轻轻吹打混匀3-5次。盖紧PCR管。
    1.7
    维持反应体系在恒温体系下,直至程序结束。
    注:程序结束后,样品仍可在PCR仪上50 °C条件下放置数小时。
  2. Dynabeads链霉亲和素磁珠吸附与清洗
    2.1
    加nx 10 μl Dynabeads链霉亲和素磁珠到0.2 ml PCR新管中,每个PCR管中添加的磁珠不得超过100 μl,方便后续步骤清洗。
    2.2
    将PCR管静置于磁板上片刻,待磁珠吸附到管壁之后,去除上清液。
    2.3
    加100 μl的Binding缓冲液于PCR管中清洗磁珠。用移液枪轻轻吹打混匀。继续将PCR管静置于磁板上2 min,待磁珠吸附到管壁之后,去除上清液 (包含尚未被吸附到管壁上的少许磁珠)。
    2.4
    重复步骤2.3两次。
    2.5
    将nx 20 μl Binding缓冲液、1 μl 10%的Tween加入到步骤2.4的PCR管 (此时仅有磁珠),轻轻吹打混匀,将磁珠再次悬浮。
    2.6
    先将180 μl的Binding缓冲液加入到新的0.2 ml PCR空管中,再加入20 μl步骤2.5的磁珠悬浮液。
    2.7
    将步骤2.6配制好的200 μl磁珠溶液放置在PCR仪50 °C加热5 min。
    2.8
    将"靶基因富集"步骤1.7中的杂交产物加入到磁珠悬浮液中,用移液枪轻轻吹打混匀。随后将PCR管放入杂交仪中,50 °C反应30 min。同时在PCR仪上预热3x nx 190 μl Wash Buffer 2溶液 (提前配制Wash buffer 1,以Wash buffer 1为原料配制Wash buffer 2),保持50 °C 10 min。
    2.9
    待步骤2.8杂交结束后,用微型离心机离心5 s,将PCR管转移至磁板上 (磁板提前在杂交仪中预热),并在杂交仪中静置片刻 (不超过2 min),待磁珠吸附到管壁后,去除上清液。
    2.10
    将带有磁珠的PCR管放回PCR仪上 (程序维持在50 °C)。添加186 μl 50 °C的Wash Buffer 2到PCR管中,轻轻地将磁珠吹打混匀。继续在50 °C PCR仪上反应10 min。待10 min反应结束后,将PCR管静置于磁板上片刻 (不超过2 min),待磁珠吸附到管壁后,去除上清液。
    2.11
    重复步骤2.10两次。
    2.12
    在室温下将100 μl的1x TE缓冲液加入到PCR管中 (用以清洗残留的Wash Buffer 2)。将PCR管静置于磁板上1 min,待磁珠吸附到管壁后,去除上清液。
    2.13
    将35 μl的1x TE缓冲液加入PCR管中,在管盖上标注"样品名+1stcap",将其放置在-20 °C短期保存 (溶液中依然保留有磁珠)。
    注:清洗步骤时,减少PCR管暴露在室温的时间,尽量保持反应溶液在50 °C。步骤2.9应尽量移除干净上清液。
  3. 第一次杂交PCR (为第二次杂交作准备)
    3.1
    在冰盒上配制PCR扩增反应溶液:

    成分 体积 (μl) 终浓度(25 μl体系)
    KAPA HiFi HotStart Ready Mix (2x) 12.5 1x
    P5引物IS7 (10 μM) 0.75 0.3 μM
    P7引物IS8 (10 μM) 0.75 0.3 μM
    总体积 14

    将14 μl上述所配制的PCR扩增反应溶液加入到新的0.2 ml PCR空管中,随后添加11 μl第一次杂交1stcap产物 (确保磁珠与溶液混匀后再吸取),在管盖上标注样品名。用移液枪轻轻吹打3-5下。用以下PCR反应程序进行扩增:

    步骤 循环阶段 温度 时间 循环数
    1 预变性 98 °C 45 s 1
    2 变性 98 °C 15 s 12-14 (具体循环数根据所添加样品的量而定)
    退火 60 °C 30 s
    延伸 72 °C 45 s
    3 延伸 72 °C 1 min 1
    4 降温 4 °C 5 min 1
    5 保存 12 °C 1

    3.2
    用MagNA磁珠法清洗PCR扩增产物 (需要添加新的MagNA磁珠!)。清洗结束后,用25 μl的1x TE缓冲液进行洗脱,将上清液转移至新的200 μl PCR空管中,在管盖上标注"样品名+preH2"
    3.3
    取1 μl的PCR产物稀释10倍后,用Nanodrop3300分光光度计进行浓度的测定,产物稀释后浓度约在1 ng/μl左右。
  4. 用步骤3的PCR产物再做一遍杂交富集,即二次杂交 (重复步骤1和2)。第二次杂交并清洗后的产物命名为"样品名+2ndcap"。
  5. Indexing PCR
    5.1
    在冰盒上配制PCR扩增反应溶液如下:

    成分 体积 (μl) 终浓度(25 μl体系)
    KAPA HiFi HotStart Ready Mix (2x) 12.5 1x
    P5引物IS4 (10 μM) 0.5 0.2 μM
    总体积 13

    将13 μl上述所配制的PCR扩增反应溶液加入新的0.2 ml PCR空管,添加0.5 μl P7 index扩增引物 (见溶液配制),随后添加11.5 μl的第二次杂交2ndcap产物 (确保磁珠与溶液混匀后再吸取)。吹打混匀并离心5 s。用以下PCR程序进行扩增:

    步骤 循环阶段 温度 时间 循环数
    1 预变性 98 °C 45 s 1
    2 变性 98 °C 15 s 12-16 (具体循环数根据所添加样品的量而定)
    退火 60 °C 30 s
    延伸 72 °C 45 s
    3 延伸 72 °C 1 min 1
    4 降温 4 °C 5 min 1
    5s 保存 12 °C 1

    5.2
    用MagNA磁珠法清洗PCR扩增产物 (需要添加新的MagNA磁珠!)。清洗结束后,用25 μl的1x TE缓冲液进行洗脱,将上清液转移至新的200 μl PCR空管中,在管盖上标注"样品名+Ind"
    5.3
    分别取1 μl PCR产物,使用1%的琼脂糖凝胶电泳进行检测。
  6. 混样及送测
    6.1
    取1 μl PCR产物稀释10倍,用Nanodrop3300超微量荧光分光光度计进行浓度测定。确保样品稀释后浓度均在0.1-0.9 ng/μl范围之内。
    6.2
    将所有样品等摩尔量混合。
    6.3
    再次用Nanodrop 3300超微量荧光分光光度计对混合后产物进行浓度测定。终产物应有20 μl体积,且浓度应在2-50 nM (0.5-13 ng/μl) 之间。当满足上述条件后,即可送测。以Illumina Hiseq PE150测序平台为例。

数据分析

        利用 (Yuan et al., 2019) 发表的外显子富集数据组装流程进行富集数据的组装(Assexon,https://github.com/yhadevol/Assexon)。
        此富集数据组装流程共分为3步:数据预处理,数据组装,数据后期处理。
一、 数据预处理

  1. 批量解压二代测序得到的原始数据
    $ perl gunzip_Files.pl \
    --gzip raw_reads \
    --gunzipped gunzipped_raw_reads
  2. 去除接头及低质量的序列
    $ perl trim_adaptor.pl \
    --raw_reads gunzipped_raw_reads \
    --trimmed trimmed
  3. 矫正编码基因的阅读框,并翻译成氨基酸序列
    $ perl predict_frames.pl \
    --baits reference.fas \
    --cds reference.onehitCDSmarkers.column1.txt \
    --ref_prot reference.pep.fas
    或者手动矫正编码基因阅读框

二、 数据组装

  1. 检查软件是否已装齐
    $ perl assemble.pl –check_depends
  2. 序列组装
    $ perl assemble.pl \
    --trimmed trimmed \
    --queryp reference.aa.fas \
    --queryn reference.dna.fas \
    --db reference.genome.fas \
    --dbtype nucleo \
    --ref_name reference_name \
    --outdir assemble_result

三、 数据后期处理

  1. 添加已知基因组物种的直系同源序列,并与组装的数据合并
    $ perl get_orthologues.pl \
    --query reference.dna.fas \
    --querydb reference.genome.fas \
    --subdb "species1.genome.fas|species2.genome.fas" \
    --subname "species1 species2" \
    --outdir orthologs
    $ perl merge_loci.pl \
    --indir "assemble_result/nf orthologs/nf" \
    --outdir merged_nf \
    --min_seq 3
  2. 删除不需要的样品序列信息
    $ perl pick_taxa.pl \
    --indir merged_nf \
    --outdir merged_nf_deselected \
    --deselected_taxa "species2"
  3. 序列比对
    $ perl mafft_aln.pl \
    --dna_unaligned merged_nf \
    --dna_aligned merged_nf_aligned
  4. 过滤比对质量差的序列
    $ perl filter.pl \
    --indir merged_nf_aligned \
    --filtered merged_nf_filtered \
    --ref_taxa "reference_name
  5. 统计序列信息
    $ perl statistics.pl \
    --coding_aligned merged_nf_filtered

四、 基因串联构建系统树

  1. 串联基因
    $ perl concat_loci.pl \
    --indir merged_nf_filtered \
    --outfile concat
  2. 基于最大似然法构建基因树
    $ raxmlHPC \
    -m GTRGAMMA \
    -p 12345 \
    -q dna12_3.partition.txt \
    -s concat.phy \
    -n genetree

五、 基于多物种溯祖模型的物种树构建

  1. 为每个基因构建一个基因树
    $ perl construct_tree.pl \
    --indir merged_nf_filtered
  2. 利用Linux的"cat"命令将步骤1生成的基因树合并到一个文件里
    $ cat ./merged_nf_filtered/* > catree.fas
  3. 利用ASTRAL构建物种树
    $ java -jar astral.jar -I catree.fas -o species.tre

六、 寻找SNP位点

  1. 生成一致序列 (若参考序列已有基因组,则可省略此步,直接用基因组数据)
    $ perl consensus.pl \
    --indir merged_nf_filtered \
    --outfile consensus.fas
  2. 利用GATK软件寻找SNP位点
    $ gatk.sh consensus_reference num_of_thread sample1 sample2 sample3 …
  3. 将vcf文件转格式,用于BEAST, STRUCTURE等分析
    $ perl vcftosnps.pl \
    --vcf species.vcf


    图3. 数据分析流程图

溶液配方

一、 MagNA磁珠法清洗DNA溶液配方

  1. 100 ml的MagNA beads

    成分 体积 终浓度
    5% Sera-Mag Magnetic Speed-beads (FisherSci, catalog number: 09-981-123,4 °C储存) 2 ml 0.1%
    PEG8000 (生工,catalog number: A600433-0500,常温储存) 18 g 18%
    5 M NaCl (生工,catalog number: A100241,常温存储,自配至对应浓度) 50 ml 2.5 M
    1 M Tris-Cl, pH 8.0 (生工, catalog number: B548127-0500) 1 ml 10 mM
    0.5 M EDTA, pH 8.0 (Invitrogen, catalog number: 15575-038) 200 μl 1 mM
    加超纯水补齐至100 ml


  2. 100 ml的MagNA缓冲液

    成分 体积 终浓度
    PEG8000 (生工,catalog number: A600433-0500,常温储存) 18 g 18%
    5 M NaCl (生工,catalog number: A100241,常温存储,自配至对应浓度) 50 ml 2.5 M
    1 M Tris-Cl, pH 8.0 (生工, catalog number: B548127-0500) 1 ml 10 mM
    0.5 M EDTA, pH 8.0 (Invitrogen, catalog number: 15575-038) 200 μl 1 mM
    加超纯水补齐至100 ml


二、 文库构建溶液配方

  1. Adapter Mix
    配制下述试剂需在不同PCR管中进行
    1.1
    寡核苷酸杂交缓冲液 (10x):

    成分 体积(μl) 终浓度(10 ml体系)
    NaCl (5 M) 1 ml 500 mM
    Tris-Cl, pH 8.0 (1 M) 100 μl 10 mM
    EDTA, pH 8.0 (0.5 M) 20 μl 1 mM
    H2O 8.88 ml

    1.2
    Adapter mix P5 (100 μM):

    成分 体积(μl) 终浓度(100 μl体系)
    IS1_adapter_P5.F (500 μM) 20 100 μM
    IS3_adapter_P5+P7.R (500 μM) 20 100 μM
    寡核苷酸杂交缓冲液 (10x) 10 1x
    H2O 50

    1.3
    Adapter mix P7 (100 μM):

    成分 体积(μl) 终浓度(100 μl体系)
    IS2_adapter_P7.F (500 μM) 20 100 μM
    IS3_adapter_P5+P7.R (500 μM) 20 100 μM
    寡核苷酸杂交缓冲液 (10x) 10 1x
    H2O 50

    1.4
    将步骤1.2,1.3的溶液分别振荡混匀,利用下述程序进行退火反应,形成局部互补的双链接头序列

    步骤 循环阶段 温度 时间 循环数
    1 变性解链 95 °C 10 s 1
    2 退火 从95 °C梯度降温至12 °C,降温速率为0.1 °C/s 1


三、 靶基因富集溶液配方

  1. Binding Buffer

    成分 体积(总体积200 ml)
    5 M NaCl (生工,catalog number: A100241,常温存储,自配至对应浓度) 40 ml
    1 M Tris-HCL (pH = 7.5) (生工, catalog number: B548124-0500) 2 ml
    0.5 M EDTA (pH = 8) (Invitrogen, catalog number: 15575-038) 0.4 ml
    H2O (TEDIA, catalog number: WS2211-001) 157.6 ml

  2. Wash Buffer1

    成分 体积(总体积50 ml)
    20x SSC (生工, catalog number: B548109-0200) 2.5 ml
    10% SDS (生工, catalog number: B548118-0100) 500 μl
    0.5 M EDTA (Invitrogen, catalog number: 15575-038) 100 μl
    H2O (TEDIA, catalog number: WS2211-001) 46.9 ml

  3. Wash Buffer2

    成分 体积(总体积50 ml)
    Wash Buffer 1 5 ml
    10% SDS (生工, catalog number: B548118-0100) 0.5 ml
    H2O (TEDIA, catalog number: WS2211-001) 44.5 ml

序列信息

  1. 接头与引物

    Name Sequences
    IS1_adapter.P5 a*c*a*c*TCTTTCCCTACACGACGCTCTTCCg*a*t*c*t
    IS2_adapter.P7 g*t*g*a*CTGGAGTTCAGACGTGTGCTCTTCCg*a*t*c*t
    IS3_adapter.P5+P7 a*g*a*t*CGGAa*g*a*g*c
    IS4_indPCR.P5 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTT
    IS7_short_amp.P5 ACACTCTTTCCCTACACGAC
    IS8_short_amp.P7 GTGACTGGAGTTCAGACGTGT
    Index_primer_8nt_XXX CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGT
    注:*代表的是PTO键 (硫代修饰键)

  2. BLOCK

    类型 序列
    BO1.P5.F AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-Pho
    BO3.P7.part1.F AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC-Pho

  3. P7 Index Primer 8nt信息

    ID P7 Index name P7 primer seq
    1 index_8nt_1 CAAGCAGAAGACGGCATACGAGATcgttggttGTGACTGGAGTTCAGACGTGT
    2 index_8nt_2 CAAGCAGAAGACGGCATACGAGATttctggttGTGACTGGAGTTCAGACGTGT
    3 index_8nt_3 CAAGCAGAAGACGGCATACGAGATgcatggttGTGACTGGAGTTCAGACGTGT
    4 index_8nt_4 CAAGCAGAAGACGGCATACGAGATgttcggttGTGACTGGAGTTCAGACGTGT
    5 index_8nt_5 CAAGCAGAAGACGGCATACGAGATtggcggttGTGACTGGAGTTCAGACGTGT
    6 index_8nt_6 CAAGCAGAAGACGGCATACGAGATaaccggttGTGACTGGAGTTCAGACGTGT
    7 index_8nt_7 CAAGCAGAAGACGGCATACGAGATtctaggttGTGACTGGAGTTCAGACGTGT
    8 index_8nt_8 CAAGCAGAAGACGGCATACGAGATctgaggttGTGACTGGAGTTCAGACGTGT
    9 index_8nt_9 CAAGCAGAAGACGGCATACGAGATggcaggttGTGACTGGAGTTCAGACGTGT
    10 index_8nt_10 CAAGCAGAAGACGGCATACGAGATacttcgttGTGACTGGAGTTCAGACGTGT
    11 index_8nt_11 CAAGCAGAAGACGGCATACGAGATtagtcgttGTGACTGGAGTTCAGACGTGT
    12 index_8nt_12 CAAGCAGAAGACGGCATACGAGATctatcgttGTGACTGGAGTTCAGACGTGT
    13 index_8nt_13 CAAGCAGAAGACGGCATACGAGATgatgcgttGTGACTGGAGTTCAGACGTGT
    14 index_8nt_16 CAAGCAGAAGACGGCATACGAGATgcgccgttGTGACTGGAGTTCAGACGTGT
    15 index_8nt_68 CAAGCAGAAGACGGCATACGAGATcggttggtGTGACTGGAGTTCAGACGTGT
    16 index_8nt_89 CAAGCAGAAGACGGCATACGAGATaagttcgtGTGACTGGAGTTCAGACGTGT
    17 index_8nt_128 CAAGCAGAAGACGGCATACGAGATccggttctGTGACTGGAGTTCAGACGTGT
    18 index_8nt_129 CAAGCAGAAGACGGCATACGAGATgtcgttctGTGACTGGAGTTCAGACGTGT
    19 index_8nt_179 CAAGCAGAAGACGGCATACGAGATtcagtactGTGACTGGAGTTCAGACGTGT
    20 index_8nt_184 CAAGCAGAAGACGGCATACGAGATgttcaactGTGACTGGAGTTCAGACGTGT
    21 index_8nt_200 CAAGCAGAAGACGGCATACGAGATatacctatGTGACTGGAGTTCAGACGTGT
    22 index_8nt_208 CAAGCAGAAGACGGCATACGAGATtgcttgatGTGACTGGAGTTCAGACGTGT
    23 index_8nt_220 CAAGCAGAAGACGGCATACGAGATgcagtcatGTGACTGGAGTTCAGACGTGT
    24 index_8nt_229 CAAGCAGAAGACGGCATACGAGATtcgataatGTGACTGGAGTTCAGACGTGT
    25 index_8nt_233 CAAGCAGAAGACGGCATACGAGATtaatcaatGTGACTGGAGTTCAGACGTGT
    26 index_8nt_236 CAAGCAGAAGACGGCATACGAGATagaggttgGTGACTGGAGTTCAGACGTGT
    27 index_8nt_237 CAAGCAGAAGACGGCATACGAGATcctcgttgGTGACTGGAGTTCAGACGTGT
    28 index_8nt_254 CAAGCAGAAGACGGCATACGAGATctcaattgGTGACTGGAGTTCAGACGTGT
    29 index_8nt_256 CAAGCAGAAGACGGCATACGAGATaaggtctgGTGACTGGAGTTCAGACGTGT
    30 index_8nt_288 CAAGCAGAAGACGGCATACGAGATctggttggGTGACTGGAGTTCAGACGTGT
    31 index_8nt_298 CAAGCAGAAGACGGCATACGAGATccagctggGTGACTGGAGTTCAGACGTGT
    32 index_8nt_301 CAAGCAGAAGACGGCATACGAGATgactatggGTGACTGGAGTTCAGACGTGT
    33 index_8nt_302 CAAGCAGAAGACGGCATACGAGATctatatggGTGACTGGAGTTCAGACGTGT
    34 index_8nt_303 CAAGCAGAAGACGGCATACGAGATtaagatggGTGACTGGAGTTCAGACGTGT
    35 index_8nt_309 CAAGCAGAAGACGGCATACGAGATaggatcggGTGACTGGAGTTCAGACGTGT
    36 index_8nt_316 CAAGCAGAAGACGGCATACGAGATgtcgccggGTGACTGGAGTTCAGACGTGT
    37 index_8nt_327 CAAGCAGAAGACGGCATACGAGATcgtcgaggGTGACTGGAGTTCAGACGTGT
    38 index_8nt_332 CAAGCAGAAGACGGCATACGAGATttggcaggGTGACTGGAGTTCAGACGTGT
    39 index_8nt_335 CAAGCAGAAGACGGCATACGAGATattcaaggGTGACTGGAGTTCAGACGTGT
    40 index_8nt_337 CAAGCAGAAGACGGCATACGAGATaatattcgGTGACTGGAGTTCAGACGTGT
    41 index_8nt_340 CAAGCAGAAGACGGCATACGAGATaggcgtcgGTGACTGGAGTTCAGACGTGT
    42 index_8nt_347 CAAGCAGAAGACGGCATACGAGATtccgatcgGTGACTGGAGTTCAGACGTGT
    43 index_8nt_362 CAAGCAGAAGACGGCATACGAGATgagtcgcgGTGACTGGAGTTCAGACGTGT
    44 index_8nt_389 CAAGCAGAAGACGGCATACGAGATccgcaacgGTGACTGGAGTTCAGACGTGT
    45 index_8nt_398 CAAGCAGAAGACGGCATACGAGATatgaatagGTGACTGGAGTTCAGACGTGT
    46 index_8nt_407 CAAGCAGAAGACGGCATACGAGATacctcgagGTGACTGGAGTTCAGACGTGT
    47 index_8nt_420 CAAGCAGAAGACGGCATACGAGATatgctcagGTGACTGGAGTTCAGACGTGT
    48 index_8nt_427 CAAGCAGAAGACGGCATACGAGATttatccagGTGACTGGAGTTCAGACGTGT
    49 index_8nt_432 CAAGCAGAAGACGGCATACGAGATtaacgaagGTGACTGGAGTTCAGACGTGT
    50 index_8nt_434 CAAGCAGAAGACGGCATACGAGATgactcaagGTGACTGGAGTTCAGACGTGT
    51 index_8nt_438 CAAGCAGAAGACGGCATACGAGATaacggttcGTGACTGGAGTTCAGACGTGT
    52 index_8nt_439 CAAGCAGAAGACGGCATACGAGATcagcgttcGTGACTGGAGTTCAGACGTGT
    53 index_8nt_440 CAAGCAGAAGACGGCATACGAGATatacgttcGTGACTGGAGTTCAGACGTGT
    54 index_8nt_455 CAAGCAGAAGACGGCATACGAGATcgtacgtcGTGACTGGAGTTCAGACGTGT
    55 index_8nt_475 CAAGCAGAAGACGGCATACGAGATttatcatcGTGACTGGAGTTCAGACGTGT
    56 index_8nt_476 CAAGCAGAAGACGGCATACGAGATgaggcatcGTGACTGGAGTTCAGACGTGT
    57 index_8nt_497 CAAGCAGAAGACGGCATACGAGATaacctggcGTGACTGGAGTTCAGACGTGT
    58 index_8nt_502 CAAGCAGAAGACGGCATACGAGATagttaggcGTGACTGGAGTTCAGACGTGT
    59 index_8nt_509 CAAGCAGAAGACGGCATACGAGATcgtatcgcGTGACTGGAGTTCAGACGTGT
    60 index_8nt_517 CAAGCAGAAGACGGCATACGAGATgctaacgcGTGACTGGAGTTCAGACGTGT
    61 index_8nt_522 CAAGCAGAAGACGGCATACGAGATagcagagcGTGACTGGAGTTCAGACGTGT
    62 index_8nt_524 CAAGCAGAAGACGGCATACGAGATtgaccagcGTGACTGGAGTTCAGACGTGT
    63 index_8nt_526 CAAGCAGAAGACGGCATACGAGATggagaagcGTGACTGGAGTTCAGACGTGT
    64 index_8nt_530 CAAGCAGAAGACGGCATACGAGATccaattccGTGACTGGAGTTCAGACGTGT
    65 index_8nt_549 CAAGCAGAAGACGGCATACGAGATttcaagccGTGACTGGAGTTCAGACGTGT
    66 index_8nt_551 CAAGCAGAAGACGGCATACGAGATttggtaccGTGACTGGAGTTCAGACGTGT
    67 index_8nt_553 CAAGCAGAAGACGGCATACGAGATattctaccGTGACTGGAGTTCAGACGTGT
    68 index_8nt_554 CAAGCAGAAGACGGCATACGAGATcaactaccGTGACTGGAGTTCAGACGTGT
    69 index_8nt_559 CAAGCAGAAGACGGCATACGAGATcgccgaccGTGACTGGAGTTCAGACGTGT
    70 index_8nt_560 CAAGCAGAAGACGGCATACGAGATgactaaccGTGACTGGAGTTCAGACGTGT
    71 index_8nt_561 CAAGCAGAAGACGGCATACGAGATgctgaaccGTGACTGGAGTTCAGACGTGT
    72 index_8nt_582 CAAGCAGAAGACGGCATACGAGATgccaagacGTGACTGGAGTTCAGACGTGT
    73 index_8nt_583 CAAGCAGAAGACGGCATACGAGATaacttaacGTGACTGGAGTTCAGACGTGT
    74 index_8nt_585 CAAGCAGAAGACGGCATACGAGATtattgaacGTGACTGGAGTTCAGACGTGT
    75 index_8nt_589 CAAGCAGAAGACGGCATACGAGATgttgcaacGTGACTGGAGTTCAGACGTGT
    76 index_8nt_604 CAAGCAGAAGACGGCATACGAGATggctgctaGTGACTGGAGTTCAGACGTGT
    77 index_8nt_610 CAAGCAGAAGACGGCATACGAGATcctaactaGTGACTGGAGTTCAGACGTGT
    78 index_8nt_620 CAAGCAGAAGACGGCATACGAGATagcattgaGTGACTGGAGTTCAGACGTGT
    79 index_8nt_625 CAAGCAGAAGACGGCATACGAGATactactgaGTGACTGGAGTTCAGACGTGT
    80 index_8nt_627 CAAGCAGAAGACGGCATACGAGATcttcatgaGTGACTGGAGTTCAGACGTGT
    81 index_8nt_647 CAAGCAGAAGACGGCATACGAGATtcgaacgaGTGACTGGAGTTCAGACGTGT
    82 index_8nt_650 CAAGCAGAAGACGGCATACGAGATcgaatagaGTGACTGGAGTTCAGACGTGT
    83 index_8nt_678 CAAGCAGAAGACGGCATACGAGATtgcgtccaGTGACTGGAGTTCAGACGTGT
    84 index_8nt_679 CAAGCAGAAGACGGCATACGAGATgtactccaGTGACTGGAGTTCAGACGTGT
    85 index_8nt_682 CAAGCAGAAGACGGCATACGAGATcgtcgccaGTGACTGGAGTTCAGACGTGT
    86 index_8nt_683 CAAGCAGAAGACGGCATACGAGATtaacgccaGTGACTGGAGTTCAGACGTGT
    87 index_8nt_684 CAAGCAGAAGACGGCATACGAGATaattaccaGTGACTGGAGTTCAGACGTGT
    88 index_8nt_685 CAAGCAGAAGACGGCATACGAGATtcataccaGTGACTGGAGTTCAGACGTGT
    89 index_8nt_686 CAAGCAGAAGACGGCATACGAGATcaggaccaGTGACTGGAGTTCAGACGTGT
    90 index_8nt_687 CAAGCAGAAGACGGCATACGAGATgtcaaccaGTGACTGGAGTTCAGACGTGT
    91 index_8nt_691 CAAGCAGAAGACGGCATACGAGATagaagtaaGTGACTGGAGTTCAGACGTGT
    92 index_8nt_693 CAAGCAGAAGACGGCATACGAGATcatcctaaGTGACTGGAGTTCAGACGTGT
    93 index_8nt_695 CAAGCAGAAGACGGCATACGAGATgacgataaGTGACTGGAGTTCAGACGTGT
    94 index_8nt_700 CAAGCAGAAGACGGCATACGAGATtcatcgaaGTGACTGGAGTTCAGACGTGT
    95 index_8nt_702 CAAGCAGAAGACGGCATACGAGATccgacgaaGTGACTGGAGTTCAGACGTGT
    96 index_8nt_706 CAAGCAGAAGACGGCATACGAGATtggatcaaGTGACTGGAGTTCAGACGTGT
    97 index_8nt_708 CAAGCAGAAGACGGCATACGAGATgcgcgcaaGTGACTGGAGTTCAGACGTGT
    98 index_8nt_709 CAAGCAGAAGACGGCATACGAGATagctccaaGTGACTGGAGTTCAGACGTGT
    99 index_8nt_710 CAAGCAGAAGACGGCATACGAGATtctgccaaGTGACTGGAGTTCAGACGTGT
    100 index_8nt_711 CAAGCAGAAGACGGCATACGAGATggagccaaGTGACTGGAGTTCAGACGTGT
    注:为了确保测序样品的Index碱基组成平衡,减少因index碱基不平衡而造成的测序错误。当样品数量小于30 h,推荐使用下列任一index编号组合:

    3.1
    10个样品
    Set I: 27, 100, 208, 236, 336, 526, 527, 533, 685, 702
    Set II: 1, 2, 68, 432, 436, 442, 554, 647, 687, 693
    Set III: 10, 138, 254, 423, 435, 440, 527, 551, 639, 679
    3.2
    15个样品
    Set I: 1, 10, 89, 138, 254, 423, 435, 440, 527, 549, 551, 625, 639, 679, 711
    Set II: 1, 10, 93, 233, 236, 285, 325, 517, 530, 533, 571, 654, 679, 687, 696
    Set III: 2, 7, 9, 11, 288, 420, 435, 524, 526, 530, 559, 676, 684, 693, 695
    3.3
    20个样品
    Set I: 1, 2, 4, 124, 130, 255, 347, 420, 434, 435, 441, 522, 526, 527, 547, 647, 668, 686, 691, 693
    Set II: 2, 3, 12, 93, 138, 237, 255, 309, 388, 419, 527, 533, 549, 558, 589, 625, 639, 695, 706, 711
    Set III: 1, 2, 7, 9, 11, 288, 335, 420, 431, 435, 524, 526, 530, 547, 559, 647, 676, 684, 693, 695
    3.4
    25个样品
    Set I: 3, 7, 10, 13, 26, 200, 229, 235, 288, 325, 339, 381, 432, 487, 517, 522, 527, 530, 546, 609, 686,687, 688, 703, 709
    Set II: 1, 9, 20, 100, 129, 229, 332, 336, 383, 407, 421, 435, 440, 443, 513, 526, 527, 533, 546, 603,628, 676, 684, 700, 706
    Set III: 1, 8, 10, 11, 16, 129, 219, 254, 332, 334, 337, 362, 400, 517, 522, 526, 527, 565, 567, 654, 679,683, 685, 691, 710
    3.5
    30个样品
    Set I: 1, 7, 10, 16, 50, 100, 129, 130, 255, 336, 339, 383, 388, 419, 431, 513, 517, 526, 527, 533, 547,588, 617, 633, 639, 650, 688, 693, 695, 707
    Set II: 2, 3, 4, 7, 27, 89, 134, 229, 255, 303, 313, 332, 388, 435, 436, 527, 530, 533, 546, 571, 582,587, 604, 609, 620, 638, 672, 686, 693, 707
    Set III: 1, 2, 4, 13, 27, 208, 219, 229, 237, 332, 340, 389, 407, 431, 435, 438, 482, 515, 526, 527, 530,554, 567, 603, 633, 647, 678, 686, 687, 693
    注:当样品数量超过30 h,可选取任一Index。

致谢

实验方案中文库构建和跨物种靶基因富集步骤根据作者2013年发表的方法修改 (Li et al., 2013),数据分析参考作者2019年发表的方法 (Yuan et al., 2019)。

竞争性利益声明

作者声明没有利益冲突

参考文献

  1. Meyer, M. and Kircher, M. (2010). Illumina sequencing library preparation for highly multiplexed target capture and sequencing. Cold Spring Harb Protoc prot5448.
  2. Li, C., Riethoven, J. J. M. and Naylor G. J. P. (2012). EvolMarkers: a database for mining exon and intron markers for evolution, ecology and conservation studies. Mol Ecol Resour 12(5): 967-971.
  3. Li, C., Hofreiter, M., Straube, N., Corrigan, S. and Naylor, G. J. P. (2013). Capturing protein-coding genes across highly divergent species. BioTechniques 54: 321-326.
  4. Yao, X., Li, C. and Dick, C. W. (2013). Exon-primed intron-crossing (EPIC) markers for evolutionary studies of Ficus and other taxa in the fig family (Moraceae). Appl Plant Sci 1(10): 1-4.
  5. Stroeher, P. R., Li, C. and Pie, M. R. (2013). Exon-primed intron-crossing (EPIC) markers as a tool for ant phylogeography. Rev Bras Entomol 57(4): 427-430.
  6. Yuan, H., Jiang, J., Jimenez, F. A., Hoberg, E. P., Cook, J. A., Galbreath , K. E. and Li, C. H. (2016). Target gene enrichment in the cyclophyllidean cestodes, the most diverse group of tapeworms. Mol Ecol Resour 16(5): 1095-1106.
  7. Song, S., Zhao, J. and Li, C. (2017). Species delimitation and phylogenetic reconstruction of the sinipercids (Perciformes: Sinipercidae) based on target enrichment of thousands of nuclear coding sequences. Mol Phylogenet Evol 111: 44-55.
  8. Yin, G., Pan, Y., Sarker, A., Baki, M. A., Kim, J. K., Wu, H. and Li, C. (2019). Molecular systematics of Pampus (Perciformes: Stromateidae) based on thousands of nuclear loci using target-gene enrichment. Mol Phylogenet Evol 140: 106595.
  9. Yuan, H., Atta, C., Tornabene, L. and Li, C. (2019). Assexon: assembling exon using gene capture data. Evol Bioinform 15: 1-13.
登录/注册账号可免费阅读全文
登录 | 注册
Copyright: © 2021 The Authors; exclusive licensee Bio-protocol LLC.
引用格式:黄俊满, 袁昊, 李晨虹. (2021). 跨物种靶基因富集技术实验方案. Bio-101: e1010606. DOI: 10.21769/BioProtoc.1010606.
How to cite: Huang, J. M., Yuan, H. and Li, C. H. (2021). Protocol for Cross-species Target-gene Enrichment. Bio-101: e1010606. DOI: 10.21769/BioProtoc.1010606.