摘要:高通量测序技术的发展极大加速了微生物组领域的研究,微生物组分析也已应用于人、其它动物、植物、环境中微生物结构和微生物自身的研究,也是当前火热的研究领域之一。大量数据的生成促成了很多分析工具和流程的开发,经过多步生物信息分析获得很多结果表格。如何基于这些结果表进行进一步的可视化展示要求研究者需要熟悉数据格式的转换和至少一种绘图语言。ImageGP工具基于常见的生信数据结果表格形式,提供了定制化的参数,可以快速、可定制的进行微生物数据的可视化,如物种组成堆积柱状图、alpha多样性箱线图、beta多样性PCoA分析、LEfSe、PICRUSt、BugBase和Faprotax分析等,降低了微生物数据可视化的操作难度。
关键词: 微生物组, 可视化, 云平台
仪器设备
-
个人电脑安装了上网浏览器如火狐、谷歌浏览器、Safari等联网即可使用。
操作步骤
-
在火狐或谷歌浏览器的地址栏输入网址http://www.ehbio.com/CloudPlatform/front/,回车即可打开 ImageGP 绘图平台。首页可看到当前支持的图形类型和分析功能 (图1)。
图1. ImageGP支持绘制的部分图形和分析功能
-
微生物组样品内Alpha 多样性结果的可视化与统计检验
更多应用
-
ImageGP目前支持Boxplot、Flower plot、Line plot、Volcano plot、Heatmap、VennDiagram、Enrichment plot、Euler plot、Scatterplot、UpsetView plot、Bar plot、Histogram plot、PCA、PCoA、cPCoA等图形绘制。其它功能如WGCNA分析、差异菌群分析、菌群相关性网络的绘制、LEfSe,PICRUSt、FAPROTAX、BugBase等正在逐步更新中 (表2)。
表2. ImageGP当前支持的数据可视化类型和描述
-
每个工具都提供了Demo示例,并用轮播图展示了输入数据、输入参数和所能获得的图的样式 (图13)。
图13. 图形输入数据、参数示例和Demo按钮
-
ImageGP使用基础视频已上传至https://www.bilibili.com/video/BV1Zh411974X; 进阶视频已上传至https://www.bilibili.com/video/BV17D4y1o7y4。更多使用视频录制后会持续上传。
失败经验
ImageGP绘图时遇到的问题多为输入数据格式问题。在数据输入或选择后,点击`Check Data`按钮,会进行数据格式效验,提示数据中存在的问题。
-
绘图数据与metadata数据不匹配。通常绘图数据中的样本未包含在metadata数据中时会出现如下错误提示:
Error: The first column of Paste main data to text area is not equal to the first column of Input metadata data.
错误:Paste main data to text area的第一列不等于Input metadata data的第一列。
-
宽矩阵格式 (常见的表达矩阵、OTU丰度矩阵等) 第一列通常会作为行名字,是不允许有重复的。如果不符合,会弹出如下错误提示
Error: No duplicate names are allowed in the first column of the data in Paste main data to text area when Matrix format is Wide.
错误:当Matrix format是 Wide时,Paste main data to text area数据第一列不允许有重复值。
-
长宽矩阵数据格式混用。用户初始不了解长宽矩阵,可能出现混用。或者数据在Excel等中操作时引入了非数字时会出现此错误。若存在此问题,会弹出如下错误提示
Error: All value in Paste main data to text area should be numbers except for the first row and the first column when Matrix format is Wide. Column Group contains non-numerical values.
错误:类型错误,当Matrix format是 Wide时,Paste main data to text area中的数据除第一行第一列外都是数值类型,列Group包含非数字信息。
致谢
本项目由中国中医科学院基本科研业务费优秀青年科技人才 (创新类) 培养专项 (编号:ZZ13-YQ-095和ZZXT201708) 支持。感谢易汉博基因科技 (北京) 有限公司的同仁对网站建设的技术支持。感谢20万网友的使用和持续反馈。
参考文献
-
Liu, Y. X., Qin, Y., Chen, T., Lu, M. P., Qian, X. B., Guo, X. X. and Bai, Y. (2020). A practical guide to amplicon and metagenomic analysis of microbiome data. Protein Cell 1-16.
-
Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York.
-
Team, R. C. (2020). R: A language and environment for statistical computing. R Foundation for Statistical Computing. Vienna, Austria. ISBN: 3-900051-07-0.
Copyright: © 2021 The Authors; exclusive licensee Bio-protocol LLC.
引用格式:陈同, 刘永鑫. (2021). ImageGP在微生物组可视化中的应用. // 微生物组实验手册.
Bio-101: e2003723. DOI:
10.21769/BioProtoc.2003723.
How to cite: Chen, T. and Liu, Y. X. (2021). (2021). Visualization of Microbiome Data Using ImageGP. // Microbiome Protocols eBook.
Bio-101: e2003723. DOI:
10.21769/BioProtoc.2003723.