设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 1163|回复: 0

一文了解单细胞RNA测序的可视化与统计分析如何更简单高效

[复制链接]
发表于 2021-4-13 16:43:05 | 显示全部楼层 |阅读模式
单细胞RNA测序(scRNA-seq)的出现为探索单细胞水平的基因表达谱提供了前所未有的机会。目前,scRNA-seq已成为研究细胞异质性的关键生物学问题(尤其是在肿瘤学和免疫学研究中)的首选。然而,由于它的高维、稀疏性、跨细胞群体的异质性、技术噪音以及缺乏可重复性,它在数据可视化和统计分析方面提出了新的挑战。

基于下一代测序的基因组学,转录组学和表观基因组学技术现在越来越关注于单个细胞的表征。例如,单细胞RNA测序(scRNA-seq)可以在细胞水平上全面表征转录变化,并有助于更好地了解单个细胞在其微环境中的功能。最近,通过呈现单个免疫细胞的转录变化,它已经被用来抗击COVID-19。

JMP Genomics是JMP产品家族中专为基因组学分析的专业分析软件。JMP Genomics 10中全新的标准化、交互式且可重现的scRNA-seq工作流程,可以赋予科学家们充满信心地探索scRNA-seq数据。通过数据质量控制(QC),可变基因选择,稀疏SVD分析,聚类分析,基因重要性筛选,动态的可视化(例如小提琴图,山脊线图和点图)以及差异基因表达分析帮助用户通过充分地探索复杂和稀有细胞群体,并检测跨细胞类型和其他实验条件之间的基因差异化表达模式。今天我们就一起看看JMP Genomics 10中全新的scRNA-seq工作流程究竟有哪些强大的功能。


以JMP Genomics 10为平台
在今天的案例中,我们以 PBMC数据集为例。


首先,打开JMP Genomics 10菜单Import>Next-Gen Sequencing,以稀疏格式读取原始UMI计数数据,然后将其转换为密集格式。
然后,可以将输出的密集数据用作基本单细胞RNA-seq工作流程的输入数据,此工作流程位于Workflows>Basic子菜单。在界面中指定设置后运行后,可以在JMP Project里生成分页式的报告。



图1 ScRNA-Seq工作流程界面数据概述和质量控制



此工作流程执行质量控制步骤以删除低质量的细胞和基因。Data Overview报告可以帮助你确定需要使用的质量控制标准。
图2:包含了关键统计信息的数据分析报告





可变基因选择


处理scRNA-seq数据中的高维度和稀疏性的一种方法是使用那些表现出高细胞间差异的基因。为此,此工作流程提供了两种可变基因选择方法,即Dispersion和VST,以帮助你选择一组高度可变的基因用于后续分析。

Variable Gene Selection 页面显示了方差均值图,其中,选定的可变基因为红色。
图3:基于VST方法的方差均值图。红色的点代表选择的可变基因,其余的基因被丢弃。



稀疏SVD分析


然后,工作流将执行稀疏SVD分析,以进一步减少数据集的维度和稀疏性,以实现聚类分析和可视化的目的。聚类分析页面同时提供了2D和3D SVD图形来展示重要的组成,以帮助你探索数据的全局结构。
图4:三维SVD显示了最关键的三个因素。


聚类分析


scRNA-seq数据分析中的一项重要任务是通过聚类算法识别细胞群体。此工作流程提供了两种聚类算法:层次聚类和K均值聚类。
在本示例,我们使用层次聚类,它在PBMC数据集中标识了九个细胞群。你还可以通过系统树图或星座图探索聚类。
图5:层次聚类系统树图。



图6:层次聚类的星座图。


基于UMAP与t-SNE的可视化

UMAP和t-SNE是scRNA-seq数据探索中经常使用的两种可视化方法。如果你已将Rtsne和UMAP软件包安装到本地R环境中,则JMP Genomics提供了一个选项,可以通过t-SNE和UMAP可视化聚类的结果。

JMP Genomics还提供了一个名为Feature Switcher的工具,可以帮助你以交互式的方式浏览t-SNE和UMAP可视化中的基因表达模式,而无需在硬盘上生成几十个图形。如图7中以UMAP数据集为例的展示。

图7:包含本地数据过滤器和Feature Switcher的UMAP可视化结果


其他丰富的可视化展示

除了上述的可视化工具外,JMP Genomics还提供了包括小提琴图、脊线图和点图等在内的几十种图形,可以让你动态交互式地探索各种细胞类型中的基因表达模式,也可以通过“ Recode(重新编码)”功能基于标记基因列表的表达模式来定义细胞群体。此外,你可以通过到外部数据库的链接检查有关基因的信息。
图8:跨细胞类型的基因表达水平的小提琴图,脊线图和点图。


基因重要性筛选


尽管可变基因选择步骤显著减少了分析中的基因数量,但仍有数千个基因需要探索。因此,JMP Genomics提供了一种使用Bootstrap森林算法的特征筛选方法,以根据基因在细胞群分离中的重要性对基因进行排名。用户可以选择前30个基因而非2000个基因进行可视化。
JMP Genomics还提供了一个工具,可以将该基因重要性的列表发送到GTEx数据库,以探索其组织特异性表达模式。
图9:特征筛选报告显示了前30个基因。



基因表达差异化


基因表达差异化分析是从scRNA-seq数据得出有关细胞类型间转录变化的统计见解的关键步骤。该工作流程集成了JMP Genomics中ANOVA平台,以使用复杂的混合效应模型执行基因差异化表达分析,该模型允许进行复杂的研究设计。

随着scRNA-seq在生物医学研究中的不断普及,用户需要一种可重现、交互式且对用户友好的工作流程,以便从迅速增长的scRNA-seq数据集中快速提取有效信息。JMP Genomics 10中的全新scRNA-seq工作流程,以及借助于JMP Pro中强大的预测建模功能,以及软件与R和Python开源软件包更好的集成,JMP Genomics 10让你能够以更加快捷、高效的方式赋予你充满信心地加速重要的研究。

想体验JMP Genomics 10中全新的单细胞RNA测序(scRNA-seq)功能,可申请JMP Genomics 10试用评估



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-3-29 00:34 , Processed in 0.381783 second(s), 17 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表