
发布日期:2025-03-18 04:02 点击次数:52
单细胞数据分析内部最基础的即是降维聚类分群,参考前边的例子:东说念主东说念主齐能学会的单细胞聚类分群留意 ,这个全球基本上问题不大了,使用seurat圭臬历程即可上原亞衣 肛交,不外它默许出图并不面子,详见往常咱们作念的投票:可视化单细胞亚群的秀雅基因的5个表率,底下的5个基础函数治服全球齐是也曾烂熟于心了:
VlnPlot(pbmc, features = c("MS4A1", "CD79A"))FeaturePlot(pbmc, features = c("MS4A1", "CD79A"))RidgePlot(pbmc, features = c("MS4A1", "CD79A"), ncol = 1)DotPlot(pbmc, features = unique(features)) + RotatedAxis()DoHeatmap(subset(pbmc, downsample = 100), features = features, size = 3)上几期的推文给全球分享了我对于用热图可视化及好意思化marker基因的骨子
Doheatmap常用参数及好意思化使用Complexheatmap好意思化热图Scillus包好意思化热图接下来整个来了解一下Dotplot可视化Marker基因吧。
Dotplot收场图通晓在进行细胞亚群留意的技术,不错使用Dotplot可视化集聚整理的基因集,来扶直咱们进行细胞亚群的判断
图片
(PS : 不错看到咱们集聚整理的基因的特异性齐卓绝好,绝大部分齐有单细胞亚群的排他性 ,比如9群是CPA3代表的mast细胞,它在mast亚群内部的简直是百分百抒发,然则在其他亚群齐是不抒发!)
要是矜恤单个基因的话,也不错只查察单个基因在不同亚群的抒发情况,在单细胞水平看指定基因的抒发量各异情况分享的著述中就有对某个基因进行可视化展示
DotPlot(sce.all.int, features = c("MTIF2"), group.by = "celltype")
图片
(PS ; 因为MTIF2这个基因并不是已知的各个单细胞亚群特征基因,是以不错看到它很难有排他性,并且它即使是在肝细胞内部也即是30%的抒发比例,只不外是肉眼看起来简略是跟前边的百分比一样的后果,是以全球务必提防图例!)
狼国成人Dotplot收场图上会展示出来Average Expressed以及Percent Expressed,及基因的平均抒发量(点的神采)以及抒发的百分比(点的大小)
通过将绘图收场保存为一个变量,不错看到内部的保存的用于绘制的数值
p = DotPlot(sce.all.int, features = c("MTIF2"), group.by = "celltype") View(p)
图片
其中data数据中就包含了Average Expressed、Percent Expressed以及Average Expressed scaled
图片
在推文务为有补于世 | 单细胞之DotPlot的抒发量哪来的?整理了平均抒发量Average Expressed的筹谋表率
图片
1. 毛糙尝试筹谋平均抒发量-Average Expressed:查察B细胞亚群内部MTIF2基因的平均抒发量
取出B细胞亚群,得回B细胞亚群内部MTIF2基因原始抒发矩阵,筹谋平均抒发量
#average expressedsce.B = sce.all.int[, sce.all.int$celltype %in% c( 'Bcell')]gene_expression <- sce.B[["RNA"]]$counts["MTIF2", ]# 筹谋平均抒发量,忽略NA值average_expression <- mean(gene_expression/sce.B$nCount_RNA*10000, na.rm = TRUE)
图片
图片
2. 筹谋基因在不同亚群内部的抒发百分比Percent Expressed
统计并整理基因在不同细胞亚群的抒发与否情况,然后筹谋抒发数目占全部细胞亚群数目的百分比
#pct.express筹谋方法MTIF2 = sce.all.int@assays$RNA$data["MTIF2",]>0t(table(MTIF2,sce.all.int$celltype))data <- data.frame( CellType = c("Bcell", "cycle", "endothelial", "epithelial", "hepatocytes", "macrophages", "mast", "myeloids", "myofibroblasts", "Tcell"), MTIF2_FALSE = c(3053, 1810, 3609, 1975, 6294, 5509, 186, 10335, 1131, 7414), MTIF2_TRUE = c(355, 411, 448, 446, 3040, 1154, 7, 1370, 144, 503))# 筹谋每个细胞亚群中总细胞数data$TotalCells <- data$MTIF2_FALSE + data$MTIF2_TRUE# 筹谋每个细胞亚群中MTIF2的抒发占比,并添加到data表格中data$PercentExpressed <- (data$MTIF2_TRUE / data$TotalCells)*100
图片
图片
在绘制展示的labels中,x轴是咱们聘请展示的基因,y轴identity是细胞亚群,点的大小是由pct.exp决定的,神采是由avg.exp.scaled决定的
图片
对于avg.exp.scaled的筹谋莫得去尝试,全球感好奇爱慕的不错看一下Dotplot函数的具体筹谋方法
图片
Dotplot常用参数图片
除了输入数据(object)、基因集(features)以及分组信息(group.by)和分割参数(split.by)这些常用参数外,还有一些和点的神采大小以及scale界限相关的参数
点的神采及缩放大小cols: 绘图神采——不错是RColorBrewer包中的调色板称号,也不错是自界说的渐变的两种神采,或者是界说多个渐变的三种以上神采(要是建造了split.by)。
col.min: 缩放后平均抒发的神采最小阈值。
col.max: 缩放后平均抒发的神采最大阈值。
图片
dot.min: 绘制最小点的细胞分数(默许为0),总计抒发给定基因的细胞组少于此分数的将不绘制点。dot.scale: 气泡大小的缩放比例,访佛于cex参数,默许是6,不错通过这个参数诊治各个气泡大小之间各异进度图片
scale: 细则数据是否缩放,TRUE为默许。scale.by: 通过'size'或'radius'两种方法缩放点的大小,默许为"radius"。scale.min: 建造缩放的下限,使用NA为默许值。scale.max: 建造缩放的上限,使用NA为默许值。使用默许参数绘图具体绘图及好意思化照旧使用pbmc-3k的留意分群后的示例数据,使用FindAllMarkers查找并得回top5的Marker基因进行可视化
#top5 marker基因得回pbmc.markers <- FindAllMarkers(pbmc, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25, verbose = FALSE)top5 = pbmc.markers %>% group_by(cluster) %>% top_n(n = 5, wt = avg_log2FC)g = unique(top5$gene)
不错先望望告成使用默许参数,不诊治展示的情况
DotPlot(pbmc, features = g)
图片
不错看到features展示列全部挤在了整个,未便于阅读。是以不错对接受参数歪斜展示基因,或者将基因和细胞亚群不异位置
1. 诊治features的成列角度
DotPlot(pbmc, features = g) + RotatedAxis()
图片
2.将features和identity不异位置
DotPlot(pbmc, features = g) + coord_flip()+ RotatedAxis()
图片
小结这期毛糙了解了一下Dotplot展示的Average Expressed以及Percent Expressed筹谋方法,以及Dotplot常用参数
终末毛糙的使用默许参数展示了top5的marker基因,使用参数歪斜展示基因,或者将基因和细胞亚群不异位置对收场图进行毛糙的诊治
Dotplot可诊治的点还有许多,下期整个来了解一下基于Dotplot函数可视化的好意思化(以及它的多种变形操作,比如底下的图E就不错告成使用上头的dotplot函数的数据 )
图片
文末友情宣传要是你也念念作念单细胞转录组数据分析上原亞衣 肛交,最佳是有我方的筹谋机资源哦,比如咱们的2024的分享做事器交个一又友福利价仍然是800,并且还需要有基本的生物信息学基础,也不错望望咱们的生物信息学马拉松讲课,你的生物信息学初学课。
本站仅提供存储做事,总计骨子均由用户发布,如发现存害或侵权骨子,请点击举报。