手机成人游戏 单细胞数据结构-Seurat对象
一、单细胞数据处分设施-Seurat设施手机成人游戏
现在,分析单细胞的用具越来越多。其中,Seurat是一个集大成的R包,包含了各式处分单细胞的设施。在R话语中,它使用了S4编程时代。在单细胞数据分析中,Seurat使用亦然最多的,表示其构建的单细胞数据结组成为分析单细胞数据的蹙迫基础(这是在你使用Seurat包时,不然,请忽略!)。
二、Seurat对象的结构
Seurat变量是一种S4对象结构,在首次构建一个对象时,其基本的结构如下(示例)。
# 创建Seurat对象> ZSR.N <- CreateSeuratObject(ZSR.N, min.cells = 3)
图片
Seurat对象的主要属性解读:
(1)assays属性
该属性主要存储了系数细胞的UMI原始数据和圭臬化数据。在首次构建对象时,也存在相应的属性,仅仅属性值要么是空,要么和原始数据保握一致。默许情况下,咱们是对Seurat中的RNA的Assay进行操作。不错通过@active.assay检察现时默许的assay,通过DefaultAssay()改换现时的默许assay。
图片
RNA是assary探听的第一个属性值,包含了以下系数的属性值
counts:包含了系数细胞的原始UMI数目矩阵手机成人游戏,一种稀零矩阵
data:在首次构建Seurat时,与counts保握一致;当使用NormalizeData()函数圭臬化后,修改为该设施圭臬化后的值;主要用于各异分析等
scale.data:首次构建时,大小为0;当使用ScaleData()函数表表动荡后,修改为该设施圭臬化的值;主要用于PCA,UMAP,t-SNE等数据分析等
var.features:用于存放高变异的基因名,默许情况下为空。咱们不错用函数VaribleFeatures()来赢得这个向量。
meta.features:对每个 features 作念的注释。淌若要对 features 的功能进行注释、打分、筛选齐需要用到meta.features。
(2)meta.data属性
描写每个细胞信息的元数据,每一溜代表一个细胞,每一列代表细胞的属性。默许情况下,主要包括orig.ident, nCount_RNA, nFeature_RNA等属性。在后续进行部分运算时,比如线粒体,红细胞等百分比,不同折柳率下的细胞聚类等信息等,也会保存在该属性下。
图片
orig.ident:一般保存的是该对象中系数细胞的样蓝本源,约略字据我方的需求改换为对细胞的注释。
nCount_RNA:每个细胞的总坚硬的UMI数目
nFeature_RNA:每个细胞的总坚硬的基因数目
meta.data不错用于细胞的筛选或过滤(依据细胞的属性和类型对细胞进行筛选)。
meta.data也不错把分析得到的遵守,保存到mata.data中,比如线粒体的比例,红细胞的比例等
(3)active.assay属性:暗意后续分析历程中,使用的数据矩阵;不错通过 active.assay属性,查询现时默许激活的assay对象,也不错用 DefaultAssay()函数竖立激活的 assay对象。
(4)active.ident属性:暗意每一个细胞所属的细胞类型。细胞类型可能有多种不同的分类设施,有些是自动注见识遵守,有些可能是手动注见识遵守。但在某一时分激活的细胞类型注释设施是不同的。不错通过用active.ident属性来查询现时默许的细胞类型。
(5)reductions属性:是一个列表对象,包含了一个或多个 DimReduc obect 对象。每一个 DimReduc object 对象对应一种降维分析遵守,比如PCA, UMAP, t-SNE等。
(6)commands属性:保存操作该对象的敕令及参数
三、NormalizeData和ScaleData两种圭臬化设施的区别
色无月原始数据如下形态,点号代表莫得抒发(为0值):行是基因,列是细胞
> ZSR.N@assays$RNA@data[1020:1030, 100:103]11 x 4 sparse Matrix of class "dgCMatrix" ZSRN_ACCAGTAGTTCGAATC ZSRN_ACCCACTAGTTAACGA ZSRN_ACCCACTCAGGTTTCA ZSRN_ACCCACTTCGTGGACCSETDB1 . . . .CERS2 . . . .MINDY1 . . . .PRUNE1 . . . .BNIPL . . 2 .C1orf56 . . . .CDC42SE1 1 . 1 .MLLT11 . . . .GABPB2 . . . .SEMA6C . . . .TNFAIP8L2 . . . .
2.1 NormalizeData()函数
该圭臬化设施是用往复除由于测序深度带来的影响,后续对设施进行了优化,造成了一个新的圭臬化设施-SCTransform圭臬化设施。
基答允趣所以细胞为单元,对该细胞中坚硬到的系数基因的counts乞降,再将该细胞中每一个基因的counts除以和,再乘以一个因子(默许1000),终末,对系数值取log10变换。
主要用于各异分析,高可变基因瓜分析
# 以BNIPL基因为例,在ZSRN_ACCCACTCAGGTTTCA细胞中为 2# 策画ZSRN_ACCCACTCAGGTTTCA(第三列)的总counts数total <- sum(pbmc@assays[["RNA"]]@counts[,2])# 策画圭臬化后的值log1p(2/total*10000)
2.2 ScaleData()函数
该设施的基答允趣所以基因为单元,对基因进行z-score圭臬化手机成人游戏,主要用于PCA, UMAP, t-SNE等降维分析。
#统计 BINPL 基因在系数细胞中平均抒发均值mean(pbmc@assays$RNA@data['BINPL',])#[out]:0.05966781#统计 BINPL 在系数细胞中抒发圭臬差sd(pbmc@assays$RNA@data['BINPL',])#[out]:0.3216486# z-score策画(1.625141-0.05966781)/0.3216486本站仅提供存储就业,系数现实均由用户发布,如发现存害或侵权现实,请点击举报。