欧美伦理片

手机成人游戏 单细胞数据结构-Seurat对象

发布日期:2024-08-03 22:10    点击次数:122

手机成人游戏 单细胞数据结构-Seurat对象

一、单细胞数据处分设施-Seurat设施手机成人游戏

现在,分析单细胞的用具越来越多。其中,Seurat是一个集大成的R包,包含了各式处分单细胞的设施。在R话语中,它使用了S4编程时代。在单细胞数据分析中,Seurat使用亦然最多的,表示其构建的单细胞数据结组成为分析单细胞数据的蹙迫基础(这是在你使用Seurat包时,不然,请忽略!)。

二、Seurat对象的结构

Seurat变量是一种S4对象结构,在首次构建一个对象时,其基本的结构如下(示例)。

# 创建Seurat对象> ZSR.N <- CreateSeuratObject(ZSR.N, min.cells = 3)

图片

Seurat对象的主要属性解读:

(1)assays属性

该属性主要存储了系数细胞的UMI原始数据和圭臬化数据。在首次构建对象时,也存在相应的属性,仅仅属性值要么是空,要么和原始数据保握一致。默许情况下,咱们是对Seurat中的RNA的Assay进行操作。不错通过@active.assay检察现时默许的assay,通过DefaultAssay()改换现时的默许assay。

图片

RNA是assary探听的第一个属性值,包含了以下系数的属性值

counts:包含了系数细胞的原始UMI数目矩阵手机成人游戏,一种稀零矩阵

data:在首次构建Seurat时,与counts保握一致;当使用NormalizeData()函数圭臬化后,修改为该设施圭臬化后的值;主要用于各异分析等

scale.data:首次构建时,大小为0;当使用ScaleData()函数表表动荡后,修改为该设施圭臬化的值;主要用于PCA,UMAP,t-SNE等数据分析等

var.features:用于存放高变异的基因名,默许情况下为空。咱们不错用函数VaribleFeatures()来赢得这个向量。

meta.features:对每个 features 作念的注释。淌若要对 features 的功能进行注释、打分、筛选齐需要用到meta.features。

(2)meta.data属性

描写每个细胞信息的元数据,每一溜代表一个细胞,每一列代表细胞的属性。默许情况下,主要包括orig.ident, nCount_RNA, nFeature_RNA等属性。在后续进行部分运算时,比如线粒体,红细胞等百分比,不同折柳率下的细胞聚类等信息等,也会保存在该属性下。

图片

orig.ident:一般保存的是该对象中系数细胞的样蓝本源,约略字据我方的需求改换为对细胞的注释。

nCount_RNA:每个细胞的总坚硬的UMI数目

nFeature_RNA:每个细胞的总坚硬的基因数目

meta.data不错用于细胞的筛选或过滤(依据细胞的属性和类型对细胞进行筛选)。

meta.data也不错把分析得到的遵守,保存到mata.data中,比如线粒体的比例,红细胞的比例等

(3)active.assay属性:暗意后续分析历程中,使用的数据矩阵;不错通过 active.assay属性,查询现时默许激活的assay对象,也不错用 DefaultAssay()函数竖立激活的 assay对象。

(4)active.ident属性:暗意每一个细胞所属的细胞类型。细胞类型可能有多种不同的分类设施,有些是自动注见识遵守,有些可能是手动注见识遵守。但在某一时分激活的细胞类型注释设施是不同的。不错通过用active.ident属性来查询现时默许的细胞类型。

(5)reductions属性:是一个列表对象,包含了一个或多个 DimReduc obect 对象。每一个 DimReduc object 对象对应一种降维分析遵守,比如PCA, UMAP, t-SNE等。

(6)commands属性:保存操作该对象的敕令及参数

三、NormalizeData和ScaleData两种圭臬化设施的区别

色无月

原始数据如下形态,点号代表莫得抒发(为0值):行是基因,列是细胞

> ZSR.N@assays$RNA@data[1020:1030, 100:103]11 x 4 sparse Matrix of class "dgCMatrix"          ZSRN_ACCAGTAGTTCGAATC ZSRN_ACCCACTAGTTAACGA ZSRN_ACCCACTCAGGTTTCA ZSRN_ACCCACTTCGTGGACCSETDB1                        .                     .                     .                     .CERS2                         .                     .                     .                     .MINDY1                        .                     .                     .                     .PRUNE1                        .                     .                     .                     .BNIPL                         .                     .                     2                     .C1orf56                       .                     .                     .                     .CDC42SE1                      1                     .                     1                     .MLLT11                        .                     .                     .                     .GABPB2                        .                     .                     .                     .SEMA6C                        .                     .                     .                     .TNFAIP8L2                     .                     .                     .                     .

2.1 NormalizeData()函数

该圭臬化设施是用往复除由于测序深度带来的影响,后续对设施进行了优化,造成了一个新的圭臬化设施-SCTransform圭臬化设施。

基答允趣所以细胞为单元,对该细胞中坚硬到的系数基因的counts乞降,再将该细胞中每一个基因的counts除以和,再乘以一个因子(默许1000),终末,对系数值取log10变换。

主要用于各异分析,高可变基因瓜分析

# 以BNIPL基因为例,在ZSRN_ACCCACTCAGGTTTCA细胞中为 2# 策画ZSRN_ACCCACTCAGGTTTCA(第三列)的总counts数total <- sum(pbmc@assays[["RNA"]]@counts[,2])# 策画圭臬化后的值log1p(2/total*10000)

2.2 ScaleData()函数

该设施的基答允趣所以基因为单元,对基因进行z-score圭臬化手机成人游戏,主要用于PCA, UMAP, t-SNE等降维分析。

#统计 BINPL 基因在系数细胞中平均抒发均值mean(pbmc@assays$RNA@data['BINPL',])#[out]:0.05966781#统计 BINPL 在系数细胞中抒发圭臬差sd(pbmc@assays$RNA@data['BINPL',])#[out]:0.3216486# z-score策画(1.625141-0.05966781)/0.3216486 
本站仅提供存储就业,系数现实均由用户发布,如发现存害或侵权现实,请点击举报。



Powered by 欧美伦理片 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024 版权所有