最新消息:雨落星辰是一个专注网站SEO优化、网站SEO诊断、搜索引擎研究、网络营销推广、网站策划运营及站长类的自媒体原创博客

SpaGene:识别空间模式与配受体共定位

网站源码admin4浏览0评论

SpaGene:识别空间模式与配受体共定位

今天来学习一个空转的可以分析配体受体共定位方法(这个方法还可以分析如空间模式spatial patterns,空间高变基因,我比较关注共定位):SpaGene,该方法于2022年9月发表在Genome Res杂志上,文献标题为《Scalable and model-free detection of spatial patterns and colocalization》。

SpaGene 是一种新型的空间组学分析方法,无需依赖模型,能够快速在大规模空间组学研究中识别空间模式。它在分析模拟数据和真实空间转录组学数据时表现优于现有方法,具有更强的分析能力和可扩展性。SpaGene 不仅可以重建未观察到的组织结构,还能通过共定位发现配体 - 受体相互作用,为研究细胞间的相互作用提供了有力工具。原理如下:

  • s1.构建空间网络:SpaGene 首先根据空间位置构建一个 k-最近邻图(k-nearest neighbor graph),其中每个节点代表一个细胞或位点。
  • s2.提取子网络:对于每个基因,SpaGene 从 k-最近邻图中提取一个子网络,该子网络仅包含该基因高表达的细胞或位点。
  • s3.量化子网络的连通性:SpaGene 使用 EMD(Earth Mover's Distance)来量化子网络的连通性。EMD 衡量子网络的度分布与完全连接网络的度分布之间的距离。度分布是指子网络中具有特定度(即连接数)的细胞或位点的比例。EMD 距离越短,表明空间连通性越高。
  • s4.比较观察值与随机值:SpaGene 将观察到的 EMD 距离与随机排列后的预期距离进行比较。如果某个基因的 EMD 距离显著短于随机值,则该基因被识别为空间可变基因。
SpaGene的工作原理

SpaGene的工作原理

通过spagene鉴定到的五种空间模式以及与其他方法性能的比较:

主嗅球(MOB)的空间转录组学结果

SpaGene 在分析主嗅球(main olfactory bulb,MOB)的空间转录组学数据时,成功识别了多个已知的空间可变基因,这些基因在 MOB 的特定层中表达。例如:

  • Pcp4 在颗粒细胞层(GCL)中高表达;
  • Slc17a7 在嗅球细胞层(MCL)中高表达;
  • Cck 在球状层(GL)中高表达;
  • Serpine2 在外丛状层(EPL)中高表达;
  • Fabp7 在嗅神经层(ONL)中高表达。

基于这些识别出的空间可变基因,SpaGene 成功重建了 MOB 的七层结构:

小鼠小脑的 Slide-seqV2 数据结果

SpaGene 成功识别了四个已知在特定小脑层中表达的空间可变基因:

基因

表达层

功能描述

Kcnd2

颗粒层(Granule Layer, GL)

该基因在颗粒层中高表达,编码钾电压门控通道亚家族D成员2,与神经元的兴奋性和信号传导相关。

Car8

浦肯野层(Purkinje Layer, PL)

在浦肯野层中高表达,编码碳酸酐酶相关蛋白8,与浦肯野细胞的结构和功能相关。

Gad1

分子层(Molecular Layer, ML)

主要表达于分子层,编码谷氨酸脱羧酶1,参与γ-氨基丁酸(GABA)的合成,对抑制性神经传递有重要作用。

Mbp

白质(White Matter)

在白质中高表达,编码髓鞘碱性蛋白,是髓鞘的主要成分之一,对神经纤维的髓鞘化和信号传导至关重要。

识别配体-受体相互作用

SpaGene 不仅能够识别空间可变基因,还能扩展用于识别配体-受体相互作用:

  • 在主嗅球(MOB)的空间转录组学数据中,SpaGene 识别了 35 对配体-受体相互作用,其中最显著的两对是 IGFBP5-CAV1(p.adjust = 3×10⁻³¹)和 APOE-LRP6(p.adjust = 2×10⁻¹⁸)。这些相互作用主要发生在外神经层(ONL)和颗粒层(GL)之间;
  • 在小鼠小脑的 Slide-seqV2 数据中,SpaGene 识别了 13 对配体-受体相互作用,其中最显著的一对是 PSAP-GPR37L1(p.adjust = 1×10⁻²⁷)。

代码实操案例

先来简单学习一波官网的案例:/?.html

安装:

代码语言:javascript代码运行次数:0运行复制
## 使用西湖大学的 Bioconductor镜像
options(BioC_mirror=";)
options("repos"=c(CRAN="/")) 
library(devtools)
install_github("liuqivandy/SpaGene")

识别高变基因和空间模式

这里的示例数据来自作者的github上:是一个10x visium的空转数据

输入数据为一个count矩阵和空间坐标位置location:

代码语言:javascript代码运行次数:0运行复制
## Load the data
load("brain10X/brain10x_raw.rds")
head(location)
count[1:5,1:5]

## Find spatially variable genes and patterns
brain10x_sv <- SpaGene(count,location)
head(brain10x_sv$spagene_res)

# the most significant spt
spagene_res <- brain10x_sv$spagene_res[order(brain10x_sv$spagene_res$adjp),]
head(spagene_res)

# 鉴定空间模式 spatial patterns,设置npattern=15
pattern <- FindPattern(brain10x_sv,nPattern = 15)
PlotPattern(pattern,location,pt.size = 0.5)

pattern的理解: gene similarity with the pattern (genepattern), and the pattern weight (patternw),每个pattern具体的值:

可视化 spatial patterns:

找到每个pattern相关的top5基因,并绘制热图可视化:

代码语言:javascript代码运行次数:0运行复制
# Top 5 genes falling into each pattern
top5 <- apply(pattern$genepattern,2,function(x){
  names(x)[order(x,decreasing=T)][1:5]
  })

dat <- pattern$genepattern[rownames(pattern$genepattern)%in%top5,]
head(dat)
pheatmap(dat,fontsize_row = 6)

共定位分析

所有的 包括人和小鼠的配体受体对可以在这里下载:

代码语言:javascript代码运行次数:0运行复制
########################
## Identify colocalized ligand-receptor pairs
library(stringr)
load("LRpair_human.rds")
head(LRpair)
LRpair$ligand_gene_symbol <- str_to_title(LRpair$ligand_gene_symbol)
LRpair$receptor_gene_symbol <- str_to_title(LRpair$receptor_gene_symbol)

brain10x_lr <- SpaGene_LR(count,location,LRpair=LRpair)  
# the most signficant colocalized LR pairs
head(brain10x_lr[order(brain10x_lr$adj),])

## Plot Ligand-receptor pair Cck-Cckbr
plotLR(count,location,LRpair=c("Cck","Cckbr"),alpha.min=0.2,pt.size = 1)

在单细胞中鉴定到的配受体对,可以在空转上进一步验证,看其是否具有真实发生的可能~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-04-11,如有侵权请联系 cloudcommunity@tencent 删除编码量化数据网络原理
发布评论

评论列表(0)

  1. 暂无评论