scMMO
Basic Information
- 英文标题:scMMO-atlas: a single cell multimodal omics atlas and portal for exploring fine cell heterogeneity and cell dynamics
- 中文标题:scMMO-atlas:单细胞多模态组学图谱和门户,用于探索细胞异质性和细胞动态
- 发表日期:24 September 2024
- 文章类型:Database Issue
- 所属期刊:Nucleic Acids Research
- 文章作者:Wenwen Cheng | Wenfei Jin
- 文章链接:
Abstract
- 单细胞多模态测序并行捕获同一细胞的多种模态,提供了前所未有的细胞异质性和细胞动态性见解。
- 例如,从同一单细胞联合分析染色质可及性和转录组(scATAC + RNA)发现了在已定义的聚类中新的细胞亚群。
- 然而,缺乏单细胞多模态组学(scMMO)数据库导致了数据碎片化,严重阻碍了scMMO数据的访问、利用和挖掘。
- 在此基础上,我们通过收集和整合各种scMMO数据构建了一个scMMO图谱,并构建了名为scMMO-atlas的scMMO数据库和门户网站(/)。
- scMMO-atlas包括scATAC + RNA(ISSAAS-seq, SNARE-seq, paired-seq, sci-CAR, scCARE-seq, 10X Multiome等),scRNA + 蛋白质,scATAC + 蛋白质和三模态组学数据,包含来自27种细胞组织/器官的3,168,824个细胞。
- scMMO-atlas提供了一个交互式门户网站,用于可视化和每种模态及整合数据的特色分析。
- 对scMMO-atlas中小鼠大脑皮层的scATAC + RNA数据进行整合分析,相比单模态组学数据识别出更多的细胞亚群。
- 这些新的细胞亚群中,有一个早期星形胶质细胞亚群高表达Grm3,称为Astro-Grm3。
- 此外,我们还识别出了Ex-L6-Tle4-Nrf1,这是Ex-L6-Tle4的前体,表明scMMO-atlas中的大数据提供的统计能力。
- 总之,scMMO-atlas提供了细胞图谱、数据库和门户网站,以促进数据利用和生物学洞察。
Introduction
Para_01
- 单细胞测序是解析细胞异质性和细胞动态的强大工具。
- 各种细胞图谱项目的快速发展,如人类细胞图谱项目(HCA)、人类生物分子图谱计划(HuBMAP)、Tabula Sapiens、人类发育细胞图谱、人类肝脏细胞图谱、器官发生细胞图谱、心脏细胞图谱、成纤维细胞图谱和 COVID-19 组织图谱,导致了单细胞组学数据的指数增长,涵盖了广泛的物种和组织。
- 各种单细胞组学数据库的建立,如 SCPortalen、SPEED、DISCO、HTCA、HUSCH、PanglaoDB、ABC 门户和 CellCommuNet,收集了多种单细胞 RNA 测序(scRNA-seq)数据,并促进了这些数据的访问、利用和探索。
- 一些单细胞组学数据库收集了多种单细胞单模态组学数据,例如使用测序的单细胞转座酶可及染色质分析(scATAC-seq)数据、单细胞重亚硫酸盐测序(scBS-seq)数据、单细胞 DNase I 超敏感位点测序(scDNase-seq)数据和单细胞染色质免疫沉淀后测序(scChIP–seq)数据,这些数据提供了更为全面的信息。
- 然而,由于每种模态的数据来自不同的细胞,因此难以准确整合不同模态的数据。
Para_02
- 单细胞多模态组学技术共同描绘了同一单细胞的多种模式,这有助于在单细胞分辨率下研究基因组突变、表观遗传修饰和染色质动态对转录或翻译的影响,并有助于揭示疾病发病机制。
- 例如,我们在 ATAC-seq 之后开发了原位测序杂合 RNA-DNA 混合物(SHERRY),用于在同一单细胞中敏感且灵活地描绘染色质可及性和基因表达。
- 使用 ISSAAC-seq 研究小鼠大脑皮层的细胞不仅识别了罕见的细胞簇,还揭示了调控元件与基因表达之间的动态关系。
- 最复杂的单细胞多模态组学技术包括 scATAC + RNA(ISSAAS-seq、SNARE-seq、SNARE-seq2、Paired-seq、scCARE-seq、sci-CAR、sCAT-seq、10X Multiome 等),scRNA + 蛋白质(CITE-seq),scATAC + 蛋白质(PHAGE-ATAC)以及 scTri-modal 组学(TEA-seq)。
- 尽管单细胞多模态组学方法具有潜力,但单细胞多模态组学数据仍然碎片化,这严重阻碍了这些数据的访问、利用和探索。
Para_03
- 我们构建了单细胞多组学图谱(scMMO-atlas,网址:/),以促进对单细胞多组学数据的访问和探索。
- scMMO-atlas 包含来自27个组织或器官的70个数据集中超过300万个细胞,其中包括来自39个数据集的768,459个具有 scATAC + RNA 信息的细胞。
- 对大脑皮层的 scATAC + RNA 分析鉴定出了如 Ex-L6-Tle4-Nrf1 等细胞亚群,这表明由 scMMO-atlas 提供的大数据具有统计能力。
- 简而言之,作为第一个 scMMO 数据门户,scMMO-atlas 促进了数据挖掘并提供了生物学见解。
Materials and methods
Data collection for construction of cell atlas
构建细胞图谱的数据收集
Para_04
- 我们通过文献搜索和数据库搜索获取了人类和小鼠的单细胞多组学数据。
- 简而言之,我们在 PubMed 和 Web of Science 中使用‘单细胞多模态组学’、‘单细胞多模态测序’和‘单细胞 RNA 测序和单细胞 ATAC 测序’作为关键词搜索相关的出版物。
- 如果论文中有数据访问编号,我们从 GEO 或 ArrayExpress 下载这些数据。
- 单细胞多组学 ATAC + 基因表达数据直接从 10X Genomics 网站的数据集中下载。
- 收集的数据包括 ISSAAS-seq、SNARE-seq、Paired-seq、scCARE-seq、sci-CAR、sCAT-seq、10X Multiome、CITE-seq 等。
Analysis of scRNA data in scMMO data
scMMO数据中scRNA数据的分析
Para_05
- 读段被映射到参考基因组(小鼠为 GRCm38 或人类为 GRCh38),以生成基因计数矩阵。
- 如果无法获得原始读段数据,我们下载了单细胞 RNA 数据的基因计数矩阵。
- 单细胞 RNA 数据使用 R 中的 Seurat 包(版本 4.1.1)进行分析(补充图 1)。
- 我们对单细胞 RNA 数据进行了一系列质量控制。
- 我们过滤掉了分子标识符(UMI)计数小于 1000 或大于 25000 的细胞。
- 随后,使用 ‘NormalizeData’ 函数对 UMI 矩阵进行了归一化,并使用 ‘ScaleData’ 函数进行了缩放。
- 前 2000 个高变基因用于通过主成分分析(PCA)进行降维。
- 前 30 个主成分(PCs)用于通过原始 Louvain 算法进行细胞聚类。
- 细胞被投影到统一流形逼近和投影(UMAP)上以进行可视化。
Para_06
- 细胞注释按照以下步骤进行:(i) 如果细胞在之前的研究或数据库中已经被注释,则直接标记这些细胞;(ii) 以已注释的单细胞 RNA 测序数据为参考,使用 ‘FindTransferAnchors’ 和 ‘TransferData’ 函数对新细胞进行注释;(iii) 根据聚类特异性基因手动注释细胞。值得注意的是,我们反复检查细胞注释以确保结果的一致性。最后,在至少一个聚类中表达于至少 25% 细胞的聚类特异性基因显示在数据库中。
Analyses of scATAC data in scMMO data
scATAC 数据在 scMMO 数据中的分析
Para_07
- scATAC 数据通过 Signac 包(版本 1.7.0)进行分析。
- 我们使用 ‘CreateChromatinAssay’ 函数将 ATAC 计数矩阵和片段文件合并。
- 过滤掉 UMI 计数小于 1000 或大于 100,000 的细胞。
- 核小体信号评分大于 2 和转录起始位点 (TSS) 富集评分小于 1 的细胞被过滤掉。
- 最终保留了同时具有 scRNA 和 scATAC 数据的细胞。
- 我们使用 MACS2 对细胞池 ATAC 数据进行峰检测,然后根据每个 MACS 检测到的峰中每个细胞的读取数量生成计数矩阵。
- 细胞通过 UMAP 进行可视化,聚类使用 scRNA 轮廓进行标记。
- 在细胞聚类水平上进行了第二轮峰检测,对每个聚类的聚合伪批量样本进行峰检测。
- 使用 Signac 中的 ‘GeneActivity’ 推断基因活性得分矩阵。
- 基因活性得分作为伪表达水平,增强了对 scATAC 和 scRNA 数据的理解。
- 最后,计算特定于聚类的峰的方法与使用 scRNA 计算特定于聚类的基因的方法相同。
Integrated analysis of single-cell multimodal omics
单细胞多模态组学的整合分析
Para_08
- 我们使用‘AverageExpression’函数计算了单细胞RNA数据推断的聚类和单细胞ATAC数据推断的聚类之间的相似性。
- 随后,我们根据细胞间方差对基因进行排序,并选择了RNA数据和ATAC数据之间共享的前2000个基因,以生成新的RNA矩阵和ATAC矩阵。
- 使用Hmisc软件包(版本4.7-0)计算Spearman相关性,并使用Pheatmap软件包(版本1.0.12)生成展示每个数据集scMMO Spearman相关性的热图。
Para_09
- 加权最近邻(WNN)采用无监督框架,整合细胞的多种模态以获得细胞状态的联合定义。
- 我们使用‘FindMultiModalNeighbors’函数,基于scRNA数据和scATAC数据的加权组合来识别最近邻。
- 然后,这个统一的图谱与UMAP结合进行了可视化。
Peak visualization by genome browser
通过基因组浏览器进行峰值可视化
Para_10
- 文件片段根据聚类被分割成多个文件,从而为每个聚类生成了伪批量数据。
- 使用 MACS2 对每个伪批量数据进行峰呼叫。
- 峰数据通过 ‘bedGraphToBigWig’ 转换为 BigWig 格式,便于通过基因组浏览器进行可视化。
- 数据可视化是通过 Biodalliance(版本 0.13.8)插件实现的,这是一种快速且交互式的基因组可视化工具,可以无缝嵌入到 Web 应用程序中以呈现峰数据。
- 简而言之,这使得用户能够以高效且用户友好的方式可视化峰数据。
Database construction
数据库建设
Para_11
- scMMO-atlas 的网页界面是使用 R 语言(版本 4.2.1)开发的,采用了 ‘shiny’ 和 ‘shinydashboard’ 包。
- 我们导入了带有完全注释细胞类型的标记 scMMO 数据集,并使用 ‘plotly’ 包在数据库中生成用户交互式图表。
- 特别地,峰值的可视化通过嵌入基于 JavaScript 的 Biodalliance 插件,经由 HTML 文件实现。
- 该 HTML 文件包含了参考基因组以及每个簇的峰值丰度详细 BigWig 信息。
- 目前,scMMO-atlas 托管在中国科学院上海营养与健康研究所管理的专用服务器上。
Data download and submission
数据下载和提交
Para_12
- 我们构建了数据集模块,以展示每个单细胞多组学数据的基本信息,如数据来源、物种、供体状况、组织、下载链接和出版物。此外,我们为用户提供可下载的集成 R 对象和元数据,其中包含每个细胞亚群的基本信息。
Para_13
- scMMO-atlas 为用户提供了一个提交数据的界面,这有助于数据分析和数据解释。
- 提交的数据基于参考数据进行注释,这些参考数据使用上述的细胞注释方法进行了标注。
- 简而言之,scMMO-atlas 对不同模态的数据进行归一化处理,并使用 ‘TransferData’ 功能对细胞进行注释,最后通过 ‘FindMultiModalNeighbors’ 功能显示集成的 UMAP 图。
- 提交数据的分析结果可以下载。
Results
scMMO atlas and its associated statistics
单细胞 MMO 图谱及其相关统计
Para_14
- 我们收集并处理了总计70个高质量的单细胞多组学数据集(方法),然后整合了多模态数据并构建了scMMO-atlas(图1A)。
- scMMO-atlas包含来自18种单细胞多组学方法的3,168,824个细胞,这些方法包括scATAC + RNA、scRNA + 蛋白质、scATAC + 蛋白质、三模态和四模态。
- 覆盖的模态包括RNA、ATAC、蛋白质、表位和高通量染色体构象捕获。
- 尽管单细胞多组学方法具有潜力,但单细胞多组学数据仍然分散,这严重阻碍了数据的访问、利用和探索(图1B)。
- 数据库中三分之二的样本来自健康供体,其余来自患有阿尔茨海默病、帕金森病、COVID-19、2型糖尿病、受损肾脏、类风湿性关节炎或脑肿瘤的患者(图1C,左)。
- 大多数单细胞多组学数据是由CITE-seq、PHAGE_ATAC、10x Multiome和TEA-seq生成的(图1C,右)。
- 这些细胞来自27种细胞组织/器官/系,包括外周血单核细胞、大脑、淋巴结、肾脏、骨髓、肺等(图1D)。
- 总共,scMMO-atlas涵盖了852个样本,其中scATAC + RNA和scRNA + 蛋白质拥有最多的样本数量和组织类型。
- 这些组织在不同组学方法中的样本数量从1到192不等,中位样本数为9(图1E,补充表S1)。
图片说明
◉ 图1. scMMO-atlas的构建和数据总结。(A) scMMO-atlas构建方案。(B) 按物种、供体状况和组学方法对scMMO-atlas进行总结。(C) 按样本状况和组学方法分类的细胞数量。H,人类;M,小鼠;T2D,2型糖尿病;AHRF,急性低氧性呼吸衰竭;PD,帕金森病;CML,慢性髓系白血病;MTB,结核分枝杆菌;NHL,非霍奇金淋巴瘤。(D) 来自70个数据集的27种细胞组织或器官分布比例。(E) 不同组学方法下每个组织样本的总结。PBMC,外周血单核细胞;BAL,支气管肺泡灌洗液;AGM,主动脉-生殖腺-中肾;ESC,胚胎干细胞。(F) scMMO-atlas数据库结构。
scMMO-atlas website and database design
scMMO-atlas网站和数据库设计
Para_15
- 我们构建了 scMMO-atlas 网站,用于搜索和可视化 scMMO 图谱及其相关数据。
- scMMO-atlas 网站有五个部分,分别是首页、图谱概览页、数据可视化页、提交页和联系页。
- 在这些页面上,用户可以找到 scMMO 图谱的全面信息以及分析结果。
- 首页提供了 scMMO-atlas 的基本信息,例如 scMMO-atlas 的欢迎词、数据摘要、数据库框架和数据处理工作流程。
Para_16
- Atlas概览页面包含两个模块,即数据集模块和基因模块。
- 数据集模块包含这些数据集的基本信息,如数据来源、物种、供体条件、组织、下载链接、出版物以及相应的UMAP图。
- 数据集模块还提供了一个搜索框,用户可以用来搜索感兴趣的数据集。
- 最重要的是,下载列提供了每个细胞的注释信息,用户可以下载并使用这些信息。
- 基因模块允许对单个基因进行高级搜索,以探索它们在多个数据集、不同模式类型和各种细胞类型中的平均表达水平。
- 所选基因的标准化平均表达水平以热图的形式呈现。
图片说明
◉ 图2. scMM-atlas中scATAC + RNA数据的展示。(A) 数据集模块包含数据集信息。突出显示的搜索框允许用户通过关键词搜索数据集。点击蓝色的‘下载’链接,用户可以下载相关数据。◉ (B) 人类和小鼠的scATAC + RNA数据集分布。◉ (C) 人类和小鼠的细胞系、组织或器官的数量。◉ (D) 每个样本通过质量控制的细胞数量、每个细胞检测到的基因平均数以及每个细胞检测到的峰平均数。◉ (E) 显示选定数据集的细胞异质性和相关信息。结果在五个标签页中提供,分别是整合、RNA、ATAC、搜索和下载。在整合标签页中,显示了选定数据的物种、测序方法、样本条件和细胞数量(左侧);选定数据经过WNN整合后的UMAP图,按细胞亚群着色(中间);细胞亚群特异性标志物或细胞亚群之间的相关性(右侧)。◉ (F) 基于scRNA-seq数据的RNA标签页中的UMAP图。◉ (G) 基于scATAC-seq数据的ATAC标签页中的UMAP图。◉ (H) 在UMAP上显示感兴趣基因的表达水平(左侧)和启动子染色质可及性(中间),也可以通过小提琴图显示这些信息(右侧)。◉ (I) 浏览器显示每个簇的单细胞聚合信号。
Para_17
- 数据可视化页面通过其用户友好的网页界面提供了多种数据检索方法。
- 数据可视化页面友好地提供了每个数据集的细胞簇交互式可视化,包括整合的、RNA、ATAC 和蛋白质数据,使用户能够探索不同组学之间的聚类差异。
- 该页面还提供了每个数据集的差异表达基因、差异峰、基因表达谱、活动矩阵和细胞注释,所有这些都可以下载。
Para_18
- 提交页面允许用户上传数据到 scMMO-atlas 进行分析和可视化(图 1F)。
- 该页面提供了实用的分析工具,包括数据整合、细胞聚类和细胞注释。
- 值得注意的是,所有可见的图表都可以公开下载。
- 联系我们页面为用户提供了一个界面,以便提供反馈和建议。
Data visualization
数据可视化
Para_19
- 数据可视化页面是用于数据集选择和数据可视化的界面,分为数据选择部分、统计部分和可视化部分。
- 根据模态类型,数据以三种不同模式呈现(scRNA&scATAC、scRNA&scProtein 和其他组学)。
- 以 scATAC + RNA 数据为例,所选数据集的物种、组织/器官、细胞数量、检测到的基因数量和染色质可及性峰的数量显示在页面顶部。
- 在页面顶部,一个下拉菜单允许用户选择数据集。
- 一旦选择了数据集,右侧会显示通过质量控制的细胞数量、供体情况和组学方法。
- 此外,底部的可视化部分分为五个选项卡,包括集成选项卡、RNA 选项卡、ATAC 选项卡、搜索选项卡和下载选项卡。
Integration tab
集成选项卡
Para_20
- 左侧是所选数据的基本信息,如物种、组织/器官、供体、参考基因组和统计数据(图2E,左)。
- 所选数据的细胞在UMAP图上使用整合数据进行投影,并按细胞亚群着色(图2E,中)。
- 用户可以从‘Reduction’下拉菜单中选择RNA数据或ATAC数据。
- 通过选择‘Idents’下拉菜单,细胞可以按细胞簇或样本着色。
- 通过选择‘Cluster’下拉菜单,可以可视化特定的细胞簇或多个簇。
- 此外,我们允许用户通过调整nCount_RNA滑块手动进行质量控制并查看感兴趣的细胞(图2E,中)。
- 为了评估细胞簇的可靠性,用户可以审查与每个簇相关的特异性高表达基因(图2E,右)。
- 或者,用户可以导航到‘Correlation’页面,以审查不同簇在多模态组学水平上的相关性。
RNA tab or ATAC tab
RNA标签或ATAC标签
Para_21
- 在 RNA 选项卡中,每个聚类的细胞数量和比例显示在左侧。
- 所选细胞在 RNA 水平上的 UMAP 投影显示在右侧(图 2F)。
- 通过点击图例标签,用户可以选择查看特定的聚类。
- 此外,在数据质量部分,展示了每个聚类的计数和特征。
- 虽然降维过程涉及选择前 2000 个基因,但图中标注了数据集中排名前 15 的高变异基因的基因符号。
- 基因列表展示了在每个聚类中至少 25% 的细胞中高度表达且对数值变化大于 0.25 的基因。
Para_22
- 用户可以搜索感兴趣的基因或按 P 值排序,以探索在特定细胞类型中表现出特定表达模式的基因。
- 此外,表格下方提供了方便的下载按钮,便于用户轻松访问表格数据。
- 此外,ATAC 界面提供了 scATAC-seq 数据的交互式 UMAP 可视化(图 2G)。
- 每个聚类的计数、峰和 TSS 富集得分均展示出来,以便检查数据的可靠性。
- 包含特定峰的表格对用户公开可访问。
Search tab
搜索选项卡
Para_23
- 搜索页面作为一个平台,用于展示基因和峰在细胞或聚类水平上的分布。
- 用户可以通过选择框选择感兴趣的基因,并且数据可以通过散点图、小提琴图、山脊图和点图进行可视化表示(图2H)。
- 同时,散点图部分可以调整以显示来自RNA、ATAC和WNN整合数据的UMAP坐标。
- 此外,界面集成了Biodalliance插件,以实现整个基因组水平上子组间峰富集的可视化(图2I)。
- 用户可以选择输入与参考基因组对应的基因名称或所需峰的信息,以使用选择框定位染色体位置。
- 该插件还提供基因组位置的缩放功能,并支持以SVG格式下载图像以生成矢量图形。
Download tab
下载选项卡
Para_24
- 在本页面中,我们提供元数据和 R 对象的下载。
- 元数据包括每个细胞的全面注释细节,涵盖 orig.ident、nCount_RNA、nFeature_RNA、nCount_ATAC、nFeature_ATAC、nucleosome_signal、nucleosome_percentile、TSS.enrichment、TSS.percentile 和 celltype。
- R 对象包括 RNA、ATAC 和 WNN 数据,使用户可以直接将它们导入 R 环境中以可视化细胞聚类并进行进一步分析。
Integrative analysis of scMMO data identified novel cell subsets
scMMO 数据的整合分析鉴定出新的细胞亚群
Para_25
- scMMO-atlas 包含来自5项研究中28个样本的52130个小鼠大脑皮层细胞的 scATAC + RNA 数据。
- 大多数大脑皮层细胞来自成年小鼠,而4322个细胞来自18天的胚胎。
- 整合 scRNA 数据和 scATAC 数据鉴定了39个细胞亚群,包括17个兴奋性(Ex)神经元亚群,8个抑制性(In)神经元亚群,4个星形胶质细胞(Astro)亚群,3个血管细胞亚群等。
- 在39个亚群中,七个亚群是新识别的,即 Ex-L2/3-Cpne6、Ex-L4/5-Cntn5、In-Pbx3、In-Tac1-Scn5a 以及三个星形胶质细胞亚群(Astro-Lars2、Astro-Agt 和 Astro-Grm3)。
- 特别是,Astro-Grm3 在 Wnt 信号通路中表现出显著富集,并且高表达与 Wnt 相关的基因。
- 由于 Wnt 信号通路已被报道参与早期星形胶质细胞的激活和增殖,因此 Astro-Grm3 应该是一个早期激活的星形胶质细胞亚群。
图片说明
◉ 图3. 小鼠大脑皮层细胞异质性的单细胞多组学综合探索。(A) 整合 ATAC 和 RNA-seq 数据后,小鼠大脑皮层细胞的 UMAP 投影,按 39 个不同簇着色。◉ (B) 星形胶质细胞-Grm3 特异性高表达基因主要与 Wnt 信号通路相关。◉ (C) 星形胶质细胞-Grm3 特异性基因的富集通路。◉ (D) 使用 scRNA-seq(左)、scATAC-seq(中)和整合的 scATAC + RNA(右)对 EX-L6-Tle4 亚群的 UMAP 投影。◉ (E) 每个小鼠大脑皮层数据集对 EX-L6-Tle4 和 EX-L6-Tle4-Nrf1 的贡献。◉ (F) EX-L6-Tle4 和 EX-L6-Tle4-Nrf1 之间染色质可及性类型的差异。◉ (G) EX-L6-Tle4-Nrf1 特异性基因(如 Stx6、Denr、Nrf1 和 Klf15)启动子周围的读段密度。◉ (H) 在 EX-L6-Tle4-Nrf1 特异性染色质可及位点中 NRF1 和 KLF15 基序的富集。◉ (I) 基于 scRNA-seq 数据的 EX-L6-Tle4 富集通路和 EX-L6-Tle4-Nrf1 富集通路。◉ (J) 推断的 EX-L6-Tle4 亚群的伪时间轨迹。
Para_26
- 有趣的是,基于RNA数据推断出的细胞亚群EX-L6-Tle4在ATAC数据和整合数据中显示为两个不同的亚群,即EX-L6-T1e4和EX-L6-Tle4-Nrf1(图3D)。
- 分析表明,97%的EX-L6-Tle4-Nrf1来源于18天胚胎的小鼠大脑皮层,而99%的EX-L6-Tle4来源于成年小鼠,这表明ATAC数据可能提供独特信息来区分胚胎亚群和成年EX-L6-Tle4亚群(图3E)。
- 与EX-L6-Tle4相比,EX-L6-Tle4-Nrf1的染色质可及性位点在基因启动子区域富集,例如Stx6、Denr、Nrf1和Klf15的启动子显示了EX-L6-Tle4-Nrf1特有的染色质可及性(图3F-G)。
- 实际上,基序分析显示Nrf1和Klf15的基序在EX-L6-Tle4-Nrf的染色质可及性位点显著富集(图3H)。
- Nrf1和Klf15分别是线粒体稳态和代谢的重要调节因子。
- 此外,EX-L6-Tle4-Nrf1特异性高表达基因显著与氧化磷酸化、代谢过程和线粒体电子传递相关(图3I)。
- 这些结果支持线粒体代谢在早期神经元发育中起作用。
- 进一步的轨迹分析表明,EX-L6-Tle4-Nrf1可以分化为EX-L6-Tle4(图3J)。
Para_27
- 总之,对小鼠大脑皮层的多模态组学数据进行综合分析可以促进发现新的细胞亚群和不同的发育状态。
- 这一策略为未来的研究工作提供了关键基础,挖掘了在单细胞领域进一步洞察和发现的潜力。
Discussion
Para_28
- 据我们所知,scMMO-atlas 是首个公开可访问的数据库和门户网站,用于访问和利用 scMMO 数据。
- 虽然有各种细胞图谱,例如 HCA 提供了包含大量细胞的综合参考细胞图谱,但 scMMO-atlas 独特地专注于 scMMO 数据,为基于单细胞多组学数据探索细胞异质性、细胞动态、轨迹和单细胞分辨率基因调控提供了卓越的资源。
- 特别是,用户可以将自己的数据上传到 scMMO-atlas 进行细胞注释和各种探索。
Para_29
- 我们将继续维护,并定期从 GEO 和 ArrayExpress 获取数据以更新 scMMO-atlas。
- 我们将迅速审查并纳入用户上传的 scMMO 数据。
- scMMO-atlas 致力于涵盖更广泛的组织类型和细胞类型。
- 这一雄心勃勃的举措旨在为研究人员节省宝贵的数据检索时间,并为未来的单细胞多组学研究提供全面的细胞图谱。