空间转录组学识别与肺纤维化远端肺重塑相关的分子微环境失调
Basic Information
- 英文标题:Spatial transcriptomics identifies molecular niche dysregulation associated with distal lung remodeling in pulmonary fibrosis
- 中文标题:空间转录组学识别与肺纤维化远端肺重塑相关的分子微环境失调
- 发表日期:03 February 2025
- 文章类型:Article
- 所属期刊:Nature Genetics
- 文章作者:Annika Vannan | Nicholas E. Banovich
- 文章链接:
Abstract
Para_01
- 远端肺部的大规模结构和细胞组成变化是肺纤维化(PF)的标志,但导致疾病发病机制的空间背景尚不明确。
- 通过基于图像的空间转录组学,我们分析了来自35个独特肺部的160万个细胞的基因表达情况。
- 通过互补的基于细胞和创新的非细胞特异性分析,我们确定了PF相关细胞类型的定位,建立了经典PF组织病理学特征的细胞和分子基础,并识别了正常和PF肺部中多种不同的分子定义空间生态位。
- 利用机器学习和轨迹分析对气腔进行分级重塑严重程度的分割和排序,我们识别出与远端肺部病理性进展相关的组成和分子变化,这些变化从肺泡上皮失调开始,并最终导致巨噬细胞极化的改变。
- 这些结果共同提供了一个独特的、空间解析的PF视图,并建立了可以应用于其他空间转录组学研究的方法。
Main
Para_01
- 人类肺部在结构上非常复杂,包含多种具有特定功能的上皮细胞、间质细胞和免疫细胞,它们分布在解剖学上不同的位置。
- 远端肺部的结构和细胞组成的大规模变化是肺纤维化(PF)和其他慢性肺病的标志。
- PF是一种进行性综合征,可能发生在已知的环境暴露、系统性疾病、单基因综合征的情况下,也可能是特发性的。
- 特发性肺纤维化(IPF)仍然是最常见的也是最严重的PF形式;大多数患者在确诊后3-5年内因疾病去世或需要进行肺移植,而现有的抗纤维化治疗只能适度减缓肺功能的不可避免下降。
Para_02
- 特发性肺纤维化(IPF)患者肺部的组织病理学特征(描述为‘寻常型间质性肺炎’)的一个标志是空间异质性,其中高度重塑的区域可以紧邻相对保存完好的肺泡结构。
- 这种病理的空间变异被认为代表了肺部疾病演化的不同步(‘时间异质性’)。
- 除了病理的空间异质性外,IPF 肺部还表现出以下特征:‘近端化上皮化生’,即通常在气道中发现的细胞类型出现在远端肺上皮中;出现充满黏液的囊性结构(‘蜂窝囊肿’);以及‘成纤维细胞病灶’的形成(上皮下成纤维细胞聚集),这些被认为是肺部疾病病理的‘前沿边缘’。
- 与将 IPF 易感性与肺上皮联系起来的遗传证据以及实验模型的数据一起,这些经典的组织病理学特征支持了目前主流的 IPF 发病机制模型,该模型认为远端肺上皮的慢性/反复损伤导致肺泡修复功能障碍,并最终引发进行性纤维化重塑。
Para_03
- 尽管在使用整体组织方法进行基因组分析时,疾病的细胞复杂性和空间异质性带来了挑战,但单细胞方法非常适合此类研究。
- 使用基于液滴的单细胞 RNA 测序 (scRNA-seq) 的大型合作研究改进了我们对正常人肺细胞组成的理解,并强调了特发性肺纤维化 (IPF) 肺中细胞组成和分子程序的显著变化,包括疾病出现和疾病干扰的细胞类型和状态。
- 病理的空间异质性表明,在给定的 IPF 肺中,不同的空间区域(生态位)可能同时发生多种不同的病理程序;因此,理解细胞和分子程序介导疾病发病机制的空间背景至关重要。
- 为此,我们使用具有亚细胞分辨率的基于图像的空间转录组学来研究特发性和其他形式肺纤维化中肺泡生态位失调的演变。
Results
Diverse cellular landscape of the lung
肺部的多样化细胞图谱
Para_01
- 使用 Xenium 平台,我们分析了来自九名未受影响捐赠者和 26 名因肺纤维化(PF)接受肺移植的参与者的 45 份肺组织样本中的 343 个基因,在亚细胞分辨率下测量了 299,018,086 个转录本(图 1、补充图 1 和 2 及补充表 1)。
- 在 26 名 PF 参与者中,最常见的诊断是特发性肺纤维化(IPF,n = 12,占 46.2%)。
- 大多数捐赠者自述为欧洲血统(29 名,占 82.9%),其中 17 名(48.6%)报告目前或曾经使用烟草。
- 为了实现空间分辨的单细胞分析,我们使用自动细胞分割边界将转录本分配到细胞中(图 1)。
- 由于细胞边界不确定以及可靠地将转录本分配给正确细胞存在挑战,细胞分割仍然是该领域的一个难题;因此,我们仅关注与核边界重叠的转录本。
- 经过这一质量过滤后,我们保留了包含 121,794,939 个转录本的 1,630,319 个细胞(图 1 和补充图 2)。
- 单细胞分析采用修改后的标准方法进行(方法)。
Fig. 1: Outline of spatial transcriptomics processing and analysis pipeline.
- 图片说明
◉ 总共处理了45个肺组织核心样本(直径3-5毫米),这些样本来自未受影响的供体和肺纤维化(PF)患者,使用Xenium Analyzer仪器进行分析,其中包括四个组织微阵列(TMA),每个包含三到九个样本,以及一个额外的重复TMA,该重复TMA包含17个额外样本,并加入了细胞结合染色。◉ 我们使用定制面板以亚细胞分辨率量化了343个基因的表达。◉ 经过过滤后,我们在所有五个TMA中使用GraphSAGE方法识别转录本生态位时保留了299,018,086个高质量转录本。◉ 其中,原始TMA 1-4上的210,370,118个转录本用于构建初始GraphSAGE模型。◉ 经过进一步过滤后,我们对跨内皮、上皮、免疫和间充质谱系的1,630,319个分割核进行了细胞类型注释。◉ 展示的一个示例样本是VUILD96LA(诊断为结节病)。◉ 该图由BioRender创建。
Para_02
- 我们总共识别了47种细胞类型,其中包括在单细胞RNA测序(scRNA-seq)研究中代表性不足的细胞类型,例如内皮细胞和间充质细胞,其数量显著增加(图2a、补充图2和补充表2),更好地反映了疾病状态下肺部的细胞组成。
- 例如,先前使用电子显微镜和光显微镜的研究估计健康远端肺中II型肺泡细胞(AT2)与I型肺泡细胞(AT1)的比例为1.68。
- 从这些空间转录组分析中,我们在未受影响的样本中观察到平均AT2/AT1比例为2.5,这比单细胞RNA测序中发现的比例(AT2/AT1比例=13.2;图2b)更接近预期值。
- 经典的细胞类型标志物在预期的细胞中定位通常具有较高的准确性(图2c);然而,即使将分析限制在核边界内的转录本中,仍然存在来自邻近细胞的基因表达‘污染’现象。
- 这似乎是空间转录组技术的一个基本特性,源于对三维组织进行二维细胞分割的性能限制(图2c及扩展数据图2-5)。
- 评估特定肺结构(例如气道、肺泡和血管)内细胞的空间位置支持了对注释细胞身份的高度信心(图2d-i)。
- 例如,我们观察到基底细胞和多纤毛细胞及其标志基因分别朝向气道的基底膜和内腔(图2d,e)。
- 同样,空间数据使我们能够识别成纤维细胞亚型,包括广泛分布于肺部的肺泡成纤维细胞、围绕传导气道和肺泡管的肌成纤维细胞、在斑片状病灶中的‘纤维化’活化成纤维细胞以及在胸膜表面与间皮细胞相邻的‘胸膜下’成纤维细胞(表达PLIN2)(图2h,i)。
Fig. 2: Cell-type composition of unaffected and PF lung tissue determined using marker gene expression and spatial information.
- 图片说明
◉ a,所有样本中发现的每种细胞类型的频率。◉ b,在当前空间数据集和最近的一个单细胞RNA测序数据集中,比较了样本间AT2与AT1细胞计数的比例。异常值样本以单独点显示。没有同时包含AT1和AT2细胞计数的样本未被纳入分析。所有样本的平均比例列于上方。箱线图显示中位数,箱子延伸到第一和第三四分位数,须线延伸到最大(上须)或最小(下须)值,最大范围为上下1.5倍的四分位距。样本量——空间对照组,n = 10;疾病组,n = 34;参考文献9对照组,n = 16;疾病组,n = 22。◉ c,热图点图显示用于注释数据集中细胞类型的选定基因。扩展版本包含更多基因,请参见补充数据图1。◉ d,e,示例气道(TILD299MA;IPF),展示上皮细胞(d)和选定标记基因(e)。基底细胞位于气道的外缘,而其他气道细胞类型,特别是多纤毛细胞,则朝向内腔方向排列。◉ f,g,选择性肺泡中的细胞类型(f)和标记基因表达(g)(VUHD113;未受影响)。◉ h,i,间充质细胞(f)和标记基因表达(g)(VUILD106MA;IPF),增殖成纤维细胞为清晰起见已省略。由平滑肌纤维包围的气道用括号标出。e,g,i,图周围的框根据所标记的细胞类型着色,如d,f,h所示。COL1A1(i)的灰色虚线框表示该基因是成纤维细胞的一般标记基因。Activ., 激活型;cDCs, 经典树突状细胞;DCs, 树突状细胞;FBs, 成纤维细胞;Fibr., 纤维化;IFN, 干扰素;Inflam., 炎症;MΦ, 巨噬细胞;MDMs, 单核细胞衍生巨噬细胞;NK, 自然杀伤细胞;NKT, 自然杀伤T细胞;pDCs, 浆细胞样树突状细胞;PNEC, 肺神经内分泌细胞;SMCs, 平滑肌细胞;Tregs, 调节性T细胞;IQR, 四分位距。
Para_03
- 为了捕捉 PF 病理的区域异质性,对于一部分参与者,我们分析了反映不同程度病理重塑的配对样本,而来自其他参与者的样本则集中在代表严重重塑和相对完好肺泡之间‘边界’的‘过渡’区域。
- 包括多种疾病在内的病理研究为探索疾病的分子演变提供了机会,这种机会超出了仅关注高度重塑/终末期样本的研究所能捕捉到的内容。
- 根据方法部分(补充表 1)中描述的整体病理程度,PF 样本被标记为‘受累较轻’或‘受累较重’。
- 尽管我们的团队和其他团队已经使用单细胞 RNA 测序(scRNA-seq)对 PF 肺的不同区域进行了分析,但空间转录组学的一个关键优势在于能够将分子测量结果与组织学评估的病理重塑梯度完美匹配。
Para_04
- 首先关注于为最近在单细胞 RNA 测序中描述的细胞类型/状态建立空间背景,我们观察到(与其他报道一致)SCGB3A2+ 上皮细胞在正常肺部的小/终末气道中受到限制,但在肺纤维化 (PF) 肺部的重塑区域广泛存在,在这些区域中它们通常(但并非绝对)与 SFTPC 共表达。
- 在间充质细胞中,PI16+/MFAP5+ 外膜成纤维细胞主要与血管相关,而 WNT5A+ 肌成纤维细胞则在导管区域以及传导气道的固有层与外膜交界处被观察到。
- 表达不同水平 CTHRC1、FAP 和/或 POSTN 的激活‘纤维化’成纤维细胞主要集中于广泛的上皮化生区域的基底区域,但在某些样本中也更弥散地分布。
- COL15A1+ ‘系统静脉’内皮细胞在 PF 样本中相对广泛地存在,尤其是在结构重塑最严重的样本中。
- 与我们自己和其他人的先前研究一致,我们发现 KRT5−/KRT17+ ‘异常基底样’细胞位于活化的纤维化成纤维细胞附近。
- 与最近的一项报告不同,在这些分析中,包括广泛的病理重塑,我们发现 KRT5−/KRT17+ 细胞更可能靠近肺泡型而非气道型上皮细胞,尽管它们也靠近小气道中的上皮细胞。
- 此外,我们发现 KRT5−/KRT17+ 细胞在受影响较小的区域最为丰富,并且在严重重塑的区域更可能靠近气道型细胞。
Para_05
- 我们还进行了一系列分析,比较了类别划分之间的细胞和分子变化,并根据‘病理百分比’的定量指标进行了跨类别比较,同时基于临床医生的注释,对27种特定的PF组织病理学特征进行了表征。
Niche analyses reveal disease-emergent cellular interactions
生态位分析揭示了疾病相关的细胞间相互作用
Para_01
- 接下来,我们试图超越先验定义的病理特征,全面定义肺部在空间上整合的细胞/分子单元,并描述它们在疾病中的演变。
- 我们采用了两种互补的计算方法,将样本划分为具有分子和细胞相似性的区域(即空间上的‘生态位’;图1和图3a;方法)。
- 首先,我们使用基于细胞的方法,利用Seurat v5,根据空间邻近性和细胞类型注释构建局部邻域,然后进行k-means聚类。
- 这种方法受到以下两个因素的限制:(1) 受到细胞注释‘粒度’的影响,(2) 仅使用分配给细胞核的转录本数据。
- 为克服这些限制,我们还开发了一种新方法,直接使用转录本数据,不依赖于细胞分配来识别生态位。
- 使用GraphSAGE,我们基于转录本数据的空间位置训练了一个图神经网络模型,以聚合局部邻域信息并定义嵌入空间,从而为数据集中的所有单个转录本提供新的表示。
- 然后,我们在嵌入空间中应用高斯混合模型对转录本进行聚类以识别生态位,并通过共识方法将细胞分配到这些生态位。
- 在这两种分析中,我们都识别出12个生态位(基于细胞的聚类为C1–C12,基于转录本的聚类为T1–T12),这些生态位表现出不同的基因表达特征和细胞类型组成(图3b,补充图14–16和补充表9)
Fig. 3: Complementary spatial niche analyses provide comprehensive annotation of tissue remodeling in PF.
- 图片说明
◉ 来自未受影响样本和 PF 样本的代表性例子,展示了基于转录本的生态位(左侧)和基于细胞的生态位(右侧)。显示了 VUHD113 和 VUILD107MA(IPF 诊断)。对于转录本生态位,展示了六边形二进制图(方法部分)。对于细胞生态位,每个点代表一个细胞质心。◉ 细胞分配到基于转录本的生态位(顶部)和基于细胞的生态位(底部),以每种细胞类型数量的比例表示(每列总和为 1;列由灰线指示)。◉ 条形图描绘了在未受影响、受轻微影响和受严重影响的样本类型中,分配给每个转录本和细胞生态位的细胞总比例。◉ 选择性注释的生态位组成,作为注释内细胞数量的比例(每行总和为 1;行由灰线指示)。对于 b 和 d,比例低于 0.01 的未显示,比例图例适用于两个面板。扩展版本(d)包含所有注释列表,详见补充图 17b。c 中的不同颜色表示所有面板中的生态位颜色。Micro.,显微镜下;Min.,最小程度。
Para_02
- 该方法的目的是以无偏见的方式识别和表征细胞和分子特征的保守关系模式,这些模式代表了经常彼此靠近的不均匀细胞/转录组群的重复模式(图3b和补充图16)。
- 例如,气道生态位C1和T7以及淋巴样生态位T2和C9分别描述了特定气道和淋巴样细胞类型之间的紧密空间关系(图3b、补充图3和补充表3)。
- 这些生态位还捕捉到不同谱系细胞之间更复杂的关系,包括‘健康’的肺泡生态位(T4;C8),其中包含AT1、AT2、毛细血管细胞和肺泡成纤维细胞等其他细胞类型。
- 令人惊讶的是,我们还在这一生态位中观察到了中性粒细胞,这可能是由于来自病情恶化捐赠者的组织存在局部急性炎症的结果。
- 未受影响的样本主要由这些健康的肺泡生态位定义,其在PF样本中的相对丰度显著较低。
- 此外,许多生态位要么是疾病特有的,要么在疾病中富集,包括免疫相关(T2、C7、C9)、纤维化相关(T6、T9、C4)和过渡上皮生态位(T3、C2;图3c和补充图14)。
- 特别是,富含淋巴细胞炎症的生态位(T2、C9)在更重塑的样本中更为普遍,可能暗示其在疾病后期(而非早期)发病机制中的作用。
- 基于转录的生态位分类还解析出两个富含间充质细胞的不同生态位。
- T6包含活化的纤维化成纤维细胞,并且主要局限于重塑上皮周围的区域,而T9分布更广,表现出较低的活性纤维化标志物表达水平,似乎反映了更‘终末期纤维化’的状态。
- 过渡上皮生态位在对照样本中几乎不存在,但在病变样本中包含了大部分上皮细胞。
- 引人注目的是,我们观察到肺纤维化(PF)肺部中重塑程度较低的区域的生态位组成更接近于受影响较大的PF肺部而非正常肺部。
- 这一意外发现表明,尽管结构相对保存完好,但在重塑程度较轻的区域仍存在广泛的分子病理学,挑战了空间异质性允许在晚期肺纤维化肺部相对较轻重塑区域观察到‘早期疾病’生物学的传统观念。
Para_03
- 接下来,我们试图了解这些微环境如何与特定的病理特征对齐(补充说明)。
- 尽管许多特征包含多样化的微环境组合,但有些特征则主要或几乎完全由单一微环境标记(图3d)。
- 例如,肉芽肿和三级淋巴结构(TLSs)主要分布在疾病富集的C9和T2免疫微环境中,而多核细胞则由C11和T8标记(图3b,d及补充图16和17)。
- 特别引人注意的是我们观察到上皮细胞从其下方基底膜的部分脱离(图4及扩展数据图7–9)。
- 这一特征,我们标注为"上皮脱离",之前已在特发性肺纤维化(IPF)和其他形式的肺纤维化中有所描述,并在其他组织学研究中被观察到。
- 在我们的数据中,上皮脱离与基于转录本和细胞的微环境T3和C3分别密切相关,这两个微环境包含了绝大多数检测到的KRT5−/KRT17+细胞(分别为96%和64%;图3b,d和4a)。
- 为了进一步验证我们的发现,我们使用Visium HD平台生成了与Xenium基础分析相匹配的基于测序的空间转录组数据(方法部分)。
- 通过更广泛的基因集合,我们发现了KRT5−/KRT17+细胞和活化的纤维化成纤维细胞高度一致的信号定位(扩展数据图10和补充表10)。
- 由于设计上的局限性(因全面注释每个样本的不切实际性),我们的上皮脱离注释并不全面(补充说明),因此我们推测微环境分析有助于快速识别特定特征的更多实例。
- 确实,在微环境分析的指导下,我们在其他样本中识别出了表现出上皮脱离的其他区域(图4b)。
- 这些发现突显了空间转录组数据直接从分子数据中识别特定疾病相关病理特征的潜力。
Fig. 4: KRT5−/KRT17+ cells detach at sites of active fibrosis identified by spatial niches.
- 图片说明
◉ 通过临床医生直接标注的上皮脱离(括号)的 H&E 染色图像(a),以及未标注的图像(b),叠加了列出基因的转录表达(颜色显示在 d 的左侧),并与 T3(绿色)和 C3(红色)生态位进行了比较。◉ 在其中一个样本中,我们观察到一个由纤维化生态位(T6/T9;棕色/粉色)和 COL1A1 表达(灰色)标记的致密纤维化区域,该区域与 T3/C3 相邻,表明上皮脱离,并靠近正常肺泡生态位(T4/C8;浅米色/后者未显示),这些生态位表达 AT1 标志物 AGER(浅蓝色)。◉ 同一区域被描绘出来,显示了与 a,b,e–g 中相同的基因表达,但 MMP7 被省略以提高清晰度。◉ 这一区域包含两个最初由临床医生标注的上皮脱离位点(e)、额外的 KRT5−/KRT17+ 和过渡性上皮细胞脱落的例子(f),以及一个由活化的纤维化成纤维细胞包围的非脱落 KRT5−/KRT17+ 细胞实例(g)。◉ 比例尺 = 20 µm。样本—(a) VUILD107MA,(b) VUILD91MA 和 (c–g) VUILD91LA,所有样本均诊断为 IPF。◉ 每个样本中分配给 T3 和 C3 生态位的细胞比例,按疾病状态分为未受影响、较少受影响和较多受影响(n = 10, n = 15 和 n = 20,分别)。箱线图显示中位数,铰链延伸至第一/第三四分位数,须线延伸至上/下最大值至 1.5× IQR。异常值显示为单独的点。◉ 每种细胞生态位中 KRT5−/KRT17+ 细胞与活化的纤维化成纤维细胞之间的接近程度(每种细胞类型每生态位 n = 6–29,535)。log OR 和误差棒(5–95% 置信区间)表示 KRT5−/KRT17+ 细胞最近邻域为活化成纤维细胞的可能性(顶部)或反之亦然(底部)。显著结果(错误发现率(FDR)< 0.05,紫色)高于或低于 0(虚线)表示细胞类型在特定生态位内接近的可能性增加或减少。◉ KRT5−/KRT17+ 细胞与其他所有上皮细胞类型相比,选择性差异表达基因的热图。属于特定 GO 术语或 PANTHER 类别的基因已标记(完整分组见补充表 12)。OR,优势比。
Para_04
- 在一个样本中,我们观察到一个显著的密集纤维化区域,几乎完全被T3和C3生态位所包围(图4c,d)。
- 在这个区域附近,我们发现了多个上皮脱落的例子。
- 我们还在同一个转录学定义的生态位中识别出结构完整的上皮(图4e–g),这似乎是亚病理性的重塑例子,表明我们可以识别出先于组织病理学变化的分子和细胞变化。
- 虽然上皮脱落的分子特征在推测的纤维化前沿(由活化的纤维化成纤维细胞标记)与肺泡上皮之间的界面处非常突出,但较大的纤维化区域则以稳定的纤维化生态位和泛成纤维细胞标志物COL1A1为特征(图4c)。
- 此外,我们观察到类似肺泡的开放结构,但完全没有上皮(图4c,d)。
- 在单一时间点上,我们无法确定这些‘残留’肺泡的起源,但一种可能的解释是它们跟随纤维化前沿的上皮脱落发生。
- 这些观察结果提出了至少部分KRT5−/KRT17+细胞可能代表上皮脱落和其他进行性病变之前的一种细胞状态的可能性。
- 我们发现与脱落相关的生态位存在于疾病样本中(在受影响较小的活检样本中比例略有增加),但在对照组中几乎不存在(图4h)。
- 有趣的是,尽管这两个生态位都含有高比例的KRT5−/KRT17+细胞,但T3转录生态位主要标记了一系列与过渡性肺泡上皮相关的细胞类型,包括过渡性AT2细胞和呼吸道分泌细胞(RASCs),并且通常出现在靠近活跃纤维化前沿的结构正常肺泡附近(图4和扩展数据图7–9),而C3细胞生态位捕捉到了KRT5−/KRT17+细胞与表达CTHRC1和FAP的活化成纤维细胞之间的关系,并标记了上皮脱落和纤维化病灶。
- 事实上,在C3生态位内,我们观察到KRT5−/KRT17+细胞与活化的纤维化成纤维细胞之间以及反之的邻近性显著增加,从而在这与脱落相关的生态位中建立了这些细胞之间最强烈的相互关联(图4i,补充图3、18和19以及补充表2和11)。
- 具体来看,在KRT5−/KRT17+细胞相对于其他上皮细胞类型的上调基因中,我们观察到与先前文献相似的表达模式,包括COL1A1增加、已知的PF血液生物标志物MMP7以及转录因子编码基因SOX4和SOX9(图4j)。
- 值得注意的是,这些以及其他特定的KRT5−/KRT17+基因对应于与细胞外基质组织、细胞黏附和运动相关的基因本体(GO)通路,表明这些基因程序的失调可能导致从基底膜和相邻细胞的脱离。
Disease-emergent macrophages accumulate in airspaces
疾病诱导的巨噬细胞在气腔中聚集
Para_01
- 除了确定与特定病理特征紧密相关的生态位外,我们的分析还揭示了广泛的分子病理学现象,这些现象并未特别对应于经典的 PF 疾病特征。
- 我们发现了一个与肺泡空间内巨噬细胞积累相关的细胞生态位,无论诊断结果如何,该生态位在所有疾病样本中均存在(C11;图 3b 和 5a,b 以及补充图 14)。
- 有趣的是,与肺泡空间积累相关的巨噬细胞似乎包括两个主要不同的群体,一个主要由 FABP4 标记,另一个由 SPP1 标记(图 5c-e)。
- 肺泡空间中 SPP1+ 巨噬细胞的积累与其他 IPF 研究结果一致。
- 除了肺泡空间积累的巨噬细胞,在肺纤维化 (PF) 样本中,当肺泡重塑不那么显著时,我们观察到肺泡内的较小群组 FABP4+(肺泡)巨噬细胞和间质中的 SPP1+ 巨噬细胞(图 5c)。
- 尽管在肺泡空间内积累,但作为总巨噬细胞群的一部分,FABP4+ 巨噬细胞仅在受累较轻的样本中略有增加,并且随着病理百分比的增加而变得不那么频繁(图 5f、扩展数据图 7 和补充图 7)。
- 与此同时,SPP1+ 巨噬细胞在对照组肺中也有观察到,但在受累更严重的样本中占总巨噬细胞群的比例更高,并且 SPP1 表达的增加与更高的病理评分相关(图 5f、补充图 7 和补充表 2、7 和 8),这表明巨噬细胞表型的演变是进行性肺纤维化的特征。
- 此外,我们使用更广泛的基因集和匹配的 Visium HD 数据确认了远端肺泡空间中同时存在 FABP4+ 和混合 FABP4+/SPP1+ 的积累(图 5g,h 和补充表 10)。
- 在许多参与者中,观察到同一 3–5 毫米活检样本中 FABP4+ 和 SPP1+ 巨噬细胞积累的离散区域。
- 目前尚不清楚这些不同的巨噬细胞亚型是否直接促进局部重塑(例如,通过 SPP1 介导的转化生长因子 β 活性增强)还是由于微环境信号的不同极化所致。
- 确实,虽然已有许多研究描述了肺纤维化中巨噬细胞的表型和组成变化,但在本研究中,我们提供了单细胞分辨率下肺纤维化肺部巨噬细胞多样性的空间背景和特征。
Fig. 5: FABP4+ and SPP1+ macrophages accumulate in PF airspaces and are characterized by a spatial niche.
- 图片说明
◉ 箱线图显示了在不同疾病严重程度下分配到 C11 生态位的细胞比例,包括未受影响(n = 10)、较少受影响(n = 15)和更多受影响(n = 20)的样本。◉ 一个代表性示例展示了细胞生态位,包括样本 VUILD102LA(IPF)中的 C11 巨噬细胞积累生态位(浅蓝色)。◉ FABP4+ 和 SPP1+ 巨噬细胞存在于轻微重塑的肺泡中,其中包括聚集在肺泡内的 FABP4+ 巨噬细胞(用方括号表示)。◉ 标记了迁移到肺泡腔内的单个 FABP4+ 巨噬细胞和小范围的 FABP4+ 聚集(黑箭头),以及间质中的 SPP1+ 巨噬细胞(白箭头),这些标记并不全面。◉ FABP4+(d)和 SPPP1+(e)巨噬细胞在气道和显著重塑的远端气腔中的积累叠加了所列基因的转录表达图像。◉ 巨噬细胞亚型在不同疾病严重程度下的分布情况,以占总巨噬细胞群体的比例表示。◉ 匹配的 Xenium 和 Visium HD 图像展示了远端气腔内 FABP4+(g)和混合 FABP4+/SPP1+(h)巨噬细胞的积累情况。◉ 对于 g,Visium HD 图像(右侧)显示了一组标记肺泡巨噬细胞的基因的 log2 表达总和作为密度图,叠加在 H&E 图像上。◉ 在 h 中,一组标记肺泡巨噬细胞的基因的 log2 表达总和与一组标记 SPP1+ 巨噬细胞的基因进行了比较。同时,对两种巨噬细胞类型均为强标记的基因未包含在 h 中。◉ 基因选择过程详见方法部分,标记基因列表见补充表 10。◉ 对于 c-e、g-h 的 Xenium 图像,如果表达,所有列出的基因在每个示例图像中都可能可见,但为了清晰起见,SCGB3A2 在包含气道的两个图中未显示,AGER 仅在 d 中显示。◉ 每个 H&E 图像左下角的标尺为 20 µm。◉ c,样本 TILD130LA(IPF);d,来自 VUILD91MA(顶部;IPF)和 VUILD96LA(底部;结节病)的示例;e,样本 VUILD78MA(顶部;IPAF)和 VUILD96MA(底部;结节病);g-h,样本 VUILD49LA(cHP)。
A timeline of alveolar dysregulation
肺泡失调的时间线
Para_01
- 最后,我们试图利用样本间疾病特征的空间异质性,重现PF进展的‘分子自然史’。
- 我们假设,在这些样本中,通过将每个气腔作为一个独立单元进行特异性分析,可以捕捉到大部分肺泡重塑的分子演化过程,并开始确立通往终末期PF的‘事件顺序’。
Para_02
- 为此,我们首先开发了一种机器学习方法,根据转录表达的空间模式来识别和分割样本中的管腔(图1和图6a;方法)。
- 然后,我们将细胞分配到每个管腔,并过滤分析空间,仅包括可能来源于肺泡的管腔(补充表13)。
- 接下来,我们根据健康肺泡转录生态位T4对应的转录本比例,将剩余的1,747个气腔按连续性排序,从组成最正常的(即"稳态")到重塑程度最高的气腔(参考文献36;图6b)。
- 支持这种伪时间策略的有效性的是,未受影响样本的肺泡在轨迹起点富集,且病理百分比沿轨迹逐渐增加。
- 按照这种方式按疾病严重程度对肺泡进行排序后,我们使用广义加法模型(GAMs)识别出与伪时间显著相关的基因表达、细胞类型组成和生态位比例(图6b,补充图20和21以及补充表14–17;方法)。
- 通过细胞类型和生态位分析的支持,我们发现肺泡稳态的初始丧失表现为毛细血管内皮细胞和AT1细胞的减少。
- 我们观察到增殖的AT2细胞最初增加(这与经典的"增生性肺泡上皮细胞"描述一致),但随着剩余上皮细胞逐渐表现出更多"过渡性"和终末气道类型的特征/生态位,这种现象变得不那么频繁。
- 激活的(CTHRC1+/FAP+)纤维化成纤维细胞出现在向更像气道的上皮细胞转变的过程中,而FABP4+和随后SPP1+巨噬细胞的累积则是较晚发生的事件。
Fig. 6: Alveolar remodeling at airspace resolution.
- 图片说明
◉ a,管腔分割流程的表示。◉ b,热图显示了与伪时间显著相关的每个基因的预测表达情况。◉ 顶部注释显示了与伪时间相关的选择细胞类型、细胞生态位和转录生态位,其中每种颜色的最深阴影代表在所有气腔中找到的该细胞类型或生态位的最大比例。◉ 疾病严重程度分为未受影响(蓝色)、较轻受影响(粉色)和更严重受影响(红色)。◉ c,仅使用包含在 1,747 个气腔中的细胞,显示了在稳态阶段(89 个基因)或早期重塑阶段(35 个基因)中表达发生变化的 124 个基因在不同细胞类型中的缩放表达情况。◉ 细胞类型的颜色按照谱系划分,如图 2 所示。◉ 在顶部,如果某个基因在以下谱系的伪时间过程中至少有一种细胞类型表现出显著的表达变化,则对应框会被填充:内皮(橙色)、上皮(绿色)、淋巴(紫色)、髓系(粉色)和间充质(蓝色)。◉ 百分比计算方式为:将每个谱系中所有细胞类型在伪时间过程中的显著测试次数(FDR < 0.05)除以该肺泡重塑阶段的总显著测试次数,分别对应稳态阶段(绿色,左侧)或早期重塑阶段(黄色,右侧)。◉ 在 y 轴上,z 分数为 0 的位置用虚线标记。◉ d,H&E 图像显示了在伪时间轨迹末端附近的两个肺泡中混合的 FABP4+ 和 SPP1+ 巨噬细胞聚集,并叠加了所有列出基因的转录表达情况。◉ 在 H&E 图像上方,每个肺泡按照其在伪时间中的位置进行标记,并显示了在伪时间过程中每个气腔中肺泡巨噬细胞和 SPP1+ 巨噬细胞的比例,如 b 中所示。◉ 展示的示例肺泡为 VUILD115MA_90(cHP 诊断;顶部)和 VUILD78MA_27(IPAF,底部)。◉ 每个 H&E 图像右下角的比例尺 = 20 µm。
Para_03
- 接着,我们使用谱聚类将表达变化分为四个大类:稳态和早期、中期以及晚期重塑(图6b和补充表18)。
- 鉴于对早期疾病机制的了解有限,我们专注于处于稳态和早期重塑阶段的基因。
- 我们采用伪批量方法,汇总每个气腔内的基因表达水平。
- 为了剖析早期重塑基因的动力学,我们量化了1747个气腔内所有细胞中每种细胞类型的表达水平(图6c和补充表19)。
- 此外,我们对计数充足的25种细胞类型进行了细胞类型水平的广义可加模型(GAM)分析,考虑了细胞类型组成。
- 在这两项分析中,我们都清楚地看到信号集中于上皮细胞,分别有30.9%和32.3%的显著关联来自这种谱系,对应于稳态和早期重塑,其中18.6%和16.1%特别集中于AT2细胞。
- 这一结果表明,在广泛结构重塑发生之前,肺泡上皮中的分子病理已经显现,并支持将上皮损伤和失调视为肺纤维化风险和疾病启动的核心概念。
- 这一结论与晚期重塑中识别出的显著关联形成对比,其中34.5%的总关联来自上皮细胞,而37.8%来自髓系细胞(补充图22)。
- 有趣的是,在关注晚期重塑中的髓系细胞时,我们观察到两波有序的FABP4+巨噬细胞峰,随后是SPP1+巨噬细胞峰。
- 在这些两波峰的交界处,我们发现了一些同时存在FABP4+和SPP1+巨噬细胞的气腔(图6d),这暗示FABP4+巨噬细胞的积累可能导致SPP1+巨噬细胞的招募或分化。
- 事实上,先前的研究已提出这两种可能性。
- 综合这些结果,支持一种概念模型,即初始肺泡重塑由肺泡-毛细血管界面的破坏驱动,伴随上皮中再生相关程序的激活,随后是亚上皮成纤维细胞的激活波,然后是髓系细胞的招募或增殖。
Discussion
Para_01
- 在先前的肺分子图谱项目基础上,我们生成了一个综合性的、单细胞分辨率的空间背景化描述,涵盖了健康状态和慢性纤维化肺病中成人远端肺的细胞多样性。
- 除了对个体细胞类型进行背景化之外,我们还确定了特发性肺纤维化(PF)经典组织病理学特征的分子基础。
- 令人惊讶的是,我们在靠近活化成纤维细胞区域上方发现大量 KRT5−/KRT17+ 细胞从基底膜上脱离的现象。
- 尽管这一发现之前很少被报道,但关于这种现象是否发生在体内还是反映了一种体外伪影仍存在争议。
- 虽然我们不能完全排除这种可能性,但我们认为,如果这是一种随机的体外伪影,在多个样本中以类似细胞和空间生态位背景下识别到相同特征的可能性很低。
- 在这些区域,KRT5−/KRT17+ 细胞通常表现出拉长的、鳞状形态,这提示这种脱离可能类似于其他组织/条件下鳞状上皮的脱落,而在此处则发生在修复和再上皮化可能无效的病理性状态下。
- 最近的一项独立预印本研究也报告了类似的发现,包括活体成像手术活检中脱落的气道上皮的证据,表明这种现象可以在体内发生。
- 这一过程的含义尚不清楚,但一种可能性是暴露的基底膜可能容易出现斑片状融合,或允许成纤维细胞迁移到气道空间,它们在那里产生病理性细胞外基质,最终导致气道阻塞,并在融合/阻塞点远端形成囊性结构。
- 鉴于最近的过继转移研究表明,当将 IPF 基底/类基底细胞注入气道时可促进纤维化,这些发现提示 KRT5−/KRT17+ 细胞的旁分泌效应在体内可能超出直接邻近的细胞范围。
Para_02
- 我们还发现,无论使用细胞感知方法还是细胞无关方法,人类肺部都存在一定数量的保守的、可分子定义的空间‘生态位’。
- 由于关键的细胞过程以空间和时间协调的方式发生,将这些生态位概念化为不同的功能单元,可以在特定背景下对细胞和分子程序进行定向探究。
- 我们发现,在疾病病理过程中,给定生态位的相对丰度发生了显著变化。
- 最引人注目的是,即使在纤维化肺部相对较保存的区域中,‘正常肺泡’的分子特征也几乎消失,这表明严重的分子病变先于广泛的组织/结构重塑发生。
Para_03
- 随后,我们将这一概念进一步扩展,通过开发一种新的方法来分割单个肺泡/气腔,并探索在逐渐重塑的区域中分子病理学的演变。
- 这些结果表明,在初始的炎症细胞浸润或成纤维细胞活化之前,观察到的是肺泡上皮和邻近毛细血管网络的破坏,然后才是其他结构重塑的检测结果。
- 这一概念得到了更多证据的支持,表明肺纤维化风险主要由肺上皮介导。
- 其他公认的与疾病相关的特征,包括大量活化成纤维细胞的出现和巨噬细胞的聚集,则似乎是重塑过程中的后期事件。
- 这些发现表明,精准治疗策略可能需要同时评估个体在特定时间点哪些细胞机制最为显著。
- 这不仅提出了潜在的挑战,还提高了通过更好地将治疗与个体患者的疾病生物学对齐来改善结果(并最小化毒性)的可能性。
Para_04
- 本研究存在一些局限性。
- 首先,尽管这是迄今为止报道的最大规模基于成像的人类肺部空间转录组学研究,但研究最终反映的个体数量相对较少(n = 35),样本来源于器官捐献者或终末期疾病患者,且参与者主要为欧洲血统。
- 基于成像的空间转录组学平台本质上是半靶向的;本研究中使用的探针集由先前的单细胞RNA测序数据集指导,并专门开发用于细胞识别以及已知与肺纤维化相关的分子程序和通路的分析。
- 此外,细胞分割仍然是一个挑战,尤其是在许多细胞类型具有不规则形状和/或大小的器官(包括肺)中。
- 虽然新兴的细胞边界染色方法可以一定程度上改善这一问题,但我们预计由于远端肺部的三维结构关系,这仍将是难题。
- 为了在细胞感知分析中减轻这些问题,我们将数据集限制为位于细胞核上方的转录本,但仍然存在一定程度来自邻近/覆盖细胞的转录本‘污染’,需要在基因水平分析时进行事后过滤。
- 与单细胞RNA测序不同,这种污染是非随机的;因此,‘去噪’将需要新的计算方法。
Para_05
- 简而言之,本研究对成人远端肺部在健康状态和肺纤维化(PF)状态下的细胞多样性和分子病理进行了全面的特征描述。
- 保守的、可从分子层面定义的空间生态位及其在疾病中的演变,为肺纤维化的发病机制提供了见解。
- 利用空间转录组学方法开发新的分析手段,以量化和探究多细胞生态位,为肺生物学研究领域提供了宝贵的资源。
Methods
Participants and samples
参与者和样本
Para_01
- 这里描述的研究符合伦理规定,并已获得当地机构审查委员会的批准,包括提供书面知情同意(范德比尔特大学医学中心(VUMC)机构审查委员会(060165 和 171657)和西方机构审查委员会(20181836))。
- 外围肺纤维化样本是在范德比尔特大学医学中心或诺顿胸科研究所进行肺移植手术时获取的,具体方法如先前所述。
- 对照组肺组织样本来自未被接受用于器官捐献的肺。
- 诊断由当地治疗医生及相关的多学科委员会确定,并根据美国胸科学会/欧洲呼吸学会当前的共识指南通过检查病理结果加以确认。
- 样本名称是根据其采集地点(范德比尔特大学—‘VU’;转化基因组学研究所—‘T’)、疾病状态(健康供体—‘HD’;间质性肺病—‘ILD’)、分配给患者的唯一编号以及适用情况下样本是否来自‘受影响较小’或‘受影响较大’的组织部分(由后续方法部分中描述的病理评分百分比决定)生成的。
- 重复的健康样本用‘A’和‘B’标记以区分(例如,VUHD116A 和 VUHD116B),而具有相同‘受影响较小’或‘受影响较大’指定的重复疾病样本则用‘1’和‘2’标记(例如,VUILD105MA1 和 VUILD105MA2)。
Tissue microarray (TMA) construction
组织微阵列(TMA)构建
Para_01
- 为了最大化每次运行的效率,可以使用组织微阵列(TMA)设计将多个样本放置在单个 Xenium 幻灯片(10.45 毫米 × 22.45 毫米)上。
- 每个肺部甲醛固定石蜡包埋(FFPE)块的 5 微米切片用苏木精和伊红(H&E)染色,并由医生识别感兴趣的区域,标记为相对样本而言纤维化较少或较多(LF 或 MF)。
- 对于 TMA 1–4,分别针对 3 毫米和 5 毫米的核心设计了 3 × 3 或 2 × 2 的模式(补充表 1)。
- 样本核心使用‘Quick-Ray 手动组织微阵列完整套装’和‘Quick-Ray 模具’根据制造商的指示手动打孔并放置。
- 空白石蜡块(VWR,76548-194)中取出的核心用于填充空的核心空间。
- 完成后,将块面朝下放在干净的玻璃载玻片上,并在温柜中短暂加热(约 45°C),以稍微融化石蜡并使块面平整。
- 然后将 TMA 块冷却至室温,从载玻片上取下,密封后存放在 4°C。
Para_02
- 在对10X Xenium处理和软件进行改进后,构建了额外的组织微阵列(TMA5)。
- TMA5以3×6的模式设计,包含3毫米的核心,左上角的核心位置留空以便定位,总计17个样本。
- 亚利桑那州立大学仪器设计与制造核心实验室制作了一个特殊的3毫米方形尖端,用于适配Quick-Ray手动组织微阵列仪,使我们能够生产方形组织核心。
- 由于新的核心形状,TMA5是通过将每个核心单独放置在双面胶带(Gorilla Double-Sided Mounting Tape)上制成的,并置于石蜡块模具中。
- 整个模具加热至37°C,使用P1000移液器将400微升融化的石蜡注入核心之间的通道中。
- 随着更多石蜡倒入模具背面,模具被轻轻敲击以排出气泡。
- 固化后,石蜡块从模具中取出,并移除胶带。
- TMA5随后经历了与其他TMA相同的温柜存放和存储条件。
Para_03
- 在TMA制备过程中,一些样本被放置得非常靠近,导致部分转录本和细胞核无法明确归属于特定的样本。这些转录本和细胞核已被从下游分析中移除。
Para_04
- 所有样本都通过了 Xenium 工作流程,其中 TMA5 的四个特定样本(一个未受影响和三个 PF 样本)在经过 Xenium 处理后还额外通过了 Visium HD 协议,以生成正交数据来验证感兴趣的现像。
- 两种工作流程将在下面描述。
Xenium in situ workflow
Xenium原位工作流程
Gene panel design
基因面板设计
Para_01
- Xenium 原位技术需要使用预定义的基因面板。
- 每个探针包含两个与目标 mRNA 互补的配对序列以及一个基因特异性条形码。
- 在配对末端结合后,发生连接反应。
- 现在呈环状的探针通过滚环扩增进行放大,提高目标检测和解码的信噪比。
- 在此数据集的分析中,共纳入了 343 个独特的基因。
- 其中 246 个基因来自 Xenium 人类肺基础面板的早期版本(PD_277),97 个基因来自定制设计的面板(CVEVZD)。
- 定制面板基于人类肺单细胞分析数据构建,选择用于细胞类型识别和/或怀疑与特发性肺纤维化相关的基因。
Xenium sample preparation
Xenium样本制备
Para_01
- 由于 Xenium 原位技术检测 RNA,所有协议工作站和设备均使用 RNase AWAY(RPI, 147002)清洗,并随后用 70% 异丙醇擦拭。
- 所有试剂,包括水,均为分子级无核酸酶级。
- 样本制备从在切片机(Leica, RM2135)上对福尔马林固定石蜡包埋(FFPE)块进行复水和切片开始。
- 厚度为 5 µm 的切片被放置在 Xenium 玻片(10X Genomics)上。
- 经过一夜干燥后,带有样本的玻片在室温下密封于干燥器中储存,时间不超过 10 天。
- 随后,玻片被放入成像盒中以完成其余的准备步骤。
- 组织去石蜡化和解交联步骤使得亚细胞 RNA 目标可接近。
- 基因探针杂交在 50 °C 下持续 18 小时(Bio-Rad DNA Engine Tetrad 2)进行。
- 第二天,未结合的探针通过后续洗涤去除。
- 连接酶被添加以环化已结合探针的配对末端(37 °C 下持续 2 小时),随后进行酶促滚环扩增(30 °C 下持续 2 小时)。
- TMA5 根据 10X Genomics 的验证协议 CG000749 准备,并包含 Xenium 多组织染色(10X Genomics, 1000662)。
- 所有玻片在 Tris-EDTA(TE)缓冲液中清洗后,化学淬灭背景荧光;已知肺组织以及福尔马林固定过程会产生自发荧光问题。
- 经过 PBS 和 PBS-T 清洗后,DAPI 被用于染色样本核。
- 最终的玻片在 PBS-T 中于 4 °C 下避光保存,时间不超过 5 天,直至加载到 Xenium Analyzer 仪器上。
- 逐步的 Xenium FFPE 制备指南和缓冲液配方可以在 10X Genomics 的验证协议 CG000578 和 CG000580 中找到。
Xenium Analyzer instrument
Xenium分析仪
Para_01
- Xenium Analyzer 是一种全自动仪器,用于解码 RNA 目标的亚细胞定位。
- 用户通过在初始低分辨率的全载玻片图像上手动选择样本位置来标记分析区域。
- 每次运行加载可消耗试剂和最多两块载玻片后,内部样本和液体处理机制控制实验进程。
- 数据收集以荧光标记探针结合、图像采集和探针剥离的循环形式进行。
- 荧光探针的图像是以 4,240 × 2,960 像素的视野(FOVs)拍摄的。
- 在成像过程中检测到的局部荧光强度点被定义为潜在的 RNA 点状结构。
- 面板上的每个基因在图像通道中都有独特的荧光模式。
- 与特定模式匹配的点状结构随后被解码并根据基因 ID 进行标记。
- 最后,所有图像视野及其相关检测到的转录本通过 DAPI 染色图像计算拼接在一起。
- 机载分析管道根据信号和解码过程的可变置信度为每个检测到的转录本提供质量值。
- TMA1 至 TMA4 的数据是在仪器软件版本 1.1.2.4 和分析版本 xenium-1.1.0.2 上获取的。
- TMA5 的数据是在仪器软件版本 2.0.1.0 和分析版本 xenium-2.0.0.10 上获取的。
- TMA5 对每个 Xenium 多组织染色通道进行了额外的荧光图像拍摄,以便进行细胞分割。
- 有关仪器操作和耗材准备的详细说明可以在 10X Genomics 的示范协议 CG000582 中找到。
Postrun histology
跑后组织学
Para_01
- 跑完步后,根据 10X Genomics 的已验证协议 CG000613,将载玻片从 Xenium Analyzer 仪器上取下并去除淬灭剂。
- 随后,按照以下协议对载玻片进行 H&E 染色:二甲苯(3 次,每次 3 分钟),100% 酒精(2 次,每次 2 分钟),95% 酒精(2 次,每次 2 分钟),70% 酒精(2 分钟),去离子水冲洗(1 分钟),苏木精染色(1 分钟;Biocare Medical CATHE),去离子水冲洗(1 分钟),蓝化溶液(1 分钟;Biocare Medical HTBLU-M),去离子水冲洗(3 分钟),95% 酒精(30 秒),伊红染色(5 秒;Biocare Medical HTE-GL),95% 酒精(10 秒),100% 酒精(2 次,每次 10 秒)和二甲苯(2 次,每次 10 秒)。
- 使用 Micromount(Leica, 3801731)进行封片,并在室温下过夜固化。
- 组织学图像在 Leica Biosystems Aperio CS2 上以 20 倍放大拍摄。
Data preprocessing
数据预处理
Cell segmentation
细胞分割
Para_01
- 使用 10X Xenium 舱内细胞分割技术(10X Genomics)进行细胞分割。
- 对 DAPI 形态学图像中用 DAPI 染色的细胞核进行分割,并整合边界以形成不重叠的对象。
- 对于 TMA 1-4 上的样本,通过将核边界扩展 15 微米或直到碰到另一个细胞边界来近似进行细胞分割。
- 对于 TMA5 上的样本,使用细胞边界染色进行细胞分割。
- 对于所有 TMA,使用核分割来定义细胞。
Image registration
图像配准
Para_01
- 在ImageJ(2.14.0)中使用BigWarp插件,将Xenium DAPI形态图像(即细胞核)与同一切片的H&E染色图像进行了配准。
- 为了将两张图像放置在DAPI形态图像的坐标空间中,指定H&E染色图像为移动图像,DAPI形态图像为目标图像。
- 在两张图像上可识别的地标处放置锚点(每对图像大约200个地标)。
- 然后应用薄板样条变形算法以对齐两张图像之间的对应锚点。
- 配准后的图像经过手动检查,以审查配准过程中可能产生的视觉伪影。
- 这些配准图像随后在Xenium Explorer 3.0.0软件中可视化,该软件用于生成展示转录本表达叠加在H&E染色上的图示。
Quality filtering and data preprocessing
质量过滤和数据预处理
Para_01
- 对于每个样本,Xenium 生成了一个转录本信息的输出文件,包括 x 和 y 坐标、对应的基因、分配的细胞和/或细胞核以及质量评分。
- 低质量的转录本(质量值 (QV) < 20)以及与空白探针对应的转录本被移除。
- 使用 Seurat v5 对细胞核基因表达数据进行进一步的质量过滤和可视化处理。
- 根据落在分割细胞核内的转录本表达情况,为每个样本创建了细胞核-基因计数矩阵。
- 基于这些计数矩阵和包含细胞核坐标及面积的元数据文件,为所有样本创建了一个合并的 Seurat 对象。
- 保留的细胞核需满足以下标准:≥12 个转录本对应于 ≥10 个独特基因;高质量转录本中对应于阴性对照探针、阴性对照编码词、未分配编码词的比例或这些比例的累计值 ≤5%;细胞核面积 ≥6 且 ≤80 微米。
- 由于 Xenium 输出的坐标基于每张载玻片,这会导致多个载玻片上的样本具有共享坐标,因此手动调整了细胞核坐标以便在绘图时无样本重叠。
- 这些调整后的细胞核坐标作为降维对象添加到了 Seurat 对象中。
Dimensionality reduction, clustering and cell-type annotation
降维、聚类和细胞类型注释
Para_01
- 在 Python 中使用 Scanpy 进行降维和聚类,而在 R 中使用 Seurat v5 进行这些结果的可视化。
- 基因表达量通过 log1p 转换按细胞进行归一化处理。
- 通过主成分分析进行降维。
- 基于这种降维结果计算最近邻距离矩阵,并使用 Leiden 算法对细胞核进行聚类。
- 然后生成数据的均匀流形近似与投影(UMAP)图以进行可视化。
- 为了提高速度,这些计算使用包含 RAPIDS(v21.8.1)实现的 Scanpy(v1.8.1)容器完成。
Para_02
- 对于细胞类型的注释,我们同时使用了标志基因和空间信息。
- 我们没有单纯依赖基因表达,因为在空间数据中,一定程度的基因‘污染’是不可避免的,因为位于一个细胞中的转录本可能会被分配给足够接近的相邻细胞。
- 因此,我们将包括细胞形态和组织学特征在内的空间数据纳入进来以标记聚类簇。
- 初始的 Leiden 聚类主要根据标志基因(通过 Seurat v5 的 FindMarkers 功能评估)按细胞谱系进行分割,这些标志基因包括 PECAM1(内皮)、EPCAM(上皮)、PTPRC(免疫)、DCN、LUM 和 COL1A1(均为间充质)。
- 为每种谱系创建了新的 Seurat/AnnData 对象,并按照上述方法再次进行降维和聚类。
- 然后根据标志基因对聚类簇进行了初步的细胞类型标注。
- 上皮和免疫谱系进一步细分为亚谱系,例如肺泡和气道细胞(上皮),以及髓系和淋巴系细胞(免疫),并为这些亚谱系生成了新的 Seurat/AnnData 对象并重新处理。
- 随着谱系和亚组划分变得更加精确,聚类簇被赋予了修订后的注释。
- 那些不属于原始分配谱系或亚谱系的‘孤立’聚类簇,以及由多个谱系基因标记的聚类簇,基于与可靠标记的聚类簇共享的标志基因和空间模式获得了最终注释。
- 低质量的聚类簇,具有极低的转录本数量和/或冲突的标志基因且无法解决(类似于 scRNA-seq 数据中的‘双细胞’),被移除。
- 最终得到了 47 种细胞类型,包括 4 种内皮细胞、12 种上皮细胞、22 种免疫细胞和 9 种间充质细胞(扩展数据图 2–5 和补充表 2)。
H&E image annotation
H&E图像注释
Percent pathology assignment
百分比病理分配
Para_01
- 通过视觉估算样本总成像区域中发生结构重塑的比例来评估病理百分比。
- 如果病变样本的病理百分比大于或等于75%,则标记为‘受影响更大’。
- 所有其他病变样本标记为‘受影响较小’,而对照样本无论病理百分比得分如何均标记为‘未受影响’。
Annotation of histological features
组织学特征的注释
Para_01
- 我们在所有45个样本中标注了27种组织学特征的代表性例子,其中包括12种上皮来源或可能为上皮来源的特征(正常肺泡、轻微重塑肺泡、AEC增生、肺气肿、重塑上皮、晚期重塑、上皮脱落、残余肺泡、小气道、大气道、显微镜下蜂窝状改变和杯状细胞化生),3种血管相关特征(动脉、肌性动脉和小静脉),3种免疫相关特征(肉芽肿、混合性炎症和三级淋巴结构),5种间质/间充质特征(叶间隔、气道平滑肌、成纤维细胞灶、纤维化和严重纤维化)以及2种通用特征类型(多核细胞和巨细胞)。
- 标注是在已配准的H&E图像上使用QuPath(v.0.4.3)完成的。
- 随后,使用自定义的Python(v.3.12.3)脚本将细胞分配到标注区域。
- 具体来说,标注区域按每像素0.2125 µm的比例进行缩放,以与细胞中心坐标单位一致。
- 每个标注区域中的细胞被赋予一个布尔值,表示该细胞中心是否位于标注区域内。
- 在过滤掉不包含任何细胞的标注后,27种组织学特征中共有712个标注。
Comparison to scRNA-seq datasets
与单细胞RNA测序数据集的比较
Para_01
- 我们将当前空间数据集的细胞谱系恢复结果与两个单细胞RNA测序(scRNA-seq)来源进行了比较。
- 第一个是参考文献9,这是我们实验室最近进行的一项单细胞表达数量性状位点(sc-eQTL)研究,另一个是人类肺细胞图谱(HLCA),它整合了多项肺部单细胞RNA测序研究的数据。
- 来自HLCA的研究在所研究的疾病类型以及数据集中是否包含对照样本和/或肺部疾病样本方面存在差异。
- 我们将比较范围缩小到那些在预处理过程中未专门富集或耗尽特定谱系细胞的研究(肺图谱)或样本(sc-eQTL研究),并且不完全包含鼻腔样本的数据。
- 我们纳入了sc-eQTL研究中的47个样本(19个对照样本和28个ILD样本)以及HLCA中的14个数据集。
- 对于每个数据来源,首先计算所有样本中每个谱系(内皮、上皮、免疫和间充质)的细胞比例,然后分别计算对照样本和疾病样本的比例。
- 如果某个注释的细胞类型没有明确的谱系关联,则将其从分析中移除。
- 本研究的样本水平数据与sc-eQTL研究的样本水平数据以及HLCA的数据集水平信息进行了比较。
Post-Xenium Visium HD workflow for select samples
特定样本的Post-Xenium Visium HD工作流程
Post-Xenium Visium HD sample preparation
Xenium Visium HD样品制备后
Para_01
- 所有协议工作站和设备均使用 RNase Away (RPI 147002) 和 70% 异丙醇进行清洁。
- 所有试剂,包括水,均为分子级别的无核酸酶级。
- 含有 IPFTMA5 的 Xenium 玻片在运行后按照‘Xenium 原位工作流程—运行后组织学’中的描述进行了 H&E 染色。
- 玻片在加盖后被储存在密封的干燥器中,温度为 4°C,持续 9 天。
- 然后将玻片在二甲苯中去盖,装载到 Visium 组织玻片盒 (10X Genomics) 中,并使用 0.1 N HCl 进行脱色处理。
- 由于解交联步骤已经在 Xenium 工作流程中完成,因此归档玻片协议中的该步骤被跳过。
- 逐步的归档玻片制备指南和缓冲液配方可以在 10X Genomics 的示范协议 CG000684 中找到。
Visium HD CytAssist preparation
Visium HD CytAssist 制备
Para_01
- Visium HD组织盒内的组织切片随后被准备装载到CytAssist仪器上。
- 它经历了人类探针杂交(10X Genomics, 编号省略)和杂交后的清洗以去除未结合的探针,接着进行探针连接和后续清洗。
- 包含探针捕获区域的Visium HD切片被制备好。
- Visium HD切片和组织切片都被装载到CytAssist仪器上,以实现探针释放和捕获。
- 四个样本被选作代表性的子集(一个未受影响的样本和三个纤维化的样本)用于Visium HD分析(VUHD049, VUILD49LA, TILD111LA 和 TILD113LA),因为其捕获区域比Xenium切片更小。
- 在Visium HD切片上捕获后,探针被延伸,溶解于0.08 M KOH中,然后转移至1 M Tris–HCl(pH 8)中。
- 使用SPRIselect试剂(Beckman Coulter, 编号省略)进行预扩增清理。
- 样本在4°C下储存过夜。
- 关于Visium HD CytAssist操作、组织盒以及Visium HD切片制备的详细说明可以在10X Genomics的示范协议CG000685中找到。
Visium HD library construction and sequencing
Visium HD文库构建与测序
Para_01
- 基于探针的文库构建使用了 Dual Index Plate TS Set A(10X Genomics,产品编号 1000251),样本索引 PCR 循环次数为 16 次,该数值由 qPCR(Applied Biosystems QuantStudio 5)的 Cq 值确定。
- 最后通过 SPRIselect 试剂进行清理,并在 −20 °C 下储存直至测序。
- 文库质量控制在 Agilent TapeStation 4200 上完成。
- 使用 Illumina 的 NovaSeq X 平台进行了新一代测序,采用 100 亿读长、300 个循环的流动池。
- 通过组织覆盖率百分比估计值与恒定的最大读对数 2.75 亿对的乘积,达到了最低测序推荐标准。
- 通过每泳道 235 pM 的加载浓度实现了最佳簇密度。
- 所有步骤均按照 10X Genomics 的已验证协议 CG000685 中的说明进行。
Visium HD data processing
Visium HD 数据处理
Para_01
- 高分辨率图像通过 Loupe Browser (v8.0.0; 10X Genomics) 中的 Visium HD 手动对齐工具进行对齐。
- 在捕获区域内,每份样本选择五个匹配的地标进行对齐,然后由软件算法优化。
- Visium HD 序列数据、高分辨率图像和对齐文件使用 Spaceranger (3.0.0; 10X Genomics) 的 count 功能进行处理,并采用默认参数。
- 读段被映射到 GRCh38-2020-A 参考序列上。
Visium HD data analysis
Visium HD数据分析
Para_01
- 为了比较 Xenium 和 Visium HD 的输出结果,使用 Loupe Browser(v8.0.0)软件将 Visium HD 数据的基因表达可视化到 H&E 图像上。
- 通过综合基因表达评分来可视化几种感兴趣细胞类型的标记基因表达。
- 这些综合评分是通过汇总每种细胞类型 7-26 个基因的 log2 转换独特分子标识符 (UMI) 计数创建的,这些基因是根据扩展数据图 1 中的点图热图和先前文献选择的(KRT5−/KRT17+ ‘异常基底样’细胞;活化的纤维化成纤维细胞;肺泡 FABP4+ 巨噬细胞;SPP1+ 巨噬细胞;补充表 10)。
- 三个强烈的经典标记基因 KRT5−/KRT17+ 细胞或活化成纤维细胞(COL1A1、FN1 和 ACTA2)未包含在这些细胞类型的综合评分中,因为它们既标记这两种细胞类型(COL1A1 和 FN1),也强烈标记另一种细胞类型(ACTA2 标记平滑肌)。
- 对于肺泡巨噬细胞和 SPP1+ 巨噬细胞之间的比较(图 6h),排除了在当前 Xenium 数据集中对两种巨噬细胞群体均为强标记的基因,除了 PPARG,它已知可以在 scRNA-seq 中区分这些群体,并且在 Visium HD 数据的 SPP1+ 区域中表达较低。
Computational niche identification
计算生态位识别
Transcript-based niches
基于转录本的生态位
Para_01
- 使用图神经网络模型 GraphSAGE(在 StellarGraph v1.2.1 + Python 3.8.0 中实现)对基于转录本的生态位进行了表征,该模型无需细胞分割即可直接对检测到的转录本进行建模。
- GraphSAGE 通过采样和聚合邻居来学习图数据中的结构,能够很好地扩展到大型图。
- 从每个样本中检测到的转录本在去除低质量转录本(QV < 20)和空白探针后用于构建样本图。
- 每个样本图由代表单个转录本的节点组成,节点之间如果欧几里得距离(基于空间坐标)小于某个阈值(d = 3.0),则会连接边,这与之前的一项研究类似。
- 每个节点都与一个输入特征向量相关联,该向量是节点基因标签的 one-hot 编码,并且去除了包含少于十个节点的小连通分量(过滤后 n = 299,018,086)。
Para_02
- 应用了两跳 GraphSAGE 模型来学习节点嵌入。
- 该模型分别在第一跳和第二跳邻居中采样了 20 和 10 个邻接节点,以学习图中每个节点在每跳中的 50 维嵌入。
- 为了将所有样本中的节点嵌入到同一嵌入空间中,我们在一个联合图上训练模型,该联合图由来自 28 个样本(TMA 1–4)的子图组成,每个子图包含 5,000 个随机采样的根节点及其三跳邻居,以及它们之间的现有边。
- 用于模型训练的联合图包含 18,594,542 个节点和 421,316,086 条边。
- 通过解决‘正’和‘负’节点对的二分类任务,以无监督方式训练模型,其中模型根据节点的局部邻域结构预测两个节点是否应具有边连接。
- 我们用十个 epoch 训练了该模型,达到了 0.82 的训练准确率。
Para_03
- 使用训练好的模型获得了来自 TMA 1-4 的 28 个样本中所有节点(转录本)的嵌入表示,并使用 PyCave 库中实现的高斯混合模型(k = 12)对所有节点进行了无监督聚类。
- 随后,我们使用相同的训练模型获取了 TMA5 中 17 个样本的嵌入,并将其转录本投影到现有的 12 个转录本聚类中。
Transcript-based niche plots and assignment of nuclei to niches
基于转录本的生态位图谱和细胞核到生态位的分配
Para_01
- 我们为每个样本创建了一个六边形汇总图,使用了所有转录本,并设置了5的箱宽来生成基于转录本的生态位图,以克服过度绘制的问题。
- 每个箱子被标记并用落在该箱区域内的主要转录本簇标签着色。
- 包含少于十个转录本的箱子未被纳入图表中。
- 为了将细胞分配到基于转录本的生态位,我们通过计算每个细胞质心与六边形箱子质心之间的欧几里得距离,将每个细胞分配给其最近的六边形箱子。
Cell-based niches
基于细胞的微环境
Para_01
- Seurat v5 的 BuildNicheAssay 功能通过 k-means 聚类方法,根据细胞类型组成将其 25 个最近邻细胞划分为 12 个空间生态位。
Cell-type proximity analysis
细胞类型邻近性分析
Para_01
- 为了评估细胞类型之间的接近程度,每个细胞都被固定,并在其与固定细胞和邻近细胞之间计算距离和角度方向,这些邻近细胞位于半径为60微米的固定圆内。
- 只有第一级邻居被视为靠近固定细胞。
- 使用逻辑回归评估细胞类型相互靠近的概率,通过将细胞分配到二进制的靠近和不靠近类别中,并将细胞类型作为协变量。
- 这种分析既针对所有样本和细胞类型进行,也在每个细胞和转录生态位内单独进行。
Differential expression and composition analyses
差异表达与组成分析
Differential cell-type composition by disease severity
按疾病严重程度划分的差异细胞类型组成
Para_01
- 我们使用 logit 转换对每份样本的细胞类型比例进行了转换,并利用 propeller58 中实现的 propeller.anova 函数测试了三组疾病样本(未受影响、受影响较小和受影响较大样本)之间的细胞类型比例是否存在差异。
Representative gene detection in transcript-based niches
基于转录本的生态位中代表性基因的检测
Para_01
- 我们使用了在propeller和limma中实现的线性模型框架,来检测不同生态位中基因比例的差异,从而识别每个生态位的代表性基因。
- 我们首先研究了每个样本中分配给每个生态位的转录本比例。
- 当某个样本中仅有少量转录本(比例 < 5 × 10−4)被分配到某个生态位时,该样本将被排除在对该生态位的测试之外。
- 基因比例经过logit转换,并为每个基因拟合了一个线性模型,该模型在考虑样本差异的同时,对每个生态位中转换后的基因比例均值进行建模。
- 通过对比一个生态位的基因比例均值与其他生态位的平均比例均值,推导出差异丰度基因。
Differential expression, cell-type composition and niche proportions by percent pathology
根据病理百分比的差异表达、细胞类型组成和生态位比例
Para_01
- 我们使用了相同的 propeller 和 limma 框架来寻找与样本中病理百分比变化相关的基因、细胞类型和生态位比例。
- 比例经过 logit 转换,然后拟合线性模型以描述转换后的比例与样本中病理百分比之间的关系,从而找出随病理百分比显著变化的特征(即基因、细胞类型和生态位)(FDR < 0.01)。
Para_02
- 我们还通过伪批量基因表达分析了样本中按细胞类型区分的差异基因表达与病理百分比的关系。
- 对于每种细胞类型,我们筛选了测试基因列表以去除污染信号。
- 为了确定每种细胞类型的污染基因,我们首先使用每千个细胞计数归一化方法对基因计数进行缩放,并保留至少在该细胞类型内 30% 的细胞中有至少五个计数的基因用于测试。
- 然后,我们使用 propeller 和 limma 框架对每种细胞类型的剩余基因进行了测试。
Differential expression analysis across annotated pathology features
跨注释病理特征的差异表达分析
Para_01
- 我们汇总了每个病理注释实例中包含的细胞的基因计数,并通过拟合 limma 中实现的线性模型检测了不同病理注释之间的差异表达基因。
- 基因表达被转换为每百万计数(CPM),并在添加 0.5 的伪计数后进行 log2 转换。
- 在 50% 的注释实例中低表达的基因(log2(CPM) < 8)被排除在外。
- 应用 limma 的 voom 函数来建模均值-方差关系,并为每个 log2CPM 观测值分配权重,随后在回归模型中使用这些权重以解释计数数据中的异方差性。
- 通过在线性模型中将 TMA 源作为协变量加入,我们控制了 TMA 的影响。
- 通过比较每种注释类型的基因表达与其余类型,检测了每种注释类型的差异表达基因。
- 此外,我们还单独比较了上皮注释彼此之间,以识别病理性上皮中的失调基因。
Lumen segmentation and airspace identification
腔体分割与空域识别
Initial lumen segmentation
初始管腔分割
Para_01
- 为了从空间测序数据中分割单个管腔,开发了一种自定义的图形处理单元(GPU)加速图像处理算法,该算法使用 Python(v.3.9.7)中的 scikit-image(v.0.19.3)、RAPIDS cuCIM(v.22.12.00)和 CuPy(v.11.2.0),为时空转录组数据中的管腔分配唯一标识符。
- 简而言之,排除与免疫细胞相关的转录本后,将每个检测到的转录本的位置二值化为二维图像,随后进行一系列膨胀、腐蚀和闭合操作以定义组织位置并分割管腔。
- 通过在去噪且闭合的形状上使用 Alpha Shapes(alphashape 包 v.1.3.1),定义了组织的外边界,代表整个组织。
- 然后使用 scikit-image 为负空间(管腔)分配唯一标识符,并计算每个单独管腔的指标。
- 将细胞中心(细胞核)分配给最近管腔的唯一标识符,方法是在受限区域内搜索最近标签,使用 scikit-image 中实现的 K-D 树最近邻查找算法,定义截止距离为正常肺泡壁的厚度。
- 所有不靠近管腔的细胞都被赋予零标识符。
Quality filtering to isolate alveolar airspaces
质量过滤以分离肺泡气腔
Para_01
- 首先通过大小过滤光晕,以去除错误的阳性分割。
- 我们保留了包含 25 到 500 个细胞的光晕,其中至少包含 5% 的上皮细胞,并且光晕中任意两个细胞核之间的最大距离至少为 110 微米。
- 高细胞数量和低上皮细胞阈值的选择是为了保留具有大量巨噬细胞聚集的光晕。
- 对于每个光晕,计算属于每个细胞生态位的细胞比例,并将比例最高的细胞生态位记录为‘主要细胞生态位’。
- 为了排除与内皮和气道结构相对应的光晕,要求光晕的内皮生态位比例 C10 小于 0.3、C12 小于 0.3,同时气道生态位比例 C1 小于 0.2。
- 为了进一步分离可能源自肺泡的光晕,仅保留那些主要细胞生态位为 C2/C5(过渡性上皮)、C8(健康肺泡)、C3(KRT5−/KRT17+ 纤维化生态位)和/或 C11(肺腔巨噬细胞聚集生态位)的光晕。
Assessing changes in cell types, niches and gene expression along pseudotime
评估沿伪时间的细胞类型、生态位和基因表达的变化
Para_01
- 基于被分配到 T4 健康肺泡生态位的核转录本重叠比例,对剩余的 1,747 个肺泡腔进行了伪时间分析。
- 这使我们能够根据疾病严重程度和组织重塑的连续性对肺泡腔进行排序。
- 为了找到在伪时间过程中丰度或表达量变化的细胞类型、生态位和基因,我们使用 tradeSeq 中的 fitGAM 函数,在负二项分布下对肺泡间聚合的特征计数应用广义加性模型(GAMs)。
- 随后,我们使用 associationTest 对特征与伪时间之间的关联性进行了检验。
Cell-type changes along pseudotime-ordered airspaces
沿伪时间排序的气腔中的细胞类型变化
Para_01
- 我们统计了每种细胞类型在气室中的数量,并针对伪时间拟合了一个广义可加模型(GAM),同时以总细胞数的对数转换作为偏移量。
- 如果某种细胞类型在至少十个气室中出现次数少于三次,则将其排除(共测试了36种细胞类型)。
- 我们通过关联性测试获得了显著细胞类型的列表(总计28种)。
Cell-type-based and transcript-based niches
基于细胞类型和转录本的生态位
Para_01
- 我们对基于细胞类型的分析和基于转录本的生态位进行了类似的分析,如同上述的细胞类型分析一样。
- 如果某个生态位在至少10%的分段气腔中出现次数少于三次,则将其排除。
- 在模型拟合后,我们获取了沿2000个时间点的平滑生态位丰度变化,并在热图中可视化它们的模式,按其峰值时间点进行排序。
- 每个生态位的峰值时间点通过移动平均法确定(窗口大小,n = 100)。
- 具有更早峰值时间点的特征被绘制在顶部行。
Classifying gene expression patterns along pseudotime
沿伪时间对基因表达模式进行分类
Para_01
- 我们使用 GAM 模型通过伪时间排序的气腔来表征基因表达模式,该模型将基因计数沿伪时间建模为负二项分布。
- 我们将每个管腔中检测到的转录本总数作为偏移项添加,并加入 TMA 协变量以控制 TMA 效应。
- 利用拟合模型,我们预测了沿伪时间的基因表达,并在对每个基因取 z 分数后,首先使用分层聚类(k = 20)对基因表达模式进行聚类。
- 通过视觉检查这 20 个分层聚类,将基因分为双峰和单峰模式。
- 对于单峰基因,我们进一步使用 R 包 kernlab 中的谱聚类(k = 4)对其进行聚类。
- 我们根据其基因表达峰值时间对四个基因簇进行排序,并将它们分为四类,包括稳态、早期重塑、中间重塑和晚期重塑。
- 然后,我们在热图中可视化了这四个基因簇的基因表达动态。
Altered gene expression along pseudotime within each cell type
每种细胞类型沿伪时间的基因表达变化
错误!!! - 待补充
Para_02
- 其中 t 表示伪时间,pi 表示细胞类型 i 的比例,n 表示每个腺腔的总转录本数,U 表示组织微阵列。
- 我们在结点选择上采用了与 tradeSeq 相同的策略,并为每个平滑项选择了五个结点。
- 我们将模型中包含的比例数据限定于 15 种主要细胞类型,这些细胞类型在超过 300 个气腔中每种都至少有三个细胞,以控制检测基因表达信号中的污染。
- 在测试每种细胞类型的基因与伪时间的显著关联时,我们将基因限制在所有细胞类型整体基因关联测试中的显著基因集合中。
- 对于每种细胞类型,我们随后测试了在 50% 的测试气腔中检测到拷贝数超过三个的基因。
- 经过多重检验校正后(FDR < 0.05),具有显著伪时间项的基因被汇总并绘制图表。
Statistics and reproducibility
统计学与可重复性
Para_01
- 样本量是根据样本可用性选择的,尽管关于疾病和对照样本的数据生成是随机化的。
- 本研究未设盲。
- 任何数据排除已在上方注明,包括基于当前最佳实践过滤掉过大尺寸的细胞或基因计数异常低或高的细胞。
- 如上所述,Xenium 数据的关键发现通过正交技术(Visium HD)进行了验证。
- 对于描述现象的 H&E 图像图表(例如,图 3d 中注释中的细胞类型以及图 6c–e,g–h 中巨噬细胞聚集),在样本中至少观察到三个类似的例子,所展示的图像旨在具有代表性,但并非详尽无遗。
- 对于叠加了转录本或细胞类型的代表性 H&E 图像,请参阅随附的点图热图以获取更多上下文信息。
- 完整数据可在 Gene Expression Omnibus (GEO) 上获取,包括组织病理学、基因表达数据和细胞类型注释。
Reporting summary
报告摘要
Data availability
Para_01
- 原始数据和处理后的数据已提交至 GEO,访问号为 GSE250346。
Code availability
Para_01
- 本项目所使用的自定义 R、Python 和 bash 脚本可在 GitHub 上获取,地址为 ,也可在 Zenodo 上找到。