BD Rhapsody上游定量流程

之前我们分享过10x平台的上游定量分析流程，本文将详细介绍BD Rhapsody平台进行单细胞转录组数据的上游定量分析流程。

1、环境准备：Docker的安装与配置

BD Rhapsody的分析流程依赖于Docker容器技术，确保了软件环境的一致性和可重复性。

安装docker ：需要root权限（独享或者共享服务器）。

代码语言：javascript代码运行次数：0运行复制

sudo apt-get update
sudo apt-get install ca-certificates curl gnupg

然后，添加Docker的官方GPG密钥并设置Docker仓库：

代码语言：javascript代码运行次数：0运行复制

sudo install -m 0755 -d /etc/apt/keyrings
curl -fsSL  | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
sudo chmod a+r /etc/apt/keyrings/docker.gpg
echo"deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg]  $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

最后，安装Docker Engine：

代码语言：javascript代码运行次数：0运行复制

sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

验证Docker：运行以下命令以确认Docker已成功安装：

代码语言：javascript代码运行次数：0运行复制

sudo docker run hello-world

用户权限设置：为避免每次运行Docker命令时都使用sudo，将当前用户添加到Docker组：

代码语言：javascript代码运行次数：0运行复制

sudo groupadd docker
sudo usermod -aG docker $USER
sudo systemctl restart docker

2、准备参考基因组和GTF文件

参考基因组和GTF文件是转录组分析的基础，用于reads的比对和基因表达的定量。这些文件可以从BD官方文档提供的链接或Gencode等数据库下载。

.x_WTA_references/

代码语言：javascript代码运行次数：0运行复制

# 小鼠GRCm38参考基因组下载：
wget .x_WTA_references/GRCm38-PhiX-gencodevM19/GRCm38-PhiX-gencodevM19-20181206.tar.gz
# 小鼠GRCm38GTF下载
.x_WTA_references/GRCm38-PhiX-gencodevM19/gencodevM19-20181206.gtf

# 人类hg19参考基因组下载：
wget .x_WTA_references/hg19/hg19-gencode.tar.gz
# 人类hg19 GTF：
.x_WTA_references/hg19/hg19-gencode.gtf

3、配置YML文件

YML文件是用于指定分析输入和参数的配置文件。BD Rhapsody提供了一个模板YML文件，根据自己的实验数据进行修改。

复制模板：首先，复制模板文件并重命名为my.yml：

代码语言：javascript代码运行次数：0运行复制

cp template_wta_1.9.1.yml my.yml

编辑YML文件：使用文本编辑器打开my.yml，并根据以下关键部分进行修改：

Reads：指定FASTQ.GZ格式的测序数据文件路径。例如：

代码语言：javascript代码运行次数：0运行复制

Reads:
  - class: File
    location: "/input/sample_R1.fastq.gz"
  - class: File
    location: "/input/sample_R2.fastq.gz"

如果是多个样本：

代码语言：javascript代码运行次数：0运行复制

- class: File
   location: "/input/JZsc1641_S3_L003_R1_001.fastq.gz"
 - class: File
   location: "/input/JZsc1641_S3_L003_R2_001.fastq.gz"
 - class: File
   location: "/input/JZsc1672_S3_L004_R1_001.fastq.gz"
 - class: File
   location: "/input/JZsc1672_S3_L004_R2_001.fastq.gz"
 - class: File
   location: "/input/JZsc875_S18_L002_R1_001.fastq.gz"
 - class: File
   location: "/input/JZsc875_S18_L002_R2_001.fastq.gz"

Reference_Genome：指定STAR索引的路径（tar.gz格式）。例如：

代码语言：javascript代码运行次数：0运行复制

Reference_Genome:
  class: File
  location: "/reference/GRCm38-PhiX-gencodevM19-20181206.tar.gz"

Transcriptome_Annotation：指定GTF注释文件的路径。例如：

代码语言：javascript代码运行次数：0运行复制

Transcriptome_Annotation:
  class: File
  location: "/reference/gencode.vM31.primary_assembly.annotation-filtered.gtf"

其他参数：根据需要设置细胞计数、subsample和multiplex选项。

例如：

代码语言：javascript代码运行次数：0运行复制

Exact_Cell_Count: 10000
Subsample: 0.01
Sample_Tags_Version: mouse

4、运行CWL管道

CWL（Common Workflow Language）文件定义了分析流程，cwltool用于执行该流程。

安装CWL Runner：如果尚未安装cwltool，运行：

代码语言：javascript代码运行次数：0运行复制

sudo apt-get update
sudo apt-get install cwltool

运行分析：使用以下命令在后台运行分析：

代码语言：javascript代码运行次数：0运行复制

nohup cwl-runner \
  --outdir ./scRNA-out \
  rhapsody_wta_1.9.1.cwl \
  my.yml \
  2>&1 > test.log &

--outdir ./scRNA-out：指定输出目录。

rhapsody_wta_1.9.1.cwl：CWL文件路径。

my.yml：配置好的YML文件。

nohup和&：确保任务在后台运行。

5、查看分析结果

分析完成后，结果将保存在./scRNA-out目录下。CRR1211169_Expression_Data.st就是我们所需要的稀疏矩阵。具体的输出文件和格式请参考BD Rhapsody的官方文档。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。原始发表：2025-03-30，如有侵权请联系 cloudcommunity@tencent 删除官方文档后台配置权限数据

科技改变生活-雨落星辰 - 所有的伟大,都源于一个勇敢的开始

BD Rhapsody上游定量流程