BD Rhapsody上游定量流程
之前我们分享过10x平台的上游定量分析流程,本文将详细介绍BD Rhapsody平台进行单细胞转录组数据的上游定量分析流程。
1、环境准备:Docker的安装与配置
BD Rhapsody的分析流程依赖于Docker容器技术,确保了软件环境的一致性和可重复性。
安装docker :需要root权限(独享或者共享服务器)。
代码语言:javascript代码运行次数:0运行复制sudo apt-get update
sudo apt-get install ca-certificates curl gnupg
然后,添加Docker的官方GPG密钥并设置Docker仓库:
代码语言:javascript代码运行次数:0运行复制sudo install -m 0755 -d /etc/apt/keyrings
curl -fsSL | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
sudo chmod a+r /etc/apt/keyrings/docker.gpg
echo"deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
最后,安装Docker Engine:
代码语言:javascript代码运行次数:0运行复制sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
验证Docker:运行以下命令以确认Docker已成功安装:
代码语言:javascript代码运行次数:0运行复制sudo docker run hello-world
用户权限设置:为避免每次运行Docker命令时都使用sudo,将当前用户添加到Docker组:
代码语言:javascript代码运行次数:0运行复制sudo groupadd docker
sudo usermod -aG docker $USER
sudo systemctl restart docker
2、准备参考基因组和GTF文件
参考基因组和GTF文件是转录组分析的基础,用于reads的比对和基因表达的定量。这些文件可以从BD官方文档提供的链接或Gencode等数据库下载。
.x_WTA_references/
代码语言:javascript代码运行次数:0运行复制# 小鼠GRCm38参考基因组下载:
wget .x_WTA_references/GRCm38-PhiX-gencodevM19/GRCm38-PhiX-gencodevM19-20181206.tar.gz
# 小鼠GRCm38GTF下载
.x_WTA_references/GRCm38-PhiX-gencodevM19/gencodevM19-20181206.gtf
# 人类hg19参考基因组下载:
wget .x_WTA_references/hg19/hg19-gencode.tar.gz
# 人类hg19 GTF:
.x_WTA_references/hg19/hg19-gencode.gtf
3、 配置YML文件
YML文件是用于指定分析输入和参数的配置文件。BD Rhapsody提供了一个模板YML文件,根据自己的实验数据进行修改。
复制模板:首先,复制模板文件并重命名为my.yml:
代码语言:javascript代码运行次数:0运行复制cp template_wta_1.9.1.yml my.yml
编辑YML文件:使用文本编辑器打开my.yml,并根据以下关键部分进行修改:
Reads:指定FASTQ.GZ格式的测序数据文件路径。例如:
代码语言:javascript代码运行次数:0运行复制Reads:
- class: File
location: "/input/sample_R1.fastq.gz"
- class: File
location: "/input/sample_R2.fastq.gz"
如果是多个样本:
代码语言:javascript代码运行次数:0运行复制- class: File
location: "/input/JZsc1641_S3_L003_R1_001.fastq.gz"
- class: File
location: "/input/JZsc1641_S3_L003_R2_001.fastq.gz"
- class: File
location: "/input/JZsc1672_S3_L004_R1_001.fastq.gz"
- class: File
location: "/input/JZsc1672_S3_L004_R2_001.fastq.gz"
- class: File
location: "/input/JZsc875_S18_L002_R1_001.fastq.gz"
- class: File
location: "/input/JZsc875_S18_L002_R2_001.fastq.gz"
Reference_Genome:指定STAR索引的路径(tar.gz格式)。例如:
代码语言:javascript代码运行次数:0运行复制Reference_Genome:
class: File
location: "/reference/GRCm38-PhiX-gencodevM19-20181206.tar.gz"
Transcriptome_Annotation:指定GTF注释文件的路径。例如:
代码语言:javascript代码运行次数:0运行复制Transcriptome_Annotation:
class: File
location: "/reference/gencode.vM31.primary_assembly.annotation-filtered.gtf"
其他参数:根据需要设置细胞计数、subsample和multiplex选项。
例如:
代码语言:javascript代码运行次数:0运行复制Exact_Cell_Count: 10000
Subsample: 0.01
Sample_Tags_Version: mouse
4、 运行CWL管道
CWL(Common Workflow Language)文件定义了分析流程,cwltool用于执行该流程。
安装CWL Runner:如果尚未安装cwltool,运行:
代码语言:javascript代码运行次数:0运行复制sudo apt-get update
sudo apt-get install cwltool
运行分析:使用以下命令在后台运行分析:
代码语言:javascript代码运行次数:0运行复制nohup cwl-runner \
--outdir ./scRNA-out \
rhapsody_wta_1.9.1.cwl \
my.yml \
2>&1 > test.log &
--outdir ./scRNA-out:指定输出目录。
rhapsody_wta_1.9.1.cwl:CWL文件路径。
my.yml:配置好的YML文件。
nohup和&:确保任务在后台运行。
5、 查看分析结果
分析完成后,结果将保存在./scRNA-out目录下。CRR1211169_Expression_Data.st就是我们所需要的稀疏矩阵。具体的输出文件和格式请参考BD Rhapsody的官方文档。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-03-30,如有侵权请联系 cloudcommunity@tencent 删除官方文档后台配置权限数据