使用基于python的velocyto软件做RNA速率分析

相关文章推荐

怕老婆的仙人球 · Anaconda3的安装配置及使用教程(20 ...· 2 周前 ·

怕老婆的仙人球 · Anaconda安装-超详细版(2023)_ ...· 2 周前 ·

从未表白的胡萝卜 · 2023年度江门市（蓬江区、江海区）第一次公 ...· 5 天前 ·

细心的毛巾 · 多元回归预测 | Matlab ...· 2 月前 ·

沉稳的筷子 · 【c++&GDAL】均值滤波+中值滤波_gd ...· 3 月前 ·

不拘小节的小蝌蚪 · matlab把cell数组写入txt_mat ...· 5 月前 ·

健壮的充值卡 · unity基础1 - Elijah_j - 博客园· 11 月前 ·

腾讯云

备案控制台

开发者社区

TVP

文章/答案/技术大牛

写文章

专栏首页生信技能树使用基于python的velocyto软件做RNA速率分析

5 0

分享

# 首先下载文件，20M/S的话需要几秒钟即可
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 接下来使用bash命令来运行我们下载的文件，记得是一路yes下去
bash Miniconda3-latest-Linux-x86_64.sh 
#  安装成功后需要更新系统环境变量文件
source ~/.bashrc

conda config --add channels r 
conda config --add channels conda-forge 
conda config --add channels bioconda
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

#需要一些依赖
conda create -n velocyto 
conda activate velocyto 
conda install samtools
conda install numpy scipy cython numba matplotlib scikit-learn h5py click
pip install pysam
 # `PyPI`安装
pip install velocyto
# Successfully installed loompy-3.0.6 numpy-groupies-0.9.13 pandas-1.2.5 pytz-2021.1 velocyto-0.17.17

rmsk_gtf=$HOME/pipeline/velocyto/hg38_repeat_rmsk.gtf # 从genome.ucsc.edu下载 
cellranger_outDir=HSY-fushui # 前面cellranger命令的outputs目录 
cellranger_gtf=$HOME/pipeline/refdata-gex-GRCh38-2020-A/genes/genes.gtf # 这个是cellranger官网提供的
ls -lh $rmsk_gtf  $cellranger_outDir $cellranger_gtf
nohup velocyto run10x -m $rmsk_gtf  $cellranger_outDir $cellranger_gtf & 
# 如果是其它单细胞数据，可以换参数，比如run_smartseq2

cd $cellranger_outDir/out 
nohup samtools sort -@ 10  -t CB -O BAM -o cellsorted_possorted_genome_bam.bam possorted_genome_bam.bam &
# 这个  samtools sort  的 速度很快
# 下次就可以把前面的 velocyto run10x 重新跑一次，因为  samtools sort 命令已经是成功了。
# The file /home/---/outs/cellsorted_possorted_genome_bam.bam already exists. 
# The sorting step w ill be skipped and the existing file will be used.


$ ls -lh  velocyto/ 
158M 7月   3 22:38 HSY-fushui.loom

 ls  */outs/possorted_genome_bam.bam|while read id;do  new=${id/possorted_genome_bam.bam/cellsorted_possorted_genome_bam.bam}
echo $new 
nohup samtools sort -@ 4  -t CB -O BAM -o $new   $id  &

rmsk_gtf=$HOME/pipeline/velocyto/hg38_repeat_rmsk.gtf # 从genome.ucsc.edu下载 
#cellranger_outDir=HSY-fushui # 前面cellranger命令的outputs目录 
cellranger_gtf=$HOME/pipeline/refdata-gex-GRCh38-2020-A/genes/genes.gtf # 这个是cellranger官网提供的
#ls -lh $rmsk_gtf  $cellranger_outDir $cellranger_gtf
# 同样的一个简单的 循环即可
ls -d *-*|while read cellranger_outDir;do 
nohup velocyto run10x -m $rmsk_gtf  $cellranger_outDir $cellranger_gtf &


158M 7月  19 17:39 HSY-fushui.loom
 79M 7月  19 17:39 HSY-PBMC.loom
132M 7月  19 17:39 HSY-yi.loom
163M 7月  19 17:39 HSY-yuan.loom
246M 7月  19 17:39 LS-Endo-Pro.loom
139M 7月  19 17:39 LS-PBMC-Pro.loom
211M 7月  19 17:39 RDX-PBMC.loom
205M 7月  19 17:39 RDX-yuan.loom
123M 7月  19 17:39 WY-PBMC.loom
 91M 7月  19 17:39 WY-yi.loom
136M 7月  19 17:39 WY-yuan.loom
253M 7月  19 17:39 YF-fushui.loom
188M 7月  19 17:39 YF-PBMC.loom
135M 7月  19 17:39 YF-yi.loom
148M 7月  19 17:39 YF-yuan.loom
243M 7月  19 17:39 YX-Endo-Decidu.loom
128M 7月  19 17:39 YX-PBMC-Decidu.loom
 95M 7月  19 17:39 ZZX-PBMC.loom
123M 7月  19 17:39 ZZX-yuan-2.loom

生信技能树

使用基于python的velocyto软件做RNA速率分析

使用基于python的velocyto软件做RNA速率分析

安装自己的conda，每个用户独立操作

使用conda安装velocyto的一些依赖

下载特定物种的特殊gtf文件

从cellranger得到loom文件

如果是多个10x样品都需要运行velocyto

关于RNA velocity (gene expression trajectory)

号外: 我们提供单细胞数据分析服务哦

推荐 38个miRNA数据库

初识The ONE

还是用RSeQC对比对后的转录组数据做一下质控

psRobot：植物小RNA分析系统

lncRNA实战项目-第五步-差异表达的mRNA和lncRNA

(12)一些QC软件教程-生信菜鸟团博客2周年精选文章集

RNA-seq老司机领读转录组结题报告

RNA-seq 检测变异之 GATK 最佳实践流程

RNA-seq数据分析指南

生信蓝领，一个不舍得分享的高通量数据分析框架