一个RNA

2021-02-04 06:55 admin
生信小白团 留言板留言参加探讨,或是关心同名的手机微信微信公众号biotrainee
请不必立即复制我的编码,必须自身了解,随后搞出来,思索我来甚么那样敲代码。 手机软件请用全新版,特别是在是samtools等被我储存在系统软件自然环境自变量的,考虑到到阅读者诸多,一一样的手机软件我还会内置版本号信息内容的! 我用2个钟头,不意味着你是2个钟头就学好,一些朋友体现学了2个礼拜才 学好,这很一切正常,没问题,不必天马行空2个钟头就做到我的水准。 转录组假如只看表述量确实是非常简易,简直非常简易,并且别人创作者原本就测是SE50,这类破数据信息,也便是看表述量用的! 最先创作者剖析結果是: 1

数据信息在GEO详细地址是:geo/query/acc.cgi?acc=GSE50177 2 大家必须免费下载的RNA-seq的数据信息: /sra/?term=SRP029245 Traces/study/?acc=SRP029245 ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP029/SRP029245 3 免费下载详细地址非常容易获得啦! for ((i=677;i =680;i++)) ;do wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP029/SRP029245/SRR957$i/SRR957$i.sra;done ls *sra |while read id; do ~/biosoft/sratoolkit/sratoolkit.2.6.3-centos_linux64/bin/fastq-dump --split-3 $id;done 4 由于我用fastqc看过看数据信息品质,发觉沒有甚么难题,编码以下: ls *fastq |xargs ~/biosoft/fastqc/FastQC/fastqc -t 10 因此立即用hisat2手机软件把测序获得的fastq文档核对到hg19参照遗传基因组上边 reference=/home/jianmingzeng/reference/index/hisat/hg19/genome ~/biosoft/HISAT/current/hisat2 -p 5 -x $reference -U SRR957677.fastq -S control_1.sam 2 control_1.log ~/biosoft/HISAT/current/hisat2 -p 5 -x $reference -U SRR957678.fastq -S control_2.sam 2 control_2.log ~/biosoft/HISAT/current/hisat2 -p 5 -x $reference -U SRR957679.fastq -S siSUZ12_1.sam 2 siSUZ12_1.log ~/biosoft/HISAT/current/hisat2 -p 5 -x $reference -U SRR957680.fastq -S siSUZ12_2.sam 2 siSUZ12_2.log 5 并且查询log系统日志能够发觉,核对实际效果特别好的: 93.10% overall alignment rate
92.44% overall alignment rate
92.36% overall alignment rate
93.22% overall alignment rate 随后把sam文档依据reads name来排列而且变换为bam文档节约室内空间 ls *sam |while read id;do (nohup samtools sort -n -@ 5 -o ${id%%.*}.Nsort.bam $id done 6 最终用htseq-counts专用工具来对每个样版开展遗传基因的表述量定量分析! ls *.Nsort.bam |while read id;do (nohup samtools view $id | ~/.local/bin/htseq-count -f sam -s no -i gene_name - ~/reference/gtf/gencode/gencode.v25lift37.annotation.gtf 1 ${id%%.*}.geneCounts 2 ${id%%.*}.HTseq.log done 获得的文档以下: 这4个样版的遗传基因的counts数据信息便可以用一系列产品的R包来做差别剖析了,包含limma的voom,DEseq2,edgeR这些。这种包的使用方法都烂街道了,我也不过多阐释了。 做了差别剖析,便可以跟创作者的結果做比照,看一下自身做的不是是对的。 7