一个MeDIP

2021-02-04 06:46 admin
生信小白团 留言板留言参加探讨,或是关心同名的手机微信微信公众号biotrainee
请不必立即复制我的编码,必须自身了解,随后搞出来,思索我来甚么那样敲代码。 手机软件请用全新版,特别是在是samtools等被我储存在系统软件自然环境自变量的,考虑到到阅读者诸多,一一样的手机软件我还会内置版本号信息内容的! 我用2个钟头,不意味着你是2个钟头就学好,一些朋友体现学了2个礼拜才 学好,这很一切正常,没问题,不必天马行空2个钟头就做到我的水准。

MeDIP-seq 跟ChIP-seq的剖析方式是如出一辙的,同样hMeDIP-seq,caMeDIP-seq这些,也没有实质上的差别,仅仅用的抗原不一样罢了,请自主检索基本专业知识,我只讲数据信息剖析。

一个ChIP-seq实战演练-非常简易-2钟头拿下!

一个RNA-seq实战演练-非常简易-2钟头拿下!

请首先看看着我前边写的系列产品,一件事来讲非常简单,由于手机软件我还安裝了,数据信息我还免费下载好啦,编码我还看得懂,对你,不一定简易,有朋友体现学了2个礼拜才弄懂,但最少,是能够弄懂的!

paper是Dnmt3L antagonizes DNA methylation at bivalent promoters and favors DNA methylation at gene bodies in ESCs.:pubmed/ 发布在二零一三年CELL杂志期刊上边,非常值得反复! MeDIP-seq 数据信息在:geo/query/acc.cgi?acc=GSE44642 1 最先免费下载raw data数据信息: wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP018/SRP018845/SRR764931/SRR764931.sra wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP018/SRP018845/SRR764932/SRR764932.sra ls *sra |while read id; do ~/biosoft/sratoolkit/sratoolkit.2.6.3-centos_linux64/bin/fastq-dump --split-3 $id;done 2 用fastqc看过看数据信息品质,发觉品质十分赞,我也不用过虑reads了。编码以下: ls *fastq |xargs ~/biosoft/fastqc/FastQC/fastqc -t 10 假如要过虑,就用下边的编码: ls *.fastq | while read id ~/biosoft/sickle/sickle-master/sickle se -t sanger -g -f $id -o ${id%%.*}.trimmed.fq.gz 最先用bowtie2手机软件把测序获得的fastq文档核对到mm10参照遗传基因组上边,就2个数据信息,我也不写循环系统了! 针对这类沒有control的数据信息,大家能够立即把peaks-calling 4部曲一起拿下的! 比照对好的bam文档, 便可以立即用MACS手机软件来找peaks啦: 最先对这种bam文档大批量变换成bw文档。随后大批量绘图 ~/biosoft/bowtie/bowtie2-2.2.9/bowtie2 -p 6 -x ~/reference/index/bowtie/mm10 -U SRR764931.fastq | samtools sort -O bam -o shDnmt3L.bam ## 核对率很高,各自是96.67%(shDnmt3L) 和96.59%(shGFP),这核对率没有讲过,十分赞! samtools index shDnmt3L.bam ~/.local/bin/macs2 callpeak -t shDnmt3L.bam -m 10 30 -p 1e-5 -f BAM -g mm -n shDnmt3L 2 shDnmt3L.masc2.log bamCoverage -b shDnmt3L.bam -o shDnmt3L.bw ## 这儿有一个主要参数,-p 10 --normalizeUsingRPKM computeMatrix reference-point --referencePoint TSS -b 10000 -a 10000 -R ~/annotation/CHIPseq/mm10/ucsc.refseq.bed -S shDnmt3L.bw --skipZeros -o matrix1_shDnmt3L_TSS.gz plotHeatmap -m matrix1_shDnmt3L_TSS.gz -out shDnmt3L.png 就2个数据信息,我也沒有写循环系统了,如今你毫无疑问可以看明白了吧! 剖析,就是这样详细介绍咯! 参照:search/label/MeDIP-seq