- macs2運作參數
-
macs2 callpeak -t K1_ChIPed_S1_L007_R1.bam -c K1_Input_S5_L007_R1.bam -f BAM -g mm -n K1 -B -q 0.01
-t -c 實驗組和對照組結果
-f 輸入檔案格式
-g 參考基因組有效大小,人類選擇hs,也可以根據基因組大小直接輸入數值
-n 輸出字首
-B 輸出bdg格式檔案,可以上傳到UCSC生成峰圖
-q q值,預設0.05
-p p值,未校正值
- 導入到R中
-
d.c1 <- read.table('C1_result/C1_peaks.xls',header = TRUE)
header = TRUE表示第一行為列名稱
-
-
- 生成列并處理清單資料
- head(d.c1)
- 染色體位置 起始位點 終止位點 區域長度 峰值位點 峰值高度
- 1 chr start end length abs_summit pileup
- 2 NC_000067.6 24611563 24616156 4594 24615334 149
- 3 NC_000067.6 73948825 73948947 123 73948886 13
- 4 NC_000067.6 75360214 75360329 116 75360218 10
- 5 NC_000067.6 81725035 81725163 129 81725075 12
- 6 NC_000067.6 134956043 134956222 180 134956160 17
- P值 富集倍數 校正後的Q值 peak名稱
- 1 -log10(pvalue) fold_enrichment -log10(qvalue) name
- 2 26.0732 2.72183 19.7407 C1_peak_1
- 3 9.26951 5.71575 4.7134 C1_peak_2
- 4 8.14861 5.59441 3.64848 C1_peak_3
- 5 10.87 6.91483 6.24174 C1_peak_4
- 6 16.4718 9.15449 11.5107 C1_peak_5
-
column<-as.numeric(d.c1[,'col_name'])
d.c1[,'co_name']選擇生成圖檔的列
as.numberic()用于将字元串轉換為數值
- 注:XLS裡的坐标起始坐标需要減1才與narrowPeak的起始坐标一樣。
- head(d.c1)
- 生成富集峰的寬度分布圖
- 運作代碼
- width<-as.numeric(d.c1[,'length'])
- hist(width,breaks = 1000,xlim = range(1:1000),main = 'C1_ChIPed_vs_C1_Input',xlab = 'insert_size',col = 'aquamarine1')
- 圖示
- 運作代碼
- 生成富集倍數直方圖
- 運作代碼
- fold<-as.numeric(d.c1[,'fold_enrichment'])
- hist(fold,ylim = range(1:300),xlim = range(1:30),main = 'C1_ChIPed_vs_C1_Input',xlab = 'fold_enrichment',col = 'aquamarine1')
- 圖示
- 運作代碼
- 生成顯著性水準分布圖
- 運作代碼
- pvalue<-as.numeric(d.c1[,"X.log10.pvalue."])
- hist(pvalue,breaks = 100,xlim = range(0:100),main = 'C1_ChIPed_vs_C1_Input',xlab = '-10*log10(pvalue)',col = 'aquamarine1')
- 圖示
- 運作代碼