Minimap2是知名比對工具BWA的開發者Li Heng新開發的比對工具,它能夠快速的将DNA或者mRNA序列比對到參考基因組上,使用場景有下面幾種:
- 将PacBio或OXford Nanopore的read和已有參考基因組(如人類)進行比對
- 尋找高錯誤率read(15%)之間的overlap
- 将PacBio Iso-Seq 或Nanopore cDNA或RNA序列比對到參考基因組
- 将illumina 單端或者雙端序列比對到參考基因組
- 組裝之間的比對
- 臨近物種的全基因組比對
最近用Canu的不同參數裝了幾個版本的基因組,希望比較不同組裝之間是否連續,要是在組裝結果A裡面的是ABCD的排布,在結果B裡面卻出現了倒置變成了ACBD,那麼我就要懷疑人生了。
我仔細看了一下PAF的輸出格式,發現輸出結果非常友好,但是不可能直接用
read.table
或者
data.table::fread
讀取,是以我就自己寫了一個解析函數。同時為了提高我對R語言中grid系統的了解,我又寫了一個專門的畫圖代碼
