天天看點

20220919-20 參考基因組處理

下載下傳和整理參考基因組

1.蘋果參考基因組下載下傳位址:​​​ GitHub - moold/Genome-data-of-Hanfu-apple: FASTA files of chromosomes and genes, gff files for gene models.​​

git clone https://github.com/moold/Genome-data-of-Hanfu-apple.git      

2.解壓fa檔案

gunzip *.gz      

3.合并成一個檔案

cat *.fa > genome.fa #基因組序列檔案      

4.gff檔案轉換成gtf檔案

gffread -T -o genome.gtf HFTH1.gene.gff3 #基因注釋檔案      

5.處理pep.fa檔案 修改分隔符後儲存

awk -F '-' '{print $1}' HFTH1.gene.pep.fa > proteins.fasta #蛋白序列檔案      

6.genome.fa每行顯示70個

conda search fastx_toolkit 
conda install fastx_toolkit
fasta_formatter -i genome.fasta -o genome_format.fa -w 70