下載下傳和整理參考基因組
1.蘋果參考基因組下載下傳位址: GitHub - moold/Genome-data-of-Hanfu-apple: FASTA files of chromosomes and genes, gff files for gene models.
git clone https://github.com/moold/Genome-data-of-Hanfu-apple.git
2.解壓fa檔案
gunzip *.gz
3.合并成一個檔案
cat *.fa > genome.fa #基因組序列檔案
4.gff檔案轉換成gtf檔案
gffread -T -o genome.gtf HFTH1.gene.gff3 #基因注釋檔案
5.處理pep.fa檔案 修改分隔符後儲存
awk -F '-' '{print $1}' HFTH1.gene.pep.fa > proteins.fasta #蛋白序列檔案
6.genome.fa每行顯示70個
conda search fastx_toolkit
conda install fastx_toolkit
fasta_formatter -i genome.fasta -o genome_format.fa -w 70