convert~extract-FASTA-from-GFF3orGTF-and-FASTA

Extract sequences within gff3 or gtf region into transcripts FASTA or genes FASTA (longest transcripts)

input_1:genomic FASTA file

input_1/Bomo_genome_assembly.minus.scaf034.scaf395.plus.NC_002355.re.fa

>Bomo_Chr1
CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC
CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC
CTAACCTAATAACCTAACCTAACCTAACCTAACCTTAACCTAACCTAACCTAACCTAACCTAACCTAACC
TAACCTAACCTAACCTAACCTAACCTACCTTAACCTAACTAACCTAACCTAACCTAACCTAACCTAACCT
AACCTAACCTAAACCAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT
AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT
AACCTTAACCTAACCTAACCTAACCTAACCTAACCAACCTAACCTAACCTAACCTAACCTAACCTAACCT
AACCTAACCTAACCTAACCTAACCTAAAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC
CTAACCTAACCTAACCTAACCTAACTAACCTAACCTACCTAACCTAACCTAAACCTAACCTAACCTAACC

input_2:gene model file (gff3 or gtf)

input_2/Bomo_gene_models.withnote.plus.NC_002355.gff3

##gff-version   3
Bomo_Chr1	.	gene	20596	24779	0.13	+	.	ID=KWMTBOMO00001;Name=KWMTBOMO00001;Note=PREDICTED:_uncharacterized_protein_LOC106648510_[Trichogramma_pretiosum]
Bomo_Chr1	.	mRNA	20596	24779	0.13	+	.	ID=KWMTBOMO00001.mrna1;Name=KWMTBOMO00001;Parent=KWMTBOMO00001
Bomo_Chr1	.	transcription_start_site	20596	20596	.	+	.	Parent=KWMTBOMO00001.mrna1;
Bomo_Chr1	.	exon	20596	21325	.	+	.	ID=KWMTBOMO00001.mrna1.exon1;Parent=KWMTBOMO00001.mrna1;
Bomo_Chr1	.	start_codon	20692	20694	.	+	0	Parent=KWMTBOMO00001.mrna1;
Bomo_Chr1	.	CDS	20692	21325	0.44	+	0	ID=KWMTBOMO00001.mrna1.CDS1;Parent=KWMTBOMO00001.mrna1
Bomo_Chr1	.	initial	20692	21325	0.44	+	0	Parent=KWMTBOMO00001.mrna1;
Bomo_Chr1	.	intron	21326	21564	0.22	+	.	Parent=KWMTBOMO00001.mrna1;
Bomo_Chr1	.	CDS	21565	24719	0.31	+	2	ID=KWMTBOMO00001.mrna1.CDS2;Parent=KWMTBOMO00001.mrna1

Option

-c "8" -m "64" -g ""

Output

Bomo_gene_models.withnote.plus.NC_002355.gff3.with-geneid.genes.fasta

>KWMTBOMO02910 transcript=KWMTBOMO02910.mrna1
TGAATGAAGAAAAATTGTCTTTGCCGGCATCTTTAAATTCTTTCAAACTTGATTTACATTTCTCGGCGCCAAACGAACACCTGCTAAGTGATGCCGATGAATTTTGGCCAGCGGACATTGTATCTCCTACATTAAAACCAAGCGCAAGTGTCTGTAAATCCATTACATCTCTCGGTAAAATAATGGAATTCGAAGAACAAAGTTTACTCACAAGCGATCCTTCAGAAGAAAATTTGGAACATAAAGTCACAGAGGGGGAACAAACTTTCAGTATTTCACCTAAATCAGAGTTACCCACGAAAACTGGTCATATATTTAACGTAAACACCTTAAGCGACAGTTTCCCAAGATTAATAAGACAATTTGTGAATTTAGAGTATGGTGTTAACGAACAACTTGATACTGAAACAAATCACGACAATAAAATGGATAAGGCTCTTGATGAAAAAGATAATAATGTGGGAATTGGTAGTGAGTTTCAAAAATCACTCGATCCAACATCTAATGTGACCGCTACATTAGAGGATATAAGAGATTTAAAAAAAACAAGTGAAATAGAAAACGACATAAATGAAGTAAAAAAAAACATTGATAACGTACCTTTTGTAGATCTAAATATCGAATCAAAAAATATTACGAATGTGGTAAATATAGCACAAAATAATGTCCATTACCACCACGGAGAACGAACAAATATAAAAAGAGAATTTGATATTAAAACGTGGTGCACGGAATTGGAGCAGGGATATAAGAATTTGGAATTATGGAATTTATGGATTTCAAATGCATGTGAAGCAGTCCTACAAATTAAAAAAATAGAAGATTCGATAAGACTCTGCCCTATAAGAAGTCAGCAATATTGGAGAAATCTCAAAGCAAATATTGACAAAGATGCAACTATGTGGCTAAAGTTTAACAAACAAATACAAAACAAAGCTTATCTAATGAGTAACAACAATAAAAAGGTAGACAGATATCACTTGTTAAACAGGTACAAATTATAAATACCGGTTAACGTGAAATTTAATTTTCCAGAGGGTATTAAAAACAAATTGCAAAT
>KWMTBOMO01130 transcript=KWMTBOMO01130.mrna1
CTTTCATTTTTTTTTATTTCTCGTTAATTTACACCATTAGAAATTAATAACATAACAAAGGATTGTTTGGTAAAAAGTCGAAATGATTGGAGATTTAGCAGATTTCGACGATGTCAGCGACGTGATTTTAATACCACCAAAAAAGGGGATAAAGAATCATGCACTTGACTCATTAAGCATGATAGTCTTAGATGATGACGTTGGACATCCAAGTACCAGACAAACCTGTGACATAAAATATGATAAAATATTTTTAGACAATAAGAATTTAGTAAAATTTATAGAAAAATGTTTTGCTCTGGAGAATTCAGATGGGATGGCGAGAATTGTTAATCGCACATTATTAGGCTTGTACCAGAACACATGTCCTGAGTACAAAAGTTCACATCGGTTTCAAAATATTTTGGACAATGCCTTTATGAAGTTAGAGTTAGATCCAAAACACAAGTTCTCGCACATAAAAGGTGTGTGTGATGCATTGAAACTTCATAAAGTTAAGAAGAAGGCCAAGCTTATAACAATGTCCACAGCTTTACAAGATAAGTTAAAAGAAGACACTGCTCTTCAGAGAAGATCACCAGTAGATGGGGTTTCAAAAAAGAAATCTAGGTTTAACTTTATAAACTTAGATGATAATGGAGCAAACATTATAGAAATCAAAGATGATGACAGCGATGTAATTGTTGTTGACAACAGTTCAAAACTTTCAAATGAAAACAAAATCACTATAAGAGAAACAATTAAGACTGAAAATAGTACAAATGAACCTATGAAGGAAATGGATGTTGAAACGAAAATAATTAAGGATGTTCAAGATATTAATGTTGATTTTTTTATTATGAAAGATTCAGAAAGCAAGAAGACTGAACTGCTAGTACCTGTAGGAAAAAAATCCTCTACAATTGATACTGAGACTCGAATCAAGGAAATTGAAATTACTATTGCTAATTATAAAGAGAAAATAGTTAAGTTGGAGCAACAGGACGTTTGTGATGATTCTCTTTATTCACCATATATTCAGAGTGAAAAGTTAAAACAAAAGATTGTGGATCTGTATAAAGAGCTGTGTAGTCTTACTGGAGATGAGCCAATTAAAAGACGCGAAGTTCGACTGCAAGTTGCAAAAGATCATCCTCCTGCACCTGTACAAAAACTTGAACAGTTCCTCAATGAGAACATAGGGTCAAATGGAGAGCCACCGTTCCCTGATTTCCATGACGTGATGATGTGTGTAGCAGAGGCCAATGCTACTGAGAGTTTGGGCTGGAATGCTGTGCAGGTCATGTCTGAAGCAAATGCATTGTTCACTCAATGTGGTCGCGCTCTGCAAAAACGTCGTCAGCAACGCGAATGGCGAGACTTGCTATGTCGAGTCAGGAGCGAAGACTTGCGAGATCCTGCTGATGATGATCCCGAGCTGCTGGCAAGACTCGAGGAGAACCGACGCACGGCCGCAAAGAAGGAACGGGATCTTATGGAGAGGTTTACAAATATTGATTGCGACGTTCCCGGCCTTAACTTACATGTAGATATTAATGATTCGCACGATCAGATAGTGGACAAAAGCGACGAACAAGACAGCGACAGTGAGAAGGAGGAGAAAATTCCGATCTTCACTAATAAGGAAGTCAAAATAGAGAAAGACATTGAAACAGATAAACTCGACAGCTCCGACATTGAAACTAAAAAACTTGACAGTTCCAACAGTGACAACAATGAGGTCACTGCCGATGTCAAAGTAAAGATTGAACCCGTAGACCTATCAGTCCTTTACGAGTGTGTCGAGAACAGCGTTACATCAGTCATATTCGACGTCGAAGATCCATTTTTGGTGATTGAAATTTCGT

Bomo_gene_models.withnote.plus.NC_002355.gff3.with-geneid.transcripts.fasta

>KWMTBOMO00001.mrna1 gene=KWMTBOMO00001 CDS=97-3885
CCTGTTTACTTATTATTATTATTTTTAAGTTGTTACATTGTGTAAGTGCTTAGTTTTTTTATTTATTTAT
TGCAATTGTAAACGTAAAGTTCTGTAATGGAGGCAAACGAACAATTAGTAAGAGAAGAAAATACACTGTT
ACTACAACAAAATGCCATCCTAAAGGCTGAATTACAAAAACTTAAAATGCAAGGCATCGATAAAACGGAC
CCACCCCCCACAGACCCATTATTTCCTCAACCTACGTCAGTATGCAGAGTAGCCATAAAACTTCCTCCCT
TCTGGCCTGATCGGCCTGCAATTTGGTTTGCTCAGGTAGAGGCACAGTTCTCGATTTCAGGCATCTCCGC
TGACCTGACTAAATTTAACTACGTGATTGCTCAGTTAGATACCCGAGTTATTGGGGAGGTAGAAGACATT
ATTCTCCAACCACCACCAGAGGACAAATATGGTCGCCTCAAATCCGAGTTGATCCGTAGGTTGTCCACGT
CTGAGGAGCAACGTGTCAGGCAACTTGTCAGTGATGTTGAGTTGGGTGACCGCCGTCCTTCGCAGTTTTT
ACGTCATCTTAGATCATTGGCAGGAAACACCCTCACTGATGAAAATTTGCTTCGCCAGCTATGGATGCGT

Bomo_gene_models.withnote.plus.NC_002355.gff3.with-genename.genes.fasta

>KWMTBOMO02910 transcript=KWMTBOMO02910.mrna1
TGAATGAAGAAAAATTGTCTTTGCCGGCATCTTTAAATTCTTTCAAACTTGATTTACATTTCTCGGCGCCAAACGAACACCTGCTAAGTGATGCCGATGAATTTTGGCCAGCGGACATTGTATCTCCTACATTAAAACCAAGCGCAAGTGTCTGTAAATCCATTACATCTCTCGGTAAAATAATGGAATTCGAAGAACAAAGTTTACTCACAAGCGATCCTTCAGAAGAAAATTTGGAACATAAAGTCACAGAGGGGGAACAAACTTTCAGTATTTCACCTAAATCAGAGTTACCCACGAAAACTGGTCATATATTTAACGTAAACACCTTAAGCGACAGTTTCCCAAGATTAATAAGACAATTTGTGAATTTAGAGTATGGTGTTAACGAACAACTTGATACTGAAACAAATCACGACAATAAAATGGATAAGGCTCTTGATGAAAAAGATAATAATGTGGGAATTGGTAGTGAGTTTCAAAAATCACTCGATCCAACATCTAATGTGACCGCTACATTAGAGGATATAAGAGATTTAAAAAAAACAAGTGAAATAGAAAACGACATAAATGAAGTAAAAAAAAACATTGATAACGTACCTTTTGTAGATCTAAATATCGAATCAAAAAATATTACGAATGTGGTAAATATAGCACAAAATAATGTCCATTACCACCACGGAGAACGAACAAATATAAAAAGAGAATTTGATATTAAAACGTGGTGCACGGAATTGGAGCAGGGATATAAGAATTTGGAATTATGGAATTTATGGATTTCAAATGCATGTGAAGCAGTCCTACAAATTAAAAAAATAGAAGATTCGATAAGACTCTGCCCTATAAGAAGTCAGCAATATTGGAGAAATCTCAAAGCAAATATTGACAAAGATGCAACTATGTGGCTAAAGTTTAACAAACAAATACAAAACAAAGCTTATCTAATGAGTAACAACAATAAAAAGGTAGACAGATATCACTTGTTAAACAGGTACAAATTATAAATACCGGTTAACGTGAAATTTAATTTTCCAGAGGGTATTAAAAACAAATTGCAAAT
>KWMTBOMO01130 transcript=KWMTBOMO01130.mrna1
CTTTCATTTTTTTTTATTTCTCGTTAATTTACACCATTAGAAATTAATAACATAACAAAGGATTGTTTGGTAAAAAGTCGAAATGATTGGAGATTTAGCAGATTTCGACGATGTCAGCGACGTGATTTTAATACCACCAAAAAAGGGGATAAAGAATCATGCACTTGACTCATTAAGCATGATAGTCTTAGATGATGACGTTGGACATCCAAGTACCAGACAAACCTGTGACATAAAATATGATAAAATATTTTTAGACAATAAGAATTTAGTAAAATTTATAGAAAAATGTTTTGCTCTGGAGAATTCAGATGGGATGGCGAGAATTGTTAATCGCACATTATTAGGCTTGTACCAGAACACATGTCCTGAGTACAAAAGTTCACATCGGTTTCAAAATATTTTGGACAATGCCTTTATGAAGTTAGAGTTAGATCCAAAACACAAGTTCTCGCACATAAAAGGTGTGTGTGATGCATTGAAACTTCATAAAGTTAAGAAGAAGGCCAAGCTTATAACAATGTCCACAGCTTTACAAGATAAGTTAAAAGAAGACACTGCTCTTCAGAGAAGATCACCAGTAGATGGGGTTTCAAAAAAGAAATCTAGGTTTAACTTTATAAACTTAGATGATAATGGAGCAAACATTATAGAAATCAAAGATGATGACAGCGATGTAATTGTTGTTGACAACAGTTCAAAACTTTCAAATGAAAACAAAATCACTATAAGAGAAACAATTAAGACTGAAAATAGTACAAATGAACCTATGAAGGAAATGGATGTTGAAACGAAAATAATTAAGGATGTTCAAGATATTAATGTTGATTTTTTTATTATGAAAGATTCAGAAAGCAAGAAGACTGAACTGCTAGTACCTGTAGGAAAAAAATCCTCTACAATTGATACTGAGACTCGAATCAAGGAAATTGAAATTACTATTGCTAATTATAAAGAGAAAATAGTTAAGTTGGAGCAACAGGACGTTTGTGATGATTCTCTTTATTCACCATATATTCAGAGTGAAAAGTTAAAACAAAAGATTGTGGATCTGTATAAAGAGCTGTGTAGTCTTACTGGAGATGAGCCAATTAAAAGACGCGAAGTTCGACTGCAAGTTGCAAAAGATCATCCTCCTGCACCTGTACAAAAACTTGAACAGTTCCTCAATGAGAACATAGGGTCAAATGGAGAGCCACCGTTCCCTGATTTCCATGACGTGATGATGTGTGTAGCAGAGGCCAATGCTACTGAGAGTTTGGGCTGGAATGCTGTGCAGGTCATGTCTGAAGCAAATGCATTGTTCACTCAATGTGGTCGCGCTCTGCAAAAACGTCGTCAGCAACGCGAATGGCGAGACTTGCTATGTCGAGTCAGGAGCGAAGACTTGCGAGATCCTGCTGATGATGATCCCGAGCTGCTGGCAAGACTCGAGGAGAACCGACGCACGGCCGCAAAGAAGGAACGGGATCTTATGGAGAGGTTTACAAATATTGATTGCGACGTTCCCGGCCTTAACTTACATGTAGATATTAATGATTCGCACGATCAGATAGTGGACAAAAGCGACGAACAAGACAGCGACAGTGAGAAGGAGGAGAAAATTCCGATCTTCACTAATAAGGAAGTCAAAATAGAGAAAGACATTGAAACAGATAAACTCGACAGCTCCGACATTGAAACTAAAAAACTTGACAGTTCCAACAGTGACAACAATGAGGTCACTGCCGATGTCAAAGTAAAGATTGAACCCGTAGACCTATCAGTCCTTTACGAGTGTGTCGAGAACAGCGTTACATCAGTCATATTCGACGTCGAAGATCCATTTTTGGTGATTGAAATTTCGT

Bomo_gene_models.withnote.plus.NC_002355.gff3.with-genename.transcripts.fasta

>KWMTBOMO00001.mrna1 gene=KWMTBOMO00001 CDS=97-3885
CCTGTTTACTTATTATTATTATTTTTAAGTTGTTACATTGTGTAAGTGCTTAGTTTTTTTATTTATTTAT
TGCAATTGTAAACGTAAAGTTCTGTAATGGAGGCAAACGAACAATTAGTAAGAGAAGAAAATACACTGTT
ACTACAACAAAATGCCATCCTAAAGGCTGAATTACAAAAACTTAAAATGCAAGGCATCGATAAAACGGAC
CCACCCCCCACAGACCCATTATTTCCTCAACCTACGTCAGTATGCAGAGTAGCCATAAAACTTCCTCCCT
TCTGGCCTGATCGGCCTGCAATTTGGTTTGCTCAGGTAGAGGCACAGTTCTCGATTTCAGGCATCTCCGC
TGACCTGACTAAATTTAACTACGTGATTGCTCAGTTAGATACCCGAGTTATTGGGGAGGTAGAAGACATT
ATTCTCCAACCACCACCAGAGGACAAATATGGTCGCCTCAAATCCGAGTTGATCCGTAGGTTGTCCACGT
CTGAGGAGCAACGTGTCAGGCAACTTGTCAGTGATGTTGAGTTGGGTGACCGCCGTCCTTCGCAGTTTTT
ACGTCATCTTAGATCATTGGCAGGAAACACCCTCACTGATGAAAATTTGCTTCGCCAGCTATGGATGCGT

view all outputs