Was ist der Unterschied zwischen Fasta und FastQ

Was ist der Unterschied zwischen Fasta und FastQ

Der Schlüsselunterschied Zwischen Fasta und Fastq ist, dass Fasta ein textbasiertes Format ist, das nur Nukleotid- oder Proteinsequenzen speichert, während Fastq ein textbasiertes Format ist, das sowohl Sequenz- als auch assoziierte Sequenzqualitätswerte speichert.

Bioinformatik ist ein Feld, das verschiedene Software verwendet, um biologische Daten zu analysieren und zu verstehen, insbesondere wenn der Datensatz komplex und groß ist. Dieses Gebiet kombiniert Biologie, Chemie, Physik, Informatik, Informationstechnik, Mathematik und Statistiken zur Analyse und Interpretation biologischer Daten. FASTA und FASTQ sind zwei Sequenzdarstellungsformate im Bereich der Bioinformatik, um Sequenzen auszurichten und zu analysieren. Tatsächlich ist Fastq ein Sequenzdateiformat, das das Fasta -Format mit der Möglichkeit erweitert, die Sequenzqualität zu speichern.

INHALT

1. Überblick und wichtiger Unterschied
2. Was ist Fasta
3. Was ist Fastq
4. Ähnlichkeiten - Fasta und FastQ
5. Fasta gegen Fastq in tabellarischer Form
6. Zusammenfassung - Fasta gegen Fastq

Was ist Fasta?

Fasta ist eine Ausrichtungssoftware für DNA- und Proteinsequenz. Fasta -Software verwendet das Fasta -Format. Es handelt sich um ein textbasiertes Format, das entweder Nukleotidsequenzen oder Aminosäure (Protein) Sequenzen darstellt. Hier repräsentieren einzelne Buchstabencodes beide Sequenzen. Fasta ist ein wichtiges Instrument in den Bereichen Bioinformatik und Biochemie. In diesem Format können Sequenznamen und Kommentare den Sequenzen vorausgehen.

Abbildung 01: Fasta -Sequenz

Dieses Format stammt aus der Fasta -Software und wurde von David J vorgestellt. Lipmann und William R. Pearson im Jahr 1985. Das Fasta -Tool hatte im Laufe der Zeit viele Modifikationen, und die neueste Version besteht aus Programmen für Protein: Protein, DNA: DNA, Protein: Translated DNA (mit Frameshifts) und geordnete oder nicht ordnungsgemäße Peptidsuche. Fasta liest eine bestimmte Nukleotid- oder Aminosäuresequenz und sucht nach der entsprechenden Sequenzdatenbank, indem sie die lokale Sequenzausrichtung verwenden, um Übereinstimmungen ähnlicher Datenbanksequenzen zu finden.

Was ist Fastq?

Fastq ist eine Ausrichtungssoftware, die im Bereich der Bioinformatik verwendet wird und die sowohl eine biologische Sequenz (normalerweise Nucleotidsequenz) als auch ihre entsprechenden Qualitätswerte speichert. Fastq wurde ursprünglich entwickelt, um eine Fasta -formatierte Sequenz und die verwandten Qualitätsdaten von Wellcome Trust Sanger Institute zu bündeln. Mit der Entwicklung im Bereich der Bioinformatik wurde Fastq zum De-facto.

Das Fastq -Format verwendet vier verschiedene Zeilen pro Sequenz. Zeile 1 beginnt mit @ Zeichen und folgt von einer Sequenzkennung (ähnlich einer Fasta -Titellinie). Zeile 2 besteht aus rohen Sequenzbuchstaben. In Zeile 3 beginnt die Sequenz mit einem '+' Zeichen und folgt optional von derselben Sequenz -Kennung. Zeile 4 codiert die Qualitätswerte für die Sequenz in Zeile 2 und sollte aus derselben Anzahl von Symbolen wie Buchstaben in der Sequenz bestehen.

Was sind die Ähnlichkeiten zwischen Fasta und Fastq?

  • Fasta und Fastq sind Ausrichtungswerkzeuge.
  • Sie sind zwei Sequenzdarstellungsformate.
  • Beide beziehen sich auf das Gebiet der Bioinformatik.
  • Sowohl Fast als auch Fastq sind wichtige Werkzeuge für Speicher- und Sequenzierungszwecke.
  • Fastq ist eine Erweiterung des Fasta -Formats mit der Möglichkeit, die Sequenzqualität zu speichern.

Was ist der Unterschied zwischen Fasta und FastQ?

Fasta ist ein textbasiertes Format, das nur Nukleotid- oder Proteinsequenzen speichert, während Fastq ein textbasiertes Format ist, das sowohl Sequenz- als auch zugehörige Sequenzqualitätswerte speichert. Dies ist also der Hauptunterschied zwischen Fasta und Fastq. Darüber hinaus speichert Fasta Sequenzfragmente nach dem Abbau, während Fastq Sequenzfragmente vor dem Mapping speichert. Außerdem besteht ein weiterer Unterschied zwischen Fasta und Fastq darin, dass Fasta aus einer Beschreibungslinie besteht und Fastaq aus vier Zeilen besteht.

Die folgende Infografik zeigt die Unterschiede zwischen Fasta und Fastq in tabellarischer Form für den Nebenseitigen Vergleich.

Zusammenfassung -Fasta gegen Fastq

Bioinformatik verwendet verschiedene Formate von Sequenzen wie Fasta und Fastq usw. Fasta speichert Sequenzfragmente, nachdem er abgebildet wurde, während Fastq die Sequenzfragmente vor dem Mapping speichert. Fasta ist eine Ausrichtungssoftware für DNA- und Proteinsequenz. Es besteht aus Programmen für Protein: Protein, DNA: DNA, Protein: Translated DNA (mit Frameshifts) und geordnete oder ungeordnete Peptidsuchungen. Fastq ist eine Ausrichtungssoftware, die im Bereich der Bioinformatik verwendet wird und sowohl eine biologische Sequenz (normalerweise Nucleotidsequenz) als auch die entsprechenden Qualitätswerte speichert. Fasta besteht aus einer Beschreibungslinie und Fastq besteht aus vier Zeilen. Dies fasst also den Unterschied zwischen Fasta und Fastq zusammen.

Referenz:

1. Akalin, Altuna. „Computational Genomics mit r.”7.1 Fasta- und Fastq -Formate.
2. „Fasta -Formatbeschreibung.Nationales Zentrum für Biotechnologieinformationen, u.S. Nationalbibliothek für Medizin.

Bild mit freundlicher Genehmigung:

1. "Histon -Ausrichtung" von Thomas Shafee - eigene Arbeit (CC von 4.0) über Commons Wikimedia