Definizione di FASTA

June 25

Definizione di FASTA


Secondo il National Center for Biotechnology Information, c'è stata numerose innovazioni tecnologiche nel campo della biologia molecolare. Bioinformatica sta lavorando per combinare i dati genomici con la tecnologia. In particolare i database sono in corso uso per mantenere l'informazione genomica come biologi lavorano per mettere insieme un genoma umano completo. Per confrontare le informazioni nel database, un protocollo di ricerca come FASTA è necessario per creare un formato coerente di ricerca delle informazioni.

Definizione

FASTA è un formato sequenza utilizzata per analizzare strutture proteiche contro noto un database di sequenze di DNA. Il database restituirà i risultati FASTA in base al suo punteggio di somiglianza. Ogni lista di risultati restituisce fino a 200 sequenze simili. FASTA è formato basato su testo che utilizza una lettera per rappresentare aminoacidi e coppie di basi.

Banche dati

Ci sono un paio di diversi database che il formato FASTA viene utilizzato per confrontare contro. Il primo è UniProtKB. L'hub di dati contiene dati su come funzionano le proteine. I ricercatori possono anche utilizzare un sottoinsieme del database per confrontare una sequenza proteica. La seconda banca dati è conosciuto come UniRef100 combina set di dati da UniProt e un altro database per nascondere le sequenze ridondanti.

Sintassi

Il formato FASTA inizia con una linea descrizione seguita dai dati di sequenza. La descrizione inizia con un simbolo di maggiore. Ciò indica che la linea non è parte della sequenza dati da ricercare. La sequenza proteica comincia in seconda linea con meno di 80 caratteri per riga. Se c'è un gap nella sequenza, un singolo trattino viene utilizzato per identificare il gap. Solo un trattino deve essere utilizzato, non importa la lunghezza sospettato del gap.

Scopo

Lo scopo del formato FASTA è assistere ricercatori nell'identificare sequenze proteiche e loro funzione confrontando il note sequenze di DNA. Se la sequenza esatta non può essere trovato, i risultati possono aiutare i ricercatori nel determinare la funzione della proteina.