Sequenza Consensus
Una sequenza consensus è la sequenza nucleotidica (o amminoacidica) “ideale” che riassume, posizione per posizione, il residuo più frequente osservato in un insieme di siti funzionalmente equivalenti. Non è una singola sequenza reale: è una media statistica che descrive il bersaglio tipico riconosciuto da una proteina o da un macchinario.
Significato statistico
Allineando molti siti che svolgono la stessa funzione (es. tutti i siti legati da uno stesso fattore trascrizionale), in ogni posizione si conta la base più ricorrente. La consensus è la stringa di queste basi più frequenti. Conseguenze:
- i singoli siti reali divergono dalla consensus in una o più posizioni;
- più un sito è vicino alla consensus, in genere maggiore è l’affinità di legame;
- alcune posizioni sono quasi invarianti (critiche), altre tollerano variazione (rappresentate spesso con codici di ambiguità o con i sequence logo, dove l’altezza della lettera indica la conservazione).
Serve perché il riconoscimento DNA–proteina è degenerato: la proteina non cerca una sequenza unica ma una “famiglia” di sequenze simili.
Esempio procariotico
Il promotore batterico riconosciuto dalla σ⁷⁰ dell’RNA polimerasi ha due consensus classiche: la TATA-box a −10 (TATAAT) e l’elemento −35 (TTGACA). I promotori reali si avvicinano più o meno a questi consensi, e la “forza” del promotore dipende proprio da quanto vi assomiglia (vedi Promotore).
Esempio eucariotico
Ogni fattore trascrizionale eucariotico riconosce la propria consensus: l’omoedominio lega la propria sequenza bersaglio tramite l’elica di riconoscimento; Sp1 lega la GC box (consensus ricca in G-C); i fattori a leucine zipper (bZIP) legano consensus spesso palindrome. Lo stesso vale per la TATA box eucariotica riconosciuta dalla TBP.
🔗 Collegamenti
- Promotore — 🔗 stesso meccanismo / stessa via
- Omoedominio — 🔗 stesso meccanismo / stessa via
- Fattori Trascrizionali Modulari — 🔗 stesso meccanismo / stessa via